衍生資料集

衍生資料集功能提供了一種便利的方法,讓您根據資料湖中提供的其他資訊來產生您選擇的資料集。 這些資料集可以隨時重新整理,並可選擇發佈到您的即時客戶設定檔資料中。 衍生資料集可解決建立複雜資料集(例如十等分、百分位數和四分位數)的需求,而不需要較簡單的資料集(例如最大值、計數和平均值)。 這些資料集可以專門為個別使用者或企業實體計算。 這可讓您衍生出可直接認證至識別碼的資料集,例如電子郵件地址、裝置ID和電話號碼,也可衍生出與該使用者或企業設定檔間接關聯的資料集。

在Data Lake上分析資料時,多種使用案例需要衍生的資料集。 然後可以將此資料標籤為用於即時客戶個人檔案,並用於下游使用案例,例如建立高度聚焦的對象。 此功能的一些潛在使用案例可能包括:

  • 依頻道根據檢視率識別最低10%的訂閱者。 這可讓行銷人員鎖定特定對象,並銷售新的訂閱者套件。
  • 根據旅客的旅行總英里數識別位列前10%且狀態為「傳單」的受眾。 此對象可用於選擇性鎖定新信用卡優惠方案的銷售。
  • 根據訂閱判斷流失率。
  • 識別某省或州內收入最高的1%家庭,並提供過去「n」個月內離開該集體群組的個人數量測量值。

複雜衍生資料集

若要根據特定維度(類別)的一或多個量度(例如收入、觀看率持續時間等)建立排名,則需要複雜的衍生資料集。 當使用衍生資料集來排名資料時,十分位數、四分位數和百分位數可讓資料具有彈性和精確度。

十分位數是將一組排名資料分割為10個相等部分的方法。 當資料被分成十等分時,會為資料集中的每一列指派十等分排名。 這可讓資料依遞減或遞增順序排序。

十分位數排名會依序排列資料,並以1至10的級數完成,其中每個連續數字會對應增加10個百分點。

十等分值區代表排名群組的數量,可用來將排名指派給資料集中的維度(類別)。 貯體可以是數值或運算式,每個分割的運算結果都是正整數值。 值區不可有Null值。

四分位數可用來將分佈除以四,百分位數除以100。

分析衍生資料集

查詢服務提供內建功能,例如工作階段化和上次接觸等,可套用至任何時間序列資料,以產生與業務相關的衍生資料集。 您可以選擇將這些分析衍生資料集以一個或多個身分為依據,並視需要將資料發佈到即時客戶個人檔案。

這類衍生屬性的部分潛在使用案例可能包括:

  • 追蹤在使用者工作階段期間掃描的缺貨產品。
  • 追蹤熱門量度,例如,所瀏覽或購買產品的尺寸、顏色或產品類別。
  • 追蹤導致產品瀏覽或購買的平台來源。
  • 依身分追蹤最近瀏覽的專案。
  • 追蹤量度,例如購物車中的平均專案數、購物車放棄率或平均購買頻率。

其他衍生資料集

您也可以將商業量度計算為衍生屬性,並搭配簡單資料集(例如郵遞區號)或彙總量度(例如總計數)使用。 例如,根據城市或省的總數,或根據商業類別和城市/省的總數。

後續步驟和使用案例

閱讀本檔案後,您便可更瞭解查詢服務衍生的資料集如何協助複雜的使用案例,進而讓資料發揮最大效用。 接下來,您應該閱讀 十等分衍生屬性使用案例 以瞭解此功能在真實情境中的套用方式。

recommendation-more-help
ccf2b369-4031-483f-af63-a93b5ae5e3fb