衍生欄位准則
Customer Journey Analytics 衍生欄位可讓您在查詢時轉換、分類及擴充資料,而不需修改來源資料集。 如果沒有紀律性的規範,這種靈活性可能會帶來複雜性、效能問題和維護開銷。
本文提供使用衍生欄位的准則(最佳做法、護欄和常見陷阱)。 目標對象是資料架構師、產品管理員和分析師,他們需要:
本文圍繞以下主題組織章節:
每個區段包含:
- 要偵測的模式:衍生欄位定義中的可觀察訊號。
- 風險診斷:為什麼模式有問題。 可能的原因為效能、資料品質或 維護 的負面影響。
- 建議:重構或改善實作的具體步驟。
這些准則可協助您在Customer Journey Analytics中建立有效率、可擴充且語義正確的實作。 稽核現有的資料檢視、設計新的衍生欄位或建立治理工具時,請套用這些准則。
高基數衍生欄位
本節將討論參考高基數衍生欄位的資料檢視預設區段。
模式
風險診斷:效能
- 在接觸頁面URL或其他高基數維度的衍生欄位上篩選的預設區段,會為針對資料檢視的每個查詢新增延遲。
推薦
規則鏈結時過度複雜的大小寫
本節討論Case When規則的過於複雜鏈結。
Customer Journey Analytics會針對每個衍生欄位強制執行明確的函式與運運算元限制 (例如,運運算元數目上限、每種型別的函式數目上限)。 過於複雜的函式以及函式中的鏈結更難維護,也更容易出錯。
模式
風險診斷:效能、資料品質、高維護
- 可維護性和錯誤風險:邏輯編碼為單一規則區塊時,很難除錯和更新。
- 潛在效能和限制風險:您可能會點選或接近運運算元或函式限制,尤其是使用類似分類的模式。
推薦
使用錯誤
本節討論衍生欄位的錯誤使用。 尤其是當替代方案是更好的解決方案時。
模式
風險診斷:資料品質,高維護性
- 備援複雜性:衍生欄位用於存在更簡單內建資料檢視功能的地方。
- 治理風險:其他使用者可能不知道為什麼衍生欄位存在而非原生設定。 此模式會增加衍生欄位管理中的混亂。
- 降低重複使用性:將條件式標幟編碼為衍生欄位使得跨專案使用不同篩選器的基本量度更難重複使用。
推薦
量度和維度的分類錯誤
本節將討論量度和維度的分類錯誤。
模式
-
衍生欄位會清楚地產生:
- 數值輸出(計數、比率或算術),但元件已設定為維度。
- 類別輸出(標籤或字串),但元件已設定為量度。
-
衍生欄位會將0/1標幟編碼為字串。
Customer Journey Analytics允許在資料檢視層級將數值欄位強製為維度,並將字串欄位強製為量度,但若未妥善對齊,可能會產生令人困惑的報表。
風險診斷:資料品質
- 語意不符:元件型別不符合衍生結果的性質,導致元件型別更難以正確分析或彙總。
推薦
-
如果輸出是數字:
- 在資料檢視中將元件型別設定為量度。
- 如果元件代表子集量度(例如,結帳頁面檢視次數),請在資料檢視中使用篩選量度,而不是使用衍生字串加上位於頂端的計算量度。
-
如果輸出是標籤:
- 將元件型別設定為Dimension,並相應地設定持續性設定(配置模式和有效期)。
行銷管道和行銷活動邏輯陷阱
本節將討論行銷管道和行銷活動邏輯陷阱。
模式
-
Customer Journey Analytics行銷管道通常使用衍生欄位實作。
- 根據URL引數、反向連結、登陸頁面等實作行銷管道或行銷活動分段的衍生欄位。
- 可疑排序:在套用更具體的規則之前,會出現一個通用的catch-all規則。
- 所有可能的選項的處理不完整: 反向連結網域沒有明確的分支或未設定查詢引數。
風險診斷:資料品質
- 邏輯排序錯誤:鏈結中的後續規則可能會覆寫特定通道,並導致分類錯誤的流量。
- 直接流量錯誤標籤:不符的流量落入非預期的管道或標籤為
Other。
推薦
- 強制執行由上而下的優先順序排序。 將最強的訊號放在最前(例如:要排除付費行銷活動引數的內部網域)。
- 包含最終明確 否則將值設定為 大小寫。 將遞補設定為 沒有值 以避免覆寫先前的通道。 請勿在此全包步驟中將值設為自訂字串值,然後將 自訂字串值 設為
Direct、None或Unclassified。 - 使用範本。 儘可能利用行銷管道衍生欄位範本。 或者至少讓邏輯符合Adobe建議的行銷管道最佳實務。
用於查閱的非標準化字串索引鍵
本節討論在查閱中使用非標準化字串索引鍵的問題。
模式
- 事件或設定檔欄位上的查詢函式,可饋送查詢資料集。
- 沒有前面的小寫、Trim或Regex Replace將金鑰標準化。
- 常見候選人:URL、促銷活動ID、電子郵件、帳戶ID。
風險診斷:資料品質,高維護量
- 資料品質風險:主要大小寫或空白字元與查詢表格不同時,查詢會失敗,導致 沒有相符專案 值,且報表出現間隙。
推薦
Regex濫用或伸手過長
本節將討論衍生欄位規則運算式功能的濫用或過度延伸。
模式
-
Regex Replace或以Regex為基礎的條件使用廣泛的模式;較簡單的Case When函式具有 Contains 或 Starts with 是較好的替代方案。
accordion 範例
-
多個規則運算式條件重疊或衝突。
-
大量使用規則運算式來剖析URL,而非使用URL Parse函式。
風險診斷:效能、資料品質、高度維護
- 效能和可維護性風險:複雜的規則運算式模式較難偵錯,而且速度可能較慢。
- 正確性風險:過於寬泛的規則運算式可能會擷取意外的值。
推薦
- 偏好使用標準URL元素(網域、路徑、查詢引數)的URL剖析,而非Regex取代。
- 對於簡單模式檢查,請使用Case When搭配Contains、Starts with或 Ends with 邏輯,而不是搭配Regex Replace的規則運算式。
- 標幟使用多個巢狀群組或簡單模式替代的規則運算式。 或是您可以使用衍生欄位字串函式來取代的規則運算式。
衍生欄位中的計算量度樣式邏輯
本節將討論在衍生欄位中使用計算樣式邏輯的問題。
模式
-
在看起來像是計算量度的衍生欄位(和、減、除)內,對數值欄位執行純算術。
accordion 範例
。
-
不使用字串操控或分類;邏輯是純數值。
風險診斷:資料品質
-
治理和設計問題:算術可能更適合:
- 衍生欄位量度(如果您希望衍生欄位作為所有使用者的控管標準量度)。
- Analysis Workspace中的計算量度(如果計算量度是分析專用的)。
推薦
- 如果算術結果通常對使用者和專案都很有用,請將結果保留為衍生欄位量度。 確認元件型別為量度,並在資料檢視層級設定格式(貨幣、百分比)。
- 如果結果為細分或分析人員專屬,請將結果移至計算量度並簡化資料檢視。
超量使用下一個或上一個或循序函式
本節討論下一個或上一個或循序函式的過度使用。
模式
- 衍生欄位多次使用Next或Previous函式(接近記錄的每個欄位限制)。
- 下一個或上一個用於實作持續性類似的邏輯(例如:繼續促銷活動),而不是使用資料檢視持續性。
風險診斷:資料品質,高維護性
- 複雜性與脆弱性:沈重的循序邏輯較難解釋,並且可能在工作階段化規則或順序變更時中斷。
- 具維度持續性的備援:維度上的資料檢視持續性設定(配置模式)能更好地涵蓋某些使用案例(例如工作階段上的上次接觸管道)。
推薦
忽略工作階段和個人層級內容
本節討論定義衍生欄位時,忽略工作階段和個人層級內容。
模式
-
衍生欄位隱含假設特定容器層級 (事件、工作階段或人員),但:
- 衍生欄位不會參考工作階段或人員層級屬性。
- 資料檢視工作階段設定與預期邏輯衝突。
風險診斷:資料品質
- 概念不符:衍生欄位語意可能不符合分析人員預期的彙總層級(例如:可隨每個事件變更的角色型欄位)。
推薦
達到或接近記錄函式限制
本節探討達到或接近記錄的衍生欄位函式限制的影響。
Customer Journey Analytics 檔案每個衍生欄位的最大函式和運運算元,包括每個函式型別的限制。atterns**
風險診斷:效能、高度維護
- 可擴充性風險:如果欄位達到其功能限制,未來的新增可能會失敗或出現意外行為。
推薦
- 當使用量超過臨界值時(例如:超過任何函式或運運算元限制的70%),主動標幟。
- 將邏輯分割為連結在一起的多個衍生欄位(例如:衍生欄位A (標準化查閱索引鍵)和衍生欄位B (使用標準化查閱索引鍵查閱標籤)。
- 在需要特別大型分類的情況下,使用外部資料準備或查詢資料集。
資料檢視專用最佳化規則
本節將討論衍生欄位的資料檢視特定最佳化規則。
同時檢查每個衍生元件的資料檢視組態。
模式
- 衍生維度具有預設歸因(例如:上次接觸與工作階段到期),但衍生欄位名稱表示不同的語意(例如:
First Campaign of Visit,Original Source)。 - 衍生維度具有預設持續性設定(例如: 最近配置,含 工作階段 有效期),但衍生維度的名稱表示不同的語意(例如
First Campaign of Visit或Original Source)。
風險診斷:資料品質
- 語意不符:維度的標籤會建議與實際設定不同的配置或到期行為(例如,原始配置或人員層級到期日)。
- 這種不相符會增加分析人員誤解報表或比較依名稱出現類似但使用不同配置模型的元件的風險。
推薦