Adobe Analytics 數據摘要提供對原始數據的靈活存取,能夠進行複雜的操作並與其他來源整合。它們透過填補分析空白來補充 Adobe Analysis Workspace 等工具。數據摘要會將每個伺服器呼叫儲存為一列,分批傳送,並包含關鍵量度。彙總表格和全域篩選器有助於簡化分析並確保一致性。本指南將介紹其潛力,並為進一步探索奠定基礎。
簡介
數據摘要是一種運用您透過 Adobe 收集之原始詳細數據的強大方式。將此擷取至數據庫會建立無數有趣的使用案例,包括:
-
以無與倫比的靈活性,依所需的方式精確操控數據(例如,變更 eVar 的持續性、複雜的序列邏輯)
-
將 Adobe Analytics 數據與其他數據來源結合,以啟用 360 報告或作為模型和決策驅動程式的輸入
雖然數據摘要不應作為分析 Adobe Analytics 數據的唯一方法,但它可以用來填補 Adobe Analysis Workspace、Data Warehouse 或 Report Builder 可能留下的空白。將數據摘要視為 Adobe Analytics 工具包中的眾多工具之一!
比較數據摘要與其他 Adobe Analytics 工具:
使用案例
Workspace
Data Warehouse
數據摘要
備註:本教戰手冊不會逐步說明如何將數據摘要擷取至數據庫中。它會假設數據摘要已經可以輕鬆存取以供查詢。
-
如需設定與擷取數據摘要的指引,請參閱:https://experienceleague.adobe.com/docs/analytics/export/analytics-data-feed/data-feed-overview.html?lang=zh-hant
-
如需數據摘要中包含哪些檔案的概觀:https://experienceleague.adobe.com/zh-hant/docs/analytics/export/analytics-data-feed/data-feed-contents/datafeeds-contents
瞭解數據摘要
什麼是數據摘要?
每個 Adobe Analytics 伺服器呼叫都會作為單獨一列儲存在數據提要中。需要每個報告套裝設定單獨的數據摘要。數據會在每小時結束後以小時的批量傳送,或在每天結束時以當天的批量傳送。
在各個實施中,原始數據摘要的格式將保持不變。所有可用欄位的完整清單在此:https://experienceleague.adobe.com/zh-hant/docs/analytics/export/analytics-data-feed/data-feed-contents/datafeeds-reference. 教戰手冊的這一部分將重點介紹幾個重要的欄位。
發生次數(點擊)、造訪及訪客識別碼
若要複製 OOTB 發生次數、造訪次數和不重複訪客數,您需要結合以下四個欄位:post_visid_high、post_visid_low、visit_num 和 visit_page_num
-
不重複訪客數:將 post_visid_high 與 post_visid_low 串接用於獲取訪客 ID。此訪客 ID 的不同計数將複製不重複訪客数。
-
造訪次數:將 post_visid_high、post_visid_low 與 visit_num 串接用於獲取訪客 ID。此造訪 ID 的不同計数將複製不重複造訪次数。由於可能出現雜湊衝突,可能還需要與 visit_start_time_gmt 串接
-
發生次數:將 post_visid_high、post_visid_low、visit_num 與 visit_page_num 串接用於獲取點擊 ID。此點擊 ID 的不同計数將複製發生次數。
以下是用來獲取訪客數、造訪次數和發生次數的初始 SQL 程式碼:
SELECT
COUNT(DISTINCT CONCAT(POST_VISID_HIGH, POST_VISID_LOW)) AS VISITORS,
COUNT(DISTINCT CONCAT(POST_VISID_HIGH, POST_VISID_LOW, VISIT_NUM)) AS VISITS,
COUNT(DISTINCT CONCAT(POST_VISID_HIGH, POST_VISID_LOW, VISIT_NUM, VISIT_PAGE_NUM)) AS OCCURRENCES
FROM DATA_FEEDS
WHERE HIT_SOURCE = '1' AND EXCLUDE_HIT = '0'
秘訣: 在 Adobe Workspace 中,「造訪深度」維度等同于 visit_num 数据摘要欄位。Workspace 中的「點擊深度」維度等同于 visit_page_num 数据摘要欄位。
visit_page_num 欄位的備註:
-
不要讓 visit_page_num 欄位名稱中的「page」誤導您!該值不僅會在頁面檢視時遞增,而且會在每次分析伺服器呼叫時遞增。
-
造訪並非一律從 visit_page_num = 1 開始,但大多數情況下應該如此。為獲得精確報告,如果您需要提取造訪的第一次點擊,請計算造訪 ID 的最小 visit_page_num
秘訣: 如果想檢視使用者執行的動作,您可以選取一個訪客 Id,、依 visit_num 排序,然後依 visit_page_num 排序,以取得其動作逐次點擊的重新計數。這在偵錯客戶歷程時很有用:當您導覽數位資產時,可對自己的動作進行測試!
eVar 和 prop
每個 eVar 和 prop 在數據摘要中都有一個專屬欄位,無論其是否已啟用或填入數據。預處理值和後處理值也有獨立的欄位。後處理欄位將套用 eVar 歸因和到期邏輯。
請參閱此流程圖以瞭解處理發生的時間:https://experienceleague.adobe.com/docs/analytics/technotes/processing-order.html?lang=zh-hant
總共將有 500 個 eVar 欄位(即可為實施建立兩組,每組 250 個可能的 eVar),以及 150 個 prop 欄位(即可以設定兩組,每組 75 個可能的 prop)。
秘訣: 您是否曾經希望擷取的 eVar 具有 prop 屬性?非後處理 eVar 欄位的行為與 prop 類似。若未套用 eVar 歸因或持續性邏輯,請使用非後處理 eVar 欄位來篩選必須存在 eVar 的分析點擊,其行為與 prop 完全相同!
區段與計算量度
區段、自訂計算量度和 Adobe 的現成量度需要自訂定義。有關 OOTB 量度和區段,請參閱 Adobe 的技術文件。
複製部分常見量度的邏輯請見此處:https://experienceleague.adobe.com/zh-hant/docs/analytics/export/analytics-data-feed/data-feed-contents/datafeeds-calculate
在下一節中將提供範常式式碼,以複製 Adobe 的 OOTB 跳出量度為例。即將發佈的 Experience League 貼文將提供更多範例,說明如何使用數據摘要重新建立區段和量度。
查詢數據摘要
基礎知識
我們的第一個查詢將計數特定日期的造訪次數,同時排除任何不必要的點擊。
SELECT
COUNT(DISTINCT CONCAT (POST_VISID_HIGH, POST_VISID_LOW, VISIT_NUM)) AS VISITS
FROM DATA_FEEDS
WHERE HIT_SOURCE = '1' AND EXCLUDE_HIT = '0'
接下來,我們將計數其登入頁面的造訪次數。
WITH MIN_VISIT_PAGE_NUM_TABLE AS (
SELECT
POST_VISID_HIGH,
POST_VISID_LOW,
VISIT_NUM,
MIN(VISIT_PAGE_NUM) AS MIN_VISIT_PAGE_NUM
FROM DATA_FEEDS
WHERE HIT_SOURCE = '1' AND EXCLUDE_HIT = '0'
GROUP BY 1,2,3)
SELECT
PAGE_NAME,
COUNT(DISTINCT A.VISIT_ID) AS ENTRIES
FROM DATA_FEEDS A
LEFT JOIN MIN_VISIT_PAGE_NUM_TABLE B
ON A.POST_VISID_HIGH = B.POST_VISID_HIGH
AND A.POST_VISID_LOW = B.POST_VISID_LOW
AND A.VISIT_NUM = B.VISIT_NUM
AND A.VISIT_PAGE_NUM = B.MIN_VISIT_PAGE_NUM
WHERE HIT_SOURCE = '1' AND EXCLUDE_HIT = '0'
GROUP BY 1
秘訣: 若要複製上述退出,請找到最大 visit_page_num 而非最小值。
最後,我們將複製 OOTB 跳出量度。
WITH MAX_VISIT_PAGE_NUM_TABLE AS (
SELECT
POST_VISID_HIGH,
POST_VISID_LOW,
VISIT_NUM,
MAX(VISIT_PAGE_NUM) AS MAX_VISIT_PAGE_NUM
FROM DATA_FEEDS
WHERE HIT_SOURCE = '1' AND EXCLUDE_HIT = '0'
GROUP BY 1,2,3),
MIN_VISIT_PAGE_NUM_TABLE AS (
SELECT
POST_VISID_HIGH,
POST_VISID_LOW,
VISIT_NUM,
MIN(VISIT_PAGE_NUM) AS MIN_VISIT_PAGE_NUM
FROM DATA_FEEDS
WHERE HIT_SOURCE = '1' AND EXCLUDE_HIT = '0'
GROUP BY 1,2,3)
SELECT
COUNT(DISTINCT A.VISIT_ID) AS BOUNCES
FROM MAX_VISIT_PAGE_NUM A
LEFT JOIN MIN_VISIT_PAGE_NUM_TABLE B
ON A.POST_VISID_HIGH = B.POST_VISID_HIGH
AND A.POST_VISID_LOW = B.POST_VISID_LOW
AND A.VISIT_NUM = B.VISIT_NUM
WHERE A.MAX_VISIT_PAGE_NUM = B.MIN_VISIT_PAGE_NUM
數據摘要策略
建立彙總表格
建立原始數據摘要的彙總檢視可以從中獲益。效益包括:
-
對最終使用者來說更輕鬆:想運用此數據的一般數據科學家無需擔心使用哪些商品 eVar 或如何解析活動清單。
-
減少查詢負載:數據摘要可能是 TB 級的大型數據集。您的數據工程團隊將感謝您減少對原始數據集的查詢,並將最終使用者導向更小、更易於管理的表格
所需的彙總表格類型將取決於每個組織和您的利害關係人,以下是一些入門範例:
-
使用者詳細資訊表:包含所有點擊和頁面數據(例如頁面名稱、上次接觸通道、行動裝置)
-
關鍵事件表:包含已解析的 product_list 和點擊時發生的所有事件
-
搜尋字詞表:包含搜尋過的所有搜尋字詞和搜尋相關量度
請記住,最終使用者將需要如何聯結這些表格才能取得所需結果。例如,最簡單的方法可能是讓每個彙總表格都包含 post_visid_high、post_visid_low、visit_num 和 visit_page_num,這樣您就可以跨任何詳細程度層級聯結。
全域篩選器
有些組織會將全域篩選器套用至所有報告(例如排除機器人、剔除詐騙流量等)。請考慮建立彙總表格來複製此篩選器,並將其加入任何針對原始數據摘要的查詢。
集中式表格無需維護隨時間變化的這一篩選邏輯。
使用 Workspace 監控差異
在數據摘要歷程開始時,快速計算每天的造訪次數,並確保每天都與 Workspace 一致。儘管您的數據摘要已啟用,但內部數據工程端處理檔案時可能會出現空白,或 Adobe 可能已跳過傳送檔案。
無論如何,設定定期驗證,確保 Workspace 持續與您的數據摘要及任何彙總表格一致會很方便。
結論
處理 Adobe 數據摘要可能是一個艱鉅的專案。但是,一旦掌握了這些摘要,就有無限的可能性,可自訂您的數據並提供特定使用案例。
本文奠定了瞭解這些摘要的基礎,但僅觸及表面。請繼續關注更多 Experience League 文章,協助您深入瞭解這些豐富的數據!
其他資源
-
數據摘要中包含哪些檔案的概觀:https://experienceleague.adobe.com/zh-hant/docs/analytics/export/analytics-data-feed/data-feed-contents/datafeeds-contents
-
Adobe 數據處理流程圖:https://experienceleague.adobe.com/docs/analytics/technotes/processing-order.html?lang=zh-hant
-
如何使用數據摘要複製常見的計算量度:https://experienceleague.adobe.com/zh-hant/docs/analytics/export/analytics-data-feed/data-feed-contents/datafeeds-calculate