定義查閱轉換

您可用來將查閱資料併入資料集之轉換的相關資訊。

請注意,並非所有類型都可在資料集建構程式的兩個階段中使用。

分類

Categorize轉換使用由pattern-string/value對組成的雙列查閱表。 在此轉換期間,資料工作台伺服器依次讀取每個事件資料記錄,並將記錄中指定欄位的內容與查找表第一列中列出的每個模式字串進行比較。 如果指定欄位與其中一個模式字串匹配,則資料工作台伺服器將與該模式字串相關聯的值(在第二列中找到)寫入記錄中的指定輸出欄位。

查閱表格第一欄中的字串(可選)可以以$字元中的^字元和/或結尾開頭,以強制在開頭和/或結尾進行比對。 此轉換不接受在第一欄中定義匹配條件的規則運算式。 如果輸入值是字串的向量,則每個字串都通過轉換運行,並將結果附加到輸出字串向量。

通常,Categorize轉換比使用Regular Expression轉換來完成相同的工作更簡單、更快速。

注意

Categorize中使用的子字串測試區分大小寫,除非使用Case Sensitive參數另行指定。

參數 說明 預設
名稱 轉換的描述性名稱。 您可以在此輸入任何名稱。
區分大小寫 True 或 False. 指定子字串測試是否區分大小寫。 true
註解 選填。關於轉變的附註。
條件 應用此轉換的條件。
預設 如果條件測試通過且分類檔案中沒有條目與輸入匹配,或給定日誌條目中未定義輸入欄位,則使用的預設值。
分隔字元

用來分隔查閱檔案中欄的字串。 長度必須為單一字元。

如果您按住Ctrl鍵並在分隔字元參數內按一下滑鼠右鍵,則會出現插入功能表。 此功能表包含常用作分隔字元的特殊字元清單。

多重值 True 或 False. 如果為true,則當檔案中的多列符合輸入時,每一列符合會導致值附加至字串的輸出向量。 如果為false,則輸出中只使用檔案中第一個匹配行。 在後一種情況下,如果輸入是向量,則輸出也是等效長度的向量。 如果輸入是簡單字串,則輸出也是簡單字串。 false
檔案 分類檔案的路徑和檔案名。 相對路徑與資料工作台伺服器的安裝目錄有關。 此檔案通常位於資料工作台伺服器安裝目錄內的「查閱」目錄中。
輸入 分類檔案將其子字串與此欄位中的值匹配,以標識檔案中的匹配行。
輸出 與結果關聯的欄位的名稱。

分類注意事項

  • 在Transformation.cfg檔案或Transformation Dataset Include檔案中定義的Categorize轉換中,若要變更查閱檔案,必須重新轉換資料集。 在Log Processing.cfg檔案或Log Processing Dataset Include檔案中定義的Categorize轉換的查閱檔案不受此限制。 如需重新處理資料的詳細資訊,請參閱重新處理和重新轉換

  • Categorize 在檔案或檔案中定 Log Processing.cfg 義的轉換, Log Processing Dataset Include 每當查找檔案更改時,都會重新載入其查找檔案。更改不會追溯應用,但會應用於更改發生後讀取的所有日誌資料。

此範例說明如何使用Categorize轉換,將查閱資料與從網站流量收集的事件資料整合。 假設特定網站有業務區域,而且需要能夠根據不同區域產生的流量和值來檢視和比較。 您可以建立查閱檔案,其中列出用以識別這些不同區段的子字串。

查閱檔案Lookups\custommap.txt包含下表:

/products/ 產品
^/sports/ 運動
^/新聞/ 新聞

此分類檔案將包含字串"/products/"的任何內容映射到"Products"值,任何以"/sports/"開頭的內容映射到"Sports"值,任何以"/news/"開頭的內容都映射到"News"值。 以下分類轉換使用cs-uri-stem欄位中的值作為我們尋找相符子字串的字串。 轉換的結果將放入x-custommap欄位。

假設Multiple Values參數設為false,則此範例會針對cs-uri-stem列出的值,產生x-custommap的下列值。

cs-uri-stem x-custommap
/sports/news/today.php 運動
/sports/products/buy.php 產品
/news/headlines.php 新聞
/news/products/subscribe.php 產品

輸出是根據查閱檔案中子字串的順序。 例如,cs-uri-stem /sports/products/buy.php傳回"Products"。 雖然URI乾開頭為"/sports/",但字串"/products/"會列在查閱檔案中"/sports/"之前。 如果Multiple Values參數設為true,則x-custommap會有額外的值,因為最後一個範例會比對查閱表格中的兩列:產品與新聞。

FlatFileLookup

FlatFileLookup轉換使用由任意數目的列和行組成的查找表(不過,請記得它駐留在記憶體中)。 在這種轉換期間,資料工作台伺服器依次讀取每個事件資料記錄,並將記錄中指定欄位的內容與查找表的指定列中的每個值進行比較。 如果存在匹配,則資料工作台伺服器將查找表中匹配行中的一個或多個值寫入事件資料記錄中的一個或多個指定輸出欄位。

此轉換期間使用的查閱表格會從您定義轉換時指定位置的平面檔案中填入。

參數 說明 預設
名稱 轉換的描述性名稱。 您可以在此輸入任何名稱。
註解 選填。關於轉變的附註。
條件 應用此轉換的條件。
預設 如果條件符合且查閱檔案中沒有項目符合輸入,則使用的預設值。
分隔字元

用來分隔查閱檔案中欄的字串。 長度必須為單一字元。

如果您按住Ctrl鍵並在分隔字元參數內按一下滑鼠右鍵,則會出現插入功能表。 此功能表包含常用作分隔字元的特殊字元清單。

檔案 查閱檔案的路徑和檔案名稱。 相對路徑與資料工作台伺服器的安裝目錄有關。 此檔案通常位於資料工作台伺服器安裝目錄內的「查閱」目錄中。
標題列 True 或 False. 指出表格中的第一列是要在處理中忽略的標題列。
輸入 列名 是用於將輸入與檔案中的行匹配的列的名稱。如果標題行為true,則可以是查閱檔案中欄的名稱。 否則,此欄數必須是零,才能符合。 「欄 位名稱」是用於尋找查閱檔案中列的欄位名稱。
多重值

True 或 False. 決定是否應傳回單一值(相符列)或多個值(每個相符列各一個)。

注意: 如果多個值設為false,您必須確定沒有多個相符項目。 當發生多個相符項目時,無法保證會傳回哪個相符項目。

輸出

列對象(結果)的向量,其中每個對象由列名和欄位名定義。

列名 是從中獲取輸出值的列。如果標題列為true,則可以是查閱檔案中的欄名稱。 否則,此欄數必須是零,才能符合。

欄位 名稱是用於捕獲輸出的欄位的名稱。請注意,這可以是結果的向量,在「多值」參數為true的情況下,每個列各標識一個向量。

注意事項FlatFileLookup

  • 將輸入欄位與查閱檔案比對時,一律須區分大小寫。

  • 在Transformation.cfg檔案或Transformation Dataset Include檔案中定義的FlatFileLookup轉換中,若要變更查閱檔案,必須重新轉換資料集。 在Log Processing.cfg檔案或Log Processing Dataset Include檔案中定義的FlatFileLookup轉換查閱檔案不受此限制。 如需重新處理資料的詳細資訊,請參閱重新處理和重新轉換

  • FlatFileLookup 檔案或文 Log Processing.cfg 件中的轉 Log Processing Dataset Include 換會在查找檔案更改時重新載入其查找檔案。更改不會追溯應用,但會應用於更改發生後讀取的所有日誌資料。

此範例說明如何使用FlatFileLookup轉換,將查閱資料與從網站流量收集的事件資料整合。 假設您想要隔離將流量傳送至網站的網站合作夥伴,並將其合作夥伴ID轉換為更易用的名稱。 然後,您可以使用好用的名稱來建立延伸維度和視覺化,更清楚地對應至業務關係,而不是用於路由流量的網站對網站關係。

範例轉換會搜尋cs(referrer-query)欄位中的PartnerID名稱——值配對,如果找到,則會使用查閱檔案Lookups\partners.txt來比較PartnerID值與表格Partner欄中的值。 如果找到行,則輸出欄位x-partner-name的名稱來自標識行的PrintName列。

如果查閱表格包含下列資訊:

ID 合作夥伴 已開始 PrintName
1 P154 1999年8月21日 Yahoo
2 P232 2000年7月10日 Microsoft
3 P945 2001年1月12日 Amazon

以下範例會轉換如下:

  • 如果cs(referrer)(PartnerID)傳回P232,則欄位x-partner-name會被指定為"Microsoft"。
  • 如果cs(referrer)(PartnerID)傳回P100,則欄位x-partner-name會被指定為「無合作夥伴」。
  • 如果cs(referrer)(PartnerID)未傳回任何內容,則欄位x-partner-name會依預設參數指定為「無合作夥伴」值。

ODBCLookup

ODBCLookup轉換的運作方式與FlatFileLookup轉換類似。 唯一的區別是,在此轉換期間使用的查找表是從ODBC資料庫而不是平面檔案中填充的。

注意

ODBCLookup 轉換只能在資料集構建過程的轉換階段執行。如果可能,Adobe建議您使用FlatFileLookup轉換,而不要使用ODBCLookup轉換。 FlatFileLookup 轉換在本質上更可靠,因為它們不依賴於外部系統的可用性。此外,如果查閱表格位於您控制本機的平面檔案中,則修改該表格的風險較低。

參數 說明 預設
名稱 轉換的描述性名稱。 您可以在此輸入任何名稱。
註解 選填。關於轉變的附註。
條件 應用此轉換的條件。
資料來源名稱 DSN由資料工作台伺服器機器的管理員提供,其中資料集被處理在該伺服器機器上,該DSN是指要從其載入資料的資料庫。
資料庫口令 連接資料庫時要使用的口令。 如果資料源管理員中已為DSN配置了密碼,則此密碼可能保留為空。 此處提供的任何口令將覆蓋資料源管理員中為DSN配置的口令。
資料庫用戶ID 連接資料庫時要使用的用戶ID。 如果資料源管理員中已為DSN配置了用戶ID,則此ID可能保留為空。 此處提供的任何用戶ID將覆蓋資料源管理員中為DSN配置的用戶ID。
預設 如果條件符合且查閱檔案中沒有項目符合輸入,則使用的預設值。
輸入欄 列名 是與輸入匹配的資料的列名或SQL表達式。 欄位 名稱是包含要查找的資料的欄位的名稱。
多重值

True 或 False. 決定是否應傳回單一值(相符列)或多個值(每個相符列各一個)。

注意: 如果多個值設為false,您必須確定沒有多個相符項目。 當發生多個相符項目時,無法保證會傳回哪個相符項目。

輸出欄

列對象(結果)的向量,其中每個對象由列名和欄位名定義。

列名 是從中獲取輸出值的列的名稱或SQL表達式。 欄位 名稱是用於捕獲輸出的欄位的名稱。

表格識別碼 一個SQL表達式,它命名要從中載入資料的表或視圖。 典型表標識符的格式為SCHEMA.TABLE。
  • 資料源名稱、Database User ID、Database Password和表標識符參數與ODBC資料源所描述的相同名稱的參數相同。 請參見ODBC資料源

  • 與ODBC資料源不同,ODBCLookup轉換不需要增加的ID列。 請參見ODBC資料源。 這是因為當資料集作用中時,查閱表格的內容不得以任何方式變更。 在重新轉換發生之前,無法偵測到查閱表格或檢視中的變更。 如需重新處理資料的詳細資訊,請參閱重新處理和重新轉換

假設您想將過時的DNS記錄轉換為更新的記錄。 這兩組記錄都儲存在SQL資料庫中。 要執行此任務,您將引用從資料庫生成的查找表並替換過期的DNS記錄。

我們的示例轉換搜索s-dns欄位的日誌條目,如果找到,則使用查找表VISUAL.LOOKUP將s-dns條目與表OLDDNS列中的條目進行比較。 如果行位於表中,則輸出欄位s-dns會從所標識行的NEWDNS列獲得更新的DNS記錄條目。

本頁內容

Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now