[Ultimate]{class="badge positive"}

Snowflake串流來源

IMPORTANT
已購買Real-time Customer Data Platform Ultimate的使用者可在API中使用Snowflake串流來源。

Adobe Experience Platform可讓您從外部來源擷取資料,同時使用Platform服務來建構、加標籤及增強傳入資料。 您可以從多種來源(例如Adobe應用程式、雲端儲存、資料庫和許多其他來源)內嵌資料。

Experience Platform支援從Snowflake資料庫串流資料。

瞭解Snowflake串流來源

Snowflake串流來源的運作方式是定期執行SQL查詢來載入資料,並為結果集中的每一列建立輸出記錄。

藉由使用Kafka Connect,Snowflake串流來源會追蹤它從每個資料表收到的最新記錄,以便它可以在下一個反複專案的正確位置開始。 來源使用此功能來篩選資料,並只從每個疊代的表格中取得更新的列。

先決條件

以下章節概述從Snowflake資料庫將資料串流到Experience Platform之前要完成的先決條件步驟:

更新您的IP位址允許清單

使用來源聯結器之前,必須將IP位址清單新增至允許清單。 未能將您區域特定的IP位址新增到允許清單可能會導致使用來源時的錯誤或效能不佳。 如需詳細資訊,請參閱IP位址允許清單頁面。

以下檔案提供如何使用API或使用者介面將Amazon Redshift連線到Platform的資訊:

收集必要的認證

若要讓Flow Service與Snowflake連線,您必須提供下列連線屬性:

認證
說明
account

Snowflake帳戶的完整帳戶識別碼(帳戶名稱或帳戶定位器)已附加尾碼snowflakecomputing.com。 帳戶識別碼可以是不同的格式:

  • {ORG_NAME}-{ACCOUNT_NAME}.snowflakecomputing.com (例如acme-abc12345.snowflakecomputing.com
  • {ACCOUNT_LOCATOR}。{CLOUD_REGION_ID}.snowflakecomputing.com (例如acme12345.ap-southeast-1.snowflakecomputing.com
  • {ACCOUNT_LOCATOR}。{CLOUD_REGION_ID}。{CLOUD}.snowflakecomputing.com (例如acme12345.east-us-2.azure.snowflakecomputing.com

如需詳細資訊,請閱讀Snowflake document on account identifiers

warehouse
Snowflake倉儲管理應用程式的查詢執行程式。 每個Snowflake倉儲彼此獨立,在將資料傳送至Platform時必須個別存取。
database
Snowflake資料庫包含您要帶入Platform的資料。
username
Snowflake帳戶的使用者名稱。
password
Snowflake使用者帳戶的密碼。
role
(選用)可以為使用者針對指定連線提供的自訂定義角色。 如果未提供,此值會預設為public
connectionSpec.id
連線規格會傳回來源的聯結器屬性,包括與建立基礎連線和來源連線相關的驗證規格。 Snowflake的連線規格識別碼為51ae16c2-bdad-42fd-9fce-8d5dfddaf140

設定角色設定 configure-role-settings

您必須設定角色的許可權(即使已指派預設公用角色),以允許來源連線存取相關Snowflake資料庫、結構描述和表格。 不同Snowflake個實體的各種許可權如下:

Snowflake實體
需要角色許可權
倉儲
操作,使用
資料庫
使用狀況
綱要
使用狀況
表格
選取
NOTE
您必須在倉儲的進階設定組態中啟用自動恢復和自動暫停。

如需角色與許可權管理的詳細資訊,請參閱Snowflake API參考

限制和常見問答 limitations-and-frequently-asked-questions

  • Snowflake來源的資料輸送量為每秒2000筆記錄。

  • 訂價會因倉儲的有效時間長短及倉儲大小而有所不同。 對於Snowflake來源整合,最小大小x小型倉儲就足夠了。 建議啟用自動暫停,以便倉儲在不使用時能夠自行暫停。

  • Snowflake來源每10秒輪詢資料庫是否有新資料。

  • 設定選項:

    • 建立來源連線時,您可以為Snowflake來源啟用backfill布林值標幟。

      • 如果回填設為true,則timestamp.initial的值會設為0。 這表示會擷取時間戳記欄超過0紀元時間的資料。
      • 如果回填設為false,則timestamp.initial的值會設為–1。 這表示會擷取時間戳記欄大於目前時間(來源開始擷取的時間)的資料。
    • 時間戳記資料行的格式應該是: TIMESTAMP_LTZTIMESTAMP_NTZ。 如果時間戳記資料行設為TIMESTAMP_NTZ,則儲存值的對應時區應透過timezoneValue引數傳遞。 如果未提供,此值將預設為UTC。

      • TIMESTAMP_TZ不能用於時間戳記資料行或對應中。

後續步驟

下列教學課程提供如何使用API將您的Snowflake串流來源連線至Experience Platform的步驟:

recommendation-more-help
337b99bb-92fb-42ae-b6b7-c7042161d089