[Ultimate]{class="badge positive"}
Snowflake串流來源
Adobe Experience Platform可讓您從外部來源擷取資料,同時使用Platform服務來建構、加標籤及增強傳入資料。 您可以從多種來源(例如Adobe應用程式、雲端儲存、資料庫和許多其他來源)內嵌資料。
Experience Platform支援從Snowflake資料庫串流資料。
瞭解Snowflake串流來源
Snowflake串流來源的運作方式是定期執行SQL查詢來載入資料,並為結果集中的每一列建立輸出記錄。
藉由使用Kafka Connect,Snowflake串流來源會追蹤它從每個資料表收到的最新記錄,以便它可以在下一個反複專案的正確位置開始。 來源使用此功能來篩選資料,並只從每個疊代的表格中取得更新的列。
先決條件
以下章節概述從Snowflake資料庫將資料串流到Experience Platform之前要完成的先決條件步驟:
更新您的IP位址允許清單
使用來源聯結器之前,必須將IP位址清單新增至允許清單。 未能將您區域特定的IP位址新增到允許清單可能會導致使用來源時的錯誤或效能不佳。 如需詳細資訊,請參閱IP位址允許清單頁面。
以下檔案提供如何使用API或使用者介面將Amazon Redshift連線到Platform的資訊:
收集必要的認證
若要讓Flow Service與Snowflake連線,您必須提供下列連線屬性:
account
Snowflake帳戶的完整帳戶識別碼(帳戶名稱或帳戶定位器)已附加尾碼snowflakecomputing.com
。 帳戶識別碼可以是不同的格式:
- {ORG_NAME}-{ACCOUNT_NAME}.snowflakecomputing.com (例如
acme-abc12345.snowflakecomputing.com
) - {ACCOUNT_LOCATOR}。{CLOUD_REGION_ID}.snowflakecomputing.com (例如
acme12345.ap-southeast-1.snowflakecomputing.com
) - {ACCOUNT_LOCATOR}。{CLOUD_REGION_ID}。{CLOUD}.snowflakecomputing.com (例如
acme12345.east-us-2.azure.snowflakecomputing.com
)
如需詳細資訊,請閱讀Snowflake document on account identifiers。
warehouse
database
username
password
role
public
。connectionSpec.id
51ae16c2-bdad-42fd-9fce-8d5dfddaf140
。設定角色設定 configure-role-settings
您必須設定角色的許可權(即使已指派預設公用角色),以允許來源連線存取相關Snowflake資料庫、結構描述和表格。 不同Snowflake個實體的各種許可權如下:
如需角色與許可權管理的詳細資訊,請參閱Snowflake API參考。
限制和常見問答 limitations-and-frequently-asked-questions
-
Snowflake來源的資料輸送量為每秒2000筆記錄。
-
訂價會因倉儲的有效時間長短及倉儲大小而有所不同。 對於Snowflake來源整合,最小大小x小型倉儲就足夠了。 建議啟用自動暫停,以便倉儲在不使用時能夠自行暫停。
-
Snowflake來源每10秒輪詢資料庫是否有新資料。
-
設定選項:
-
建立來源連線時,您可以為Snowflake來源啟用
backfill
布林值標幟。- 如果回填設為true,則timestamp.initial的值會設為0。 這表示會擷取時間戳記欄超過0紀元時間的資料。
- 如果回填設為false,則timestamp.initial的值會設為–1。 這表示會擷取時間戳記欄大於目前時間(來源開始擷取的時間)的資料。
-
時間戳記資料行的格式應該是:
TIMESTAMP_LTZ
或TIMESTAMP_NTZ
。 如果時間戳記資料行設為TIMESTAMP_NTZ
,則儲存值的對應時區應透過timezoneValue
引數傳遞。 如果未提供,此值將預設為UTC。TIMESTAMP_TZ
不能用於時間戳記資料行或對應中。
-
後續步驟
下列教學課程提供如何使用API將您的Snowflake串流來源連線至Experience Platform的步驟: