Beta Ultimate

Snowflake 流源

重要
  • 此 Snowflake 流源为测试版。 请阅读 源概述 有关使用测试版标记源的更多信息。
  • 此 Snowflake 已购买Real-time Customer Data Platform Ultimate的用户可在API中使用流源。

Adobe Experience Platform允许从外部源摄取数据,同时让您能够使用Platform服务来构建、标记和增强传入数据。 您可以从各种来源(如Adobe应用程序、基于云的存储、数据库和许多其他来源)中摄取数据。

Experience Platform支持来自的流数据 Snowflake 数据库。

了解 Snowflake 流源

此 Snowflake 流源通过定期执行SQL查询并为结果集中的每一行创建输出记录来加载数据。

通过使用 Kafka Connect,则 Snowflake 流源会跟踪它从每个表收到的最新记录,以便它可以在正确位置开始下一次迭代。 源使用此功能来筛选数据,并仅从每个迭代上的表中获取更新的行。

先决条件

以下部分概述了在从中流式传输数据之前需要完成的先决条件步骤 Snowflake 要Experience Platform的数据库:

收集所需的凭据

为了 Flow Service 以连接 Snowflake中,您必须提供以下连接属性:

凭据 描述
account 与您的关联的完整帐户名称 Snowflake 帐户。 完全合格的 Snowflake 帐户名称包括您的帐户名称、区域和云平台。 例如:cj12345.east-us-2.azure。有关帐户名称的更多信息,请参阅此 [Snowflake document on account identifiers] (https://docs.snowflake.com/en/user-guide/admin-account-identifier.html).
warehouse 此 Snowflake warehouse管理应用程序的查询执行过程。 每个 Snowflake 仓库相互独立,在将数据传送到Platform时必须单独访问。
database 此 Snowflake 数据库包含要带入Platform的数据。
username 的用户名 Snowflake 帐户。
password 的密码 Snowflake 用户帐户。
role (可选)可以为用户、给定连接提供的自定义角色。 如果未提供,则此值默认为 public.
connectionSpec.id 连接规范返回源的连接器属性,包括与创建基础连接和源连接相关的身份验证规范。 的连接规范ID Snowflake 是 51ae16c2-bdad-42fd-9fce-8d5dfddaf140.

有关身份验证的更多信息,请参阅此 [Snowflake 文档] (https://docs.snowflake.com/en/user-guide/key-pair-auth.html).

配置角色设置

即使分配了默认公共角色,您也必须配置角色的权限,以允许源连接访问相关角色 Snowflake 数据库、架构和表。 不同权限的不同权限 Snowflake 实体之详情如下:

Snowflake 实体 需要角色权限
仓库 操作、使用
数据库 使用情况
架构 使用情况
表格 SELECT
注意

必须在仓库的高级设置配置中启用自动恢复和自动暂停。

有关角色和权限管理的详细信息,请参阅 [Snowflake API参考] (https://docs.snowflake.com/en/sql-reference/sql/grant-privilege).

限制和常见问题解答

  • 的数据吞吐量 Snowflake 源是每秒2000条记录。
  • 根据仓库的有效时间长短和仓库的大小,定价会有所不同。 对于 Snowflake 源集成,最小尺寸,x小仓库就足够了。 建议启用自动暂停,以便仓库在不使用时能够自行暂停。
  • 此 Snowflake 源每10秒轮询数据库一次新数据。
  • 配置选项:
    • 您可以启用 backfill 布尔标记 Snowflake 创建源连接时的源。
      • 如果回填设置为true ,则timestamp.initial的值将设置为0。 这意味着会获取时间戳列大于0纪元时间的数据。
      • 如果回填设置为false,则timestamp.initial的值将设置为–1。 这意味着,将获取时间戳列大于当前时间(源开始摄取的时间)的数据。
    • 时间戳列的格式应如下所示: TIMESTAMP_LTZTIMESTAMP_NTZ. 如果时间戳列设置为 TIMESTAMP_NTZ,则类型应以UTC时间存储在数据库中。

后续步骤

以下教程提供了有关如何连接 Snowflake 要使用APIExperience Platform的流源:

在此页面上