Azure Data Lake Storage Gen2连接
概述 overview
阅读本页以了解如何创建到Azure Data Lake Storage Gen2 (ADLS Gen2)数据湖的实时出站连接,以定期从Experience Platform导出数据文件。
通过API或UI连接到您的ADLS Gen2存储 connect-api-or-ui
- 要使用Platform用户界面连接到ADLS Gen2存储位置,请阅读下面的连接到目标和将受众激活到此目标部分。
- 若要以编程方式连接到ADLS Gen2存储位置,请阅读使用流服务API教程将受众激活到基于文件的目标。
支持的受众 supported-audiences
此部分介绍哪些类型的受众可以导出到此目标。
导出类型和频率 export-type-frequency
有关目标导出类型和频率的信息,请参阅下表。
导出数据集 export-datasets
此目标支持数据集导出。 有关如何设置数据集导出的完整信息,请阅读教程:
导出数据的文件格式 file-format
导出 受众数据 时,Platform会在您提供的存储位置创建一个.csv
、parquet
或.json
文件。 有关这些文件的更多信息,请参阅Audience Activation教程中的导出的支持文件格式部分。
导出 数据集 时,Platform会在您提供的存储位置创建一个.parquet
或.json
文件。 有关这些文件的更多信息,请参阅导出数据集教程中的验证成功的数据集导出部分。
连接到目标 connect
要连接到此目标,请按照目标配置教程中描述的步骤操作。 在目标配置工作流中,填写下面两个部分中列出的字段。
验证目标 authenticate
要验证到目标,请填写必填字段并选择 连接到目标。
-
URL: Azure Data Lake Storage Gen2的终结点。 终结点模式为:
abfss://<container>@<accountname>.dfs.core.windows.net
。 -
租户:包含您的应用程序的租户信息。
-
服务主体ID:应用程序的客户端ID。
-
服务主体密钥:应用程序的密钥。
-
加密密钥: (可选)您可以附加RSA格式的公钥以向导出的文件添加加密。 查看下图中的加密密钥格式正确示例。
填写目标详细信息 destination-details
要配置目标的详细信息,请填写下面的必需和可选字段。 UI中字段旁边的星号表示该字段为必填字段。
-
名称:填写此目标的首选名称。
-
描述:可选。 例如,您可以提及要将此目标用于哪个营销活动。
-
文件夹路径:输入将承载导出文件的目标文件夹的路径。
-
文件类型:选择导出文件应使用的格式Experience Platform。 在选择CSV选项时,您还可以配置文件格式选项。
-
压缩格式:选择Experience Platform应用于导出文件的压缩类型。
-
包含清单文件:如果希望导出包含清单JSON文件,并且该文件包含有关导出位置、导出大小等的信息,请打开此选项。 清单的命名格式为
manifest-<<destinationId>>-<<dataflowRunId>>.json
。 查看样本清单文件。 清单文件包含以下字段:flowRunId
:生成导出文件的数据流运行。scheduledTime
:导出文件时的时间(UTC时间)。exportResults.sinkPath
:存储位置中保存导出文件的路径。exportResults.name
:导出文件的名称。size
:导出文件的大小(字节)。
启用警报 enable-alerts
您可以启用警报,以接收有关发送到目标的数据流状态的通知。 从列表中选择警报以订阅接收有关数据流状态的通知。 有关警报的详细信息,请参阅使用UI订阅目标警报的指南。
完成提供目标连接的详细信息后,选择 下一步。
激活此目标的受众 activate
有关将受众激活到此目标的说明,请参阅将受众数据激活到批量配置文件导出目标。
计划中 scheduling
在 计划 步骤中,您可以为Azure Data Lake Storage Gen2目标设置导出计划,还可以配置导出文件的名称。
映射属性和身份 map
在 映射 步骤中,您可以为配置文件选择要导出的属性和标识字段。 您还可以选择将导出文件中的标头更改为所需的任何友好名称。 有关详细信息,请查看激活批处理目标UI教程中的映射步骤。
验证数据导出是否成功 exported-data
要验证是否已成功导出数据,请检查您的Azure Data Lake Storage Gen2存储并确保导出的文件包含预期的配置文件人口。