[有限发布版]{class="badge informative"}
Azure storage中的Source受众
将Azure Blob Storage或Azure Data Lake Storage (ADLS) Gen2连接到Adobe Real-Time CDP Collaboration以源第一方受众数据以进行激活和重叠分析。
使用本指南创建可重复使用的Azure数据连接,并从配置的存储位置运行一次性导入。 在开始之前,请确认您的受众文件符合受众源规范。 您将在设置过程中授予Adobe对Azure存储的读取权限。
选择您的Azure源类型 choose-source-type
Collaboration支持两个Azure摄取选项。 使用下表选取与受众文件所在位置匹配的指南路径。
每个数据连接 只能配置 一种源类型。 若要同时从Blob和ADLS获取源,请创建单独的数据连接。
先决条件 prerequisites
在遵循本指南之前,请完成帐户登录和设置。 然后,请先完成此部分中的先决条件,然后再启动配置工作流。
某些步骤需要 Azure管理员 执行操作。 如果您不是组织的Azure管理员,请在开始之前确定适当的人员。
Azure访问和权限 azure-access-and-permissions
在Collaboration中配置连接之前,您或您的Azure管理员必须授予Adobe对包含受众文件的存储容器或ADLS Gen2文件系统的读取权限。 权限设置完成后,Collaboration配置工作流会在 同意 步骤中验证访问权限。
准备受众数据 prepare-audience-data
您的受众文件必须符合受众源规格(v1.2),然后才能开始源。
主要要求包括:
- 文件格式: CSV,使用逗号作为字段分隔符,使用管道字符(
|)作为单个字段中多个值的分隔符。 - 必填字段:每个记录都必须包含一个
AUDIENCE_ID列和至少一个受支持的匹配键列。 - 支持的匹配键:
HASHED_EMAIL_SHA_256,HASHED_PHONE_SHA_256,HASHED_IPV4_SHA_256,CRM_ID,LOYALTY_ID,ADFIXUS_ID。 - 哈希处理要求:上传之前,必须修剪、小写和SHA256哈希处理所有匹配键值。 Collaboration在引入数据之前不会对其进行哈希处理或标准化。
- 列一致性:配置路径下的所有文件必须使用相同的列结构。
此外,还必须为您的Collaboration帐户启用受众文件中存在的所有匹配键。 有关指导,请参阅设置匹配键。
开始前所需的值 values-required
在启动配置工作流之前,准备好以下值。
customerdatastoredatalake-prodaudience-ingestaudiencessourcing/audiences/path1/sourcing/inbound/00000000-0000-0000-0000-00000000000000000000-0000-0000-0000-000000000000设置Azure权限 set-up-azure-permissions
完成此部分中的步骤以准备Azure环境。 Adobe需要具有存储容器的读取权限,Collaboration配置工作流才能建立连接。 此工作在Azure门户中执行,可能需要由Azure管理员完成。
完成此部分后,请继续配置您的 Azure 连接。
获取Adobe的Azure服务主体标识符 obtain-principal-identifier
在完成以下步骤的角色分配步骤之前,请联系您的Adobe客户团队以获取您所在地区(北美洲、EMEA或澳大利亚和新西兰)的Azure服务主体标识符。 您将使用此标识符来授予Adobe对存储的读取访问权限。
设置Azure Blob Storage权限 set-up-azure-blob-storage-permissions
- 在Azure 门户中,打开存储帐户,然后转到 容器 并选择包含受众文件的容器。
- 选择Access control (IAM),然后选择Add role assignment。
- 在容器作用域中将 Storage Blob Data Reader 角色分配给Adobe的主体。
- 选择保存。
设置ADLS Gen2权限 set-up-adls-gen2-permissions
对于ADLS Gen2连接,Collaboration中的 Container 字段对应于Azure中的ADLS Gen2文件系统。 使用包含受众文件的文件系统。
在分配权限之前,请确认存储帐户启用了分层命名空间,并且防火墙或专用端点规则允许Adobe访问。
- 在Azure 门户中,打开包含您的ADLS Gen2文件系统的存储帐户。
- 打开包含受众文件的文件系统。
- 选择访问控制(IAM),然后选择添加角色分配。
- 在文件系统或目录作用域中将 Storage Blob Data Reader 角色分配给Adobe的主体。
- 选择保存。
完成源类型的权限设置后,请继续配置您的 Azure 连接。
配置您的Azure连接 configure-your-azure-connection
使用Collaboration配置工作流验证Azure存储详细信息,确认Adobe访问权限,查看自动映射的身份字段以及创建数据连接。
添加新的数据连接 add-new-data-connection
导航到设置 > 我的受众,然后选择添加图标(
出现 添加受众 工作流。 选择添加新数据连接,然后选择下一步。
选择您的Azure数据源 select-azure-data-source
选择 Azure Blob存储 或Azure Data Lake存储Gen2,然后选择下一步。
继续其余步骤,以验证Azure连接,确认Adobe访问权限,查看字段映射,并创建数据连接。
输入连接凭据 enter-connection-credentials
在 凭据 步骤中,提供访问Azure存储位置所需的信息。
输入所需的值后,选择连接到Azure。
确认消息指示连接已成功建立。 选择 下一步 以继续。
授予Adobe访问您的Azure存储的权限 grant-adobe-access
在 同意 步骤中,Collaboration将验证您之前配置的Azure权限。
选择 同意URL 旁边的启动项图标以在Azure中打开授权工作流。 使用有权同意存储位置的帐户登录,然后完成授予Adobe访问所配置存储位置的权限的Azure授权提示。 授权完成后,返回到Collaboration并选择 确认同意 以验证Adobe的访问权限。
当同意验证成功时,将显示 已授予的同意 确认消息。 选择 下一步 以继续。
查看字段映射 review-field-mappings
在 字段映射 步骤中,Collaboration会自动从源文件中映射支持的标识字段。
无需手动配置。
查看显示的映射,并确认源字段与受众文件中的标识列相匹配。 选择 下一步 以继续。
查看并完成连接 review-and-complete
在 审核 步骤中,验证存储帐户、容器、源路径、租户ID和字段映射。
审核页面还指示当前Azure工作流执行单个源运行,并且不配置定期计划。
当配置正确时,选择完成。
确认连接并监控源受众 confirm-connection-and-monitor-audiences
选择 完成 后,Collaboration将创建数据连接并导航到设置 > 我的数据连接。
确认连接已创建 confirm-connection-created
我的数据连接中的连接卡确认连接已成功创建。 卡片显示源类型(Azure Blob Storage或Azure Data Lake Storage Gen2)、创建日期、匹配键、受众规模和当前连接状态。
查看源受众 view-sourced-audiences
创建连接后,Collaboration会自动从配置的Azure位置开始获取受众。 导航到设置 > 我的受众,以监视源获取进度并审查源受众。
来源受众显示在 我的受众 表中。 使用受众状态、身份计数、源、数据连接和上次更新日期确认预期受众是否来自您的Azure连接。
已知限制 known-limitations
在创建或管理Azure数据连接之前,请查看以下限制。
- 匹配键约束:无法从现有连接中删除匹配键。 要更改活动的匹配键,请删除连接并创建一个新连接。
- 每个Azure源类型有一个活动连接:每个帐户可以有一个活动Blob连接和一个活动ADLS Gen2连接。 要更改存储位置,请删除现有连接并创建一个新连接。
- 子文件夹支持: Collaboration仅摄取已配置路径下的文件。 它不会从嵌套的子文件夹中摄取文件。
- 单独的源类型: Blob和ADLS Gen2是不同的连接 — 不要在单个向导运行中混合使用它们之间的配置。
故障排除 troubleshooting
受众未出现或来源补充缓慢 audiences-not-appearing
如果在创建连接后未显示源受众,请完成以下操作。
- 确认受众文件直接存在于配置的路径下方,并符合受众源规范。
- 检查 我的数据连接 是否存在错误。
- 如果24小时后问题仍然存在,请联系Adobe支持并提供连接名称、存储帐户和容器详细信息。
受众源,但显示零或意外标识 zero-identities
如果受众在采购后出现,但身份计数为零或低于预期,请完成以下操作。
- 验证在上传之前,受众文件中的所有匹配键值是否都已裁切、小写和SHA256散列。 Collaboration不会对摄取的数据进行哈希处理或标准化。
- 确认已为Collaboration帐户启用文件中存在的匹配键。 请参阅设置匹配键。
初次成功后连接失败 connection-failed
当连接创建成功但随后进入失败状态时,使用这些检查。
- 验证是否未删除或缩小Adobe主体的Azure RBAC角色分配。
- 确认文件仍然存在于路径中并符合规范。
导入或格式化错误 format-errors
当由于文件结构、散列或列格式问题而导致源获取失败时,请使用这些检查。
- 确保所有文件与初始引入文件保持相同的列结构和散列规则。
后续步骤 next-steps
完成来源补充后,受众可在 我的受众 中用于激活、重叠分析和测量工作流。 要通过协作者激活来源受众,请参阅激活受众。
其他可用的源方法包括Experience Platform、Amazon S3、Google Cloud Storage、Snowflake和CSV文件上传。 有关其他受众来源补充方法,请参阅: