入站客户数据摄取常见问题解答 inbound-customer-data-ingestion-faq

有关将离线数据纳入 Audience Manager 的常见问题解答。

能否概述一下载入流程?

载入流程包括将批量数据发送到 Audience Manager 概述中所述的两个步骤:

  • 步骤 1:同步用户 ID;
  • 步骤 2:按照文件格式要求,创建并传输入站数据文件。

能否概述一下部署流程?

我们建议执行以下操作:

  • 与您的数据提供商合作,根据 Adobe 规范对日常入站数据文件进行格式化。有关文件命名和语法要求,请参阅以下文档:

  • 与您的 Adobe 顾问合作,将测试数据文件传输到 Adobe 以进行格式验证。

  • 与您的 Adobe 顾问合作,生成适用于解释数据文件内容的分类。

  • 在暂存/开发环境中,确认已将 ID 同步配置为正确选取数据提供商的访客 ID 并将其实时传输到 Audience Manager 服务器。

  • 将 DIL/ID 同步部署到生产环境。您的 Adobe 顾问已将 ID 同步配置为 DIL 代码中的模块。

  • 将生产数据文件传输到 Audience Manager。考虑到对 ID 同步映射的依赖性,虽然可以在将代码部署到生产环境后立即开始传输数据文件,但是在生产代码部署后的一周内开始传输数据可能更合适。

我应使用哪种 FTP 模式传输压缩文件或加密文件?

请参阅入站数据传输文件的文件压缩

WARNING
我们正在逐步停止对 FTP 配置的支持。虽然现有 FTP 集成仍支持入站数据文件摄取,但我们仍强烈建议使用 Amazon S3 载入离线数据以进行新集成。有关详细信息,请参阅入站数据文件的 Amazon S3 名称和文件大小要求

我能否先上传入站数据文件(.sync 或 .overwrite 文件),然后再将 Audience Manager 代码部署到生产环境中?

能。只要您使用cross-device data source存储所上传的CRM数据,Audience Manager就会始终存储这些数据。 事实上,继Audience Manager在2019年10月发布Profile Merge Rules增强功能(允许仅离线用例)后,您便可以上传数据并对其进行操作,而无需将Audience Manager代码部署到生产环境中。 请参阅:

我应该在一天中的哪个时刻传输文件?

Audience Manager 一天中会多次检查和处理文件。您随时都能上传数据。

需要多长时间才能定位已上传文件中的数据?

在 48 小时后方可定位数据。此外,请勿将“成功上传”电子邮件理解为数据可用。该电子邮件仅意味着 Audience Manager 已选取文件并完成了处理的第一步。

我应该多久发送一次文件?这些文件应该是完整文件还是增量文件?

最佳做法是每天为新访客和数据已更改的访客发送一次增量文件。许多 Audience Manager 客户会每月发送一次完整文件。但是,这些文件间隔时间和增量是灵活的。您应在合适的时间以增量形式发送数据。

Audience Manager 会将我的文件在服务器上保存多长时间?

FTP 文件在处理后即会被删除。S3 文件将在 30 天后被删除。因格式、语法或其他错误而无法处理的文件将被删除。另请参阅隐私和数据保留常见问题解答

完整文件和增量文件之间有何区别?

  • 完整: ​完整文件会覆盖所有现有访客配置文件,并使用文件中的数据替换它们。完整文件由附加到文件名的 .overwrite 标记来标识。您可以使用 .overwrite 文件重置访客特征或删除已过时的失效特征。

    note note
    NOTE
    .overwrite 文件只会覆盖与此数据提供商关联的 Audience Manager 配置文件数据。换言之,在处理 .overwrite 文件之后,与访客关联的所有 Audience Manager 数据均将保持不变。
  • 增量: ​增量文件会向现有访客配置文件中附加新数据。增量文件由附加到文件名的 .sync 标记来标识。发送增量文件不会擦除或覆盖现有配置文件。

以下用例演示了这些文件类型如何影响存储的访客配置文件。

用例
描述
增量文件和完整文件
  • 第 1 天 .sync 文件内容:visitor123 = a,b,c
  • 第 2 天 .overwrite 文件内容:visitor123 = c,d,e
  • 第 3 天访客配置文件 ID 123 内容:c,d,e
仅增量文件
  • 第 1 天 .sync 文件内容:visitor123 = a,b,c
  • 第 2 天 .sync 文件内容:visitor123 = c,d,e
  • 第 3 天访客配置文件 ID 123 内容:a,b,c,d,e

有关完整和增量文件类型的更多信息,请参阅:

如果我发送的文件中包含从未执行过页面上 ID 同步的访客的 ID,会发生什么情况?

在处理期间,Audience Manager 会跳过该记录并继续处理下一个记录。如果将 DPID(数据提供商 ID)设置为跨设备 DPID,则会保存在 ID 同步之前摄取的数据,该数据在 ID 同步后可即刻使用。

时间戳是什么,它有何用途?能否提供一个示例?

时间戳用于日志和记录保存。格式正确的入站文件名所用的语法要求使用时间戳。请参阅:

什么是Data Provider ID (DPID)以及如何获取它?

Adobe 顾问将为您的特定数据源分配一个三位数或四位数的 DPID(数据提供商 ID)。此 ID 是唯一的,不会更改。

日常数据文件可以有多大?

请参阅入站数据传输文件的文件压缩

Audience Manager 是否支持文件压缩?

是的,请参阅:

我的数据源数据库中的主键是电子邮件地址。这是否被视为个人身份信息?

是的。Audience Manager 不会在其数据库中存储电子邮件地址。在启动ID同步之前,应为访客分配随机生成的ID或电子邮件地址的单向哈希版本。

数据文件内容是否区分大小写?ID 同步呢?

数据文件有两个基本组成部分:User ID(请参阅定义的文件变量中的 User ID)和配置文件数据(通常采用键值对或代码形式)。User ID 区分大小写。通常,配置文件或键值数据不区分大小写。

我应该使用 FTP 还是 Amazon S3 来传输文件?

作为最佳做法,我们建议您使用 Amazon S3,因为该过程更简单。不管如何,Audience Manager 都会将 FTP 文件传输到 S3,因此,如果您自行将文件放置到 Amazon S3 上,可以简化该过程。此外,如果多个客户同时上传到 FTP,则他们会共享 FTP 的带宽,因此上传速度会较慢。Amazon S3 也是可复制和分发的,因此它通常比 FTP 服务器更安全、更可靠。有关更多信息,请参阅关于 Amazon S3

WARNING
我们正在逐步停止对 FTP 配置的支持。虽然现有FTP集成仍支持入站数据文件摄取,但我们仍强烈建议使用Amazon S3载入离线数据以进行新集成。 有关详细信息,请参阅入站数据文件的 Amazon S3 名称和文件大小要求

Audience Manger 如何处理入站文件?

Audience Manager 使用 Amazon Simple Queue Service (SQS) 进行入站数据处理。下面是其工作原理:

  1. Audience Manager 客户将其入站数据上传到 Amazon S3 存储段。
  2. 数据进入 Amazon SQS 队列,等待 Audience Manager 处理。
  3. Audience Manager 从 Amazon SQS 队列中最多读取 119000 个条目,并将它们分成 3 批。每批文件会同时进行处理。

我需要同时上传多个文件。是否会同时处理这些文件?

视情况而定。Audience Manager 从 Amazon SQS 队列中最多读取 119000 个条目,并将它们分成 3 批。只有当文件位于同一批次中时,系统才会同时处理它们。但是,由于 Audience Manager 每天摄取的数据量很大,因此我们不能保证任何文件处理顺序。

recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695