在UI中使用协议源创建数据流

数据流是一项计划任务,用于从源中检索数据并将其摄取到Adobe Experience Platform中的数据集。 本教程提供了有关如何使用Platform UI为协议源创建数据流的步骤。

注意

要创建数据流,您必须已经拥有一个具有协议源的经过身份验证的帐户。 有关在UI中创建不同协议源帐户的教程列表,请参阅 源概述.

快速入门

本教程需要对Platform的以下组件有一定的了解:

  • :平台允许从各种源摄取数据,同时让您能够使用构建、标记和增强传入数据 Platform 服务。
  • Experience Data Model (XDM) 系统:Experience Platform组织客户体验数据的标准化框架。
  • Real-time Customer Profile:根据来自多个来源的汇总数据提供统一的实时客户资料。
  • Data Prep:允许数据工程师映射、转换和验证来自体验数据模型(XDM)的数据。

添加数据

创建协议源帐户后, 添加数据 步骤,为您提供一个界面以浏览协议源帐户的表层次结构。

  • 界面的左半部分是浏览器,其中显示了帐户中包含的数据表列表。 该界面还包含一个搜索选项,通过该选项,您可以快速识别要使用的源数据。
  • 界面的右半部是一个预览面板,允许您预览多达100行数据。
注意

搜索源数据选项适用于所有基于表的源(不包括Adobe Analytics、 Amazon Kinesis和 Azure Event Hubs.

找到源数据后,选择表,然后选择 下一个.

select-data

提供数据流详细信息

的 数据流详细信息 页面允许您选择是要使用现有数据集还是新数据集。 在此过程中,您还可以配置 配置文件数据集, 错误诊断, 部分摄取和 警报.

数据流详细信息

使用现有数据集

要将数据摄取到现有数据集,请选择 现有数据集. 您可以使用 高级搜索 选项,或者通过在下拉菜单中滚动浏览现有数据集列表来配置。 选择数据集后,请为数据流提供名称和描述。

现有数据集

使用新数据集

要摄取到新数据集,请选择 新数据集 然后,提供输出数据集名称和可选描述。 接下来,使用 高级搜索 选项或通过滚动下拉菜单中的现有架构列表来迁移。 选择架构后,请为数据流提供名称和描述。

新数据集

启用 Profile 和错误诊断

接下来,选择 配置文件数据集 切换为启用数据集 Profile. 这允许您创建实体属性和行为的整体视图。 所有数据 Profile-enabled数据集将包含在 Profile 和更改将在您保存数据流时应用。

错误诊断 为数据流中发生的任何错误记录启用详细的错误消息生成,而 部分摄取 允许您摄取包含错误的数据,最多可达您手动定义的特定阈值。 请参阅 部分批量摄取概述 以了解更多信息。

配置文件和错误

启用警报

您可以启用警报以接收有关数据流状态的通知。 从列表中选择警报以订阅接收有关数据流状态的通知。 有关警报的更多信息,请参阅 使用UI订阅源警报.

完成向数据流提供详细信息后,选择 下一个.

警报

将数据字段映射到XDM架构

的 映射 此时会显示步骤,为您提供一个界面,用于将源架构中的源字段映射到目标架构中相应的目标XDM字段。

Platform根据您选择的目标架构或数据集,为自动映射的字段提供智能推荐。 您可以手动调整映射规则以适合您的用例。 根据您的需要,您可以选择直接映射字段,或使用数据准备函数转换源数据以导出计算值或计算值。 有关使用映射器界面和计算字段的完整步骤,请参阅 数据准备UI指南.

成功映射源数据后,选择 下一个.

映射

计划摄取运行

的 计划 步骤,允许您配置摄取计划以使用配置的映射自动摄取选定的源数据。 默认情况下,计划设置为 Once. 要调整摄取频率,请选择 频率 ,然后从下拉菜单中选择一个选项。

小贴士

在一次性摄取期间,间隔和回填不可见。

调度

如果将摄取频度设置为 Minute, Hour, DayWeek,则必须设置一个间隔,以在每次摄取之间建立一个设置的时间范围。 例如,摄取频度设置为 Day 和间隔设置为 15 意味着您的数据流计划每15天摄取一次数据。

在此步骤中,您还可以启用 回填 并为数据的增量摄取定义一列。 回填用于摄取历史数据,而您为增量摄取定义的列允许将新数据与现有数据区分开。

有关计划配置的更多信息,请参阅下表。

字段 描述
频度 发生摄取的频率。 可选频率包括 Once, Minute, Hour, DayWeek.
间隔 一个整数,用于设置所选频率的间隔。 间隔的值应为非零整数,并应设置为大于或等于15。
开始时间 UTC时间戳,指示何时设置进行第一次摄取。 开始时间必须大于或等于当前UTC时间。
回填 一个布尔值,用于确定最初摄取的数据。 如果启用了回填,则在首次计划摄取期间将摄取指定路径中的所有当前文件。 如果禁用回填,则只会摄取在首次摄取运行到开始时间之间加载的文件。 不会摄取在开始时间之前加载的文件。
加载增量数据的方式 一个选项,其中包含一组类型、日期或时间的筛选源架构字段。 此字段用于区分新数据和现有数据。 将根据选定列的时间戳摄取增量数据。

回填

查看数据流

审阅 步骤,允许您在创建新数据流之前查看新数据流。 详细信息按以下类别分组:

  • 连接:显示源类型、所选源文件的相关路径以及该源文件中的列数。
  • 分配数据集和映射字段:显示源数据被摄取到的数据集,包括该数据集附加的架构。
  • 计划:显示摄取计划的活动期、频率和间隔。

审核数据流后,选择 完成 并为创建数据流留出一些时间。

审查

监控数据流

创建数据流后,您可以监控通过其摄取的数据,以查看有关摄取率、成功和错误的信息。 有关如何监控数据流的更多信息,请参阅 监控UI中的帐户和数据流.

删除数据流

您可以删除不再需要或使用错误创建的数据流 删除 函数 数据流 工作区。 有关如何删除数据流的更多信息,请参阅 删除UI中的数据流.

后续步骤

在本教程之后,您已成功创建了一个数据流,以将数据从协议源引入平台。 现在,下游可以使用传入数据 Platform 诸如 Real-time Customer Profile 和 Data Science Workspace. 有关更多详细信息,请参阅以下文档:

警告

以下视频中显示的平台UI已过期。 有关最新的UI屏幕截图和功能,请参阅上述文档。

在此页面上