数据流是从源中检索数据并将其引入Adobe Experience Platform数据集的计划任务。 本教程提供使用广告帐户配置新数据流的步骤。
本教程需要对Adobe Experience Platform的以下组件进行有效的理解:
此外,本教程要求您已创建广告帐户。 有关在UI中创建不同付款连接器的列表教程,请参阅源 连接器概述。
创建广告帐户后,将显 示选择数据 步骤,为您提供一个交互界面来探索文件层次结构。
您可以使用页 面顶部 的“搜索”选项快速识别您要使用的源数据。
搜索源数据选项适用于所有基于表格的源连接器,不包括分析、分类、事件中心和Kinesis连接器。
找到源数据后,选择目录,然后单击“下 一步”。
将显 示 “映射”步骤,提供一个交互界面来将源数据映射到数 Platform 据集。
选择要收录到的入站数据的数据集。 您可以使用现有数据集或创建新数据集。
要将数据引入现有数据集,请选择 使用现有数据集,然后单击数据集图标。
此时将 显示“选择数据集 ”对话框。 找到您要使用的数据集,选择它,然后单击“继 续”。
要将数据引入新数据集,请选 择创建新数据集 ,并在提供的字段中输入数据集的名称和说明。
您可以在“选择模式”搜索栏中输入模式名 称来附加模式 字段。 您还可以选择下拉图标以查看现有列表的模式。 或者,您也可以选择“ 高级搜索 ”来访问现有模式的屏幕,包括其各自的详细信息。
在此步骤中,您可以为实体的属 Real-time Customer Profile 性和行为启用数据集并创建整体视图。 所有启用的数据集中的数据都将包含在 Profile 中,并在保存数据流时应用更改。
切换 用户档案集 按钮以启用目标数据集 Profile。
将出 现“选择模式 ”对话框。 选择要应用于新数据集的模式,然后单击 Done。
根据您的需要,您可以选择直接映射字段,或使用映射器函数转换源数据以导出计算值或计算值。 有关数据映射和映射器功能的详细信息,请参阅将CSV数据 映射到XDM模式字段的教程。
Platform 根据您选择的目标模式或数据集,为自动映射字段提供智能建议。 您可以手动调整映射规则以适合您的用例。
选 择预览 ,以查看所选数据集中最多100行样本数据的映射结果。
在该预览中,标识列作为第一字段进行优先级排序,因为它是验证映射结果时必需的关键信息。
映射源数据后,选择“关 闭”。
此时 将显示 “计划”步骤,允许您配置摄取计划,以使用配置的映射自动摄取所选源数据。 下表概述了用于计划的不同可配置字段:
字段 | 描述 |
---|---|
频度 | 可选频率 Once 包括 Minute 、 Hour 、 Day 和 Week 。 |
间隔 | 一个整数,它为所选频率设置间隔。 |
开始时间 | UTC时间戳,指示何时设置第一次摄取。 |
回填 | 一个布尔值,它确定最初摄取的数据。 如果 启用 “回填”,则指定路径中的所有当前文件将在第一次预定接收期间被摄取。 如 果禁 用“回填”,则只会摄取在第一次摄取和开始时间之间加载的文件。 不会摄取在开始时间之前加载的文件。 |
增量列 | 具有筛选的源模式字段集类型、日期或时间的选项。 此字段用于区分新数据和现有数据。 增量数据将根据所选列的时间戳被摄取。 |
数据流设计为按计划自动摄取数据。 开始。 然后,设置时间间隔以指定两个流运行之间的周期。 间隔的值应为非零整数,并应设置为大于或等于15。
要设置摄取的开始时间,请调整开始时间框中显示的日期和时间。 或者,也可以选择日历图标以编辑开始时间值。 开始时间必须大于或等于当前UTC时间。
选择 加载增量数据 ,以分配增量列。 此字段区分新数据和现有数据。
要设置一次性摄取,请选择频率下拉箭头,然后选择“ 一次”。
在一 次 性摄取期 间,间隔和回填不可见。
向计划提供适当的值后,选择“下 一步”。
此时 会显示 “数据流详细信息”步骤,允许您命名新数据流并简要描述新数据流。
在此过程中,您还可以启用“部 分摄取 ”和“ 错误诊断”。 启用 部分摄取 ,可以摄取包含错误且达到特定阈值的数据。 启 用部分摄取 ,请拖动错误 阈值%dial以调整批 错误阈值。 或者,也可以通过选择输入框手动调整阈值。 有关详细信息,请参 阅部分批摄取概述。
为数据流提供值,然后选择 下一步。
此时 会出现 “审阅”步骤,允许您在创建新数据流之前对其进行查看。 详细信息按以下类别分组:
查看数据流后,单击 完成 ,并允许一段时间创建数据流。
创建数据流后,您可以监视通过它摄取的数据,以查看有关摄取率、成功和错误的信息。 有关如何监视数据流的详细信息,请参阅UI中 关于监视帐户和数据流的教程。
您可以删除不再需要的或使用Dataflows工作区中提供的Delete (删除)功能创建的 数据流 。 有关如何删除数据流的详细信息,请参阅有关在UI 中删除数据流的教程。
通过遵循本教程,您成功创建了一个数据流以从营销自动化系统导入数据并获得了有关监视数据集的洞察。 现在,下游服务(如和)可 Platform 以使用传入 Real-time Customer Profile 数据 Data Science Workspace。 有关更多详细信息,请参阅以下文档:
以下部分提供了有关使用源连接器的其他信息。
创建数据流时,它会立即变为活动状态,并根据给定的计划接收数据。 您可以按照以下说明随时禁用活动数据流。
在“数 据流 ”屏幕中,选择要禁用的数据流的名称。
“ 属性 ”列显示在屏幕的右侧。 此面板包含一个“ 已启用 ”切换按钮。 单击切换以禁用数据流。 在禁用数据流后,可以使用相同的切换重新启用数据流。
来自源连接器的入站数据可用于丰富和填充数 Real-time Customer Profile 据。 有关填充数据的更 Real-time Customer Profile 多信息,请参阅用户档案填 充教程。