数据流是从源中检索数据并将其引入Platform数据集的计划任务。 本教程提供了使用CRM帐户配置新数据流的步骤。
本教程需要对Adobe Experience Platform的以下组件进行有效的理解:
此外,本教程要求您已创建CRM帐户。 在源连接器概述中可以找到有关在UI中创建不同CRM连接器的列表教程。
创建CRM帐户后,将显示选择数据步骤,为您提供一个交互界面来浏览文件层次结构。
您可以使用页面顶部的搜索选项快速识别要使用的源数据。
搜索源数据选项适用于所有基于表格的源连接器,不包括分析、分类、事件中心和Kinesis连接器。
找到源数据后,选择目录,然后单击下一步。
出现映射步骤,提供交互式界面以将源数据映射到Platform数据集。
选择要收录到的入站数据的数据集。 您可以使用现有数据集或创建新数据集。
要将数据引入现有数据集,请选择使用现有数据集,然后单击数据集图标。
出现选择数据集对话框。 找到您要使用的数据集,选择它,然后单击继续。
要将数据引入新数据集,请选择创建新数据集,并在提供的字段中输入数据集的名称和说明。
可以在选择模式搜索栏中输入模式名称,附加模式字段。 您还可以选择下拉图标以查看现有列表的模式。 或者,您也可以选择高级搜索访问现有模式的屏幕,包括其各自的详细信息。
在此步骤中,您可以为Real-time Customer Profile启用数据集,并创建实体属性和行为的整体视图。 来自所有已启用数据集的数据将包含在Profile中,并在保存数据流时应用更改。
切换用户档案数据集按钮,为Profile启用目标数据集。
出现选择模式对话框。 选择要应用于新数据集的模式,然后单击完成。
根据您的需要,您可以选择直接映射字段,或使用映射器函数转换源数据以导出计算值或计算值。 有关模式映射和映射器功能的详细信息,请参阅有关将CSV数据映射到XDM字段的教程。
Platform 根据您选择的目标模式或数据集,为自动映射字段提供智能建议。您可以手动调整映射规则以适合您的用例。
选择预览数据可查看所选数据集中最多100行样本数据的映射结果。
在该预览中,标识列作为第一字段进行优先级排序,因为它是验证映射结果时必需的关键信息。
映射源数据后,选择关闭。
出现计划步骤,允许您配置摄取计划,以使用配置的映射自动摄取所选源数据。 下表概述了用于计划的不同可配置字段:
字段 | 描述 |
---|---|
频度 | 可选频率包括Once 、Minute 、Hour 、Day 和Week 。 |
间隔 | 一个整数,它为所选频率设置间隔。 |
开始时间 | UTC时间戳,指示何时设置第一次摄取。 |
回填 | 一个布尔值,它确定最初摄取的数据。 如果启用了回填,则指定路径中的所有当前文件将在第一次预定接收期间被摄取。 如果禁用了回填,则只会摄取在第一次摄取和开始时间之间加载的文件。 在开始时间之前加载的文件将不会被摄取。 |
增量列 | 具有筛选的源模式字段集类型、日期或时间的选项。 此字段用于区分新数据和现有数据。 增量数据将根据所选列的时间戳被摄取。 |
数据流设计为按计划自动摄取数据。 开始。 然后,设置时间间隔以指定两个流运行之间的周期。 间隔的值应为非零整数,并应设置为大于或等于15。
要设置摄取的开始时间,请调整开始时间框中显示的日期和时间。 或者,也可以选择日历图标以编辑开始时间值。 开始时间必须大于或等于当前UTC时间。
选择按加载增量数据以分配增量列。 此字段区分新数据和现有数据。
要设置一次性摄取,请选择频率下拉箭头,然后选择一次。
在 一次 性摄取期间,Interval和Backfillar不可见。
向计划提供适当的值后,选择下一步。
出现数据流详细信息步骤,允许您命名新数据流并提供有关新数据流的简要说明。
在此过程中,还可以启用部分摄取和错误诊断。 启用部分摄取能够摄取包含错误且达到某个阈值的数据。 启用部分摄取后,拖动错误阈值%拨号以调整批的错误阈值。 或者,也可以通过选择输入框手动调整阈值。 有关详细信息,请参阅部分批摄取概述。
为数据流提供值并选择Next。
出现Review步骤,允许您在创建新数据流之前对其进行查看。 详细信息按以下类别分组:
查看数据流后,单击完成并允许一段时间创建数据流。
创建数据流后,您可以监视通过它摄取的数据,以查看有关摄取率、成功和错误的信息。 有关如何监视数据流的详细信息,请参阅有关UI](…/monitor.md)中[监视帐户和数据流的教程。
您可以删除不再需要的或使用Dataflows工作区中可用的Delete函数创建错误的数据流。 有关如何删除数据流的详细信息,请参阅有关在UI](…/delete.md)中删除数据流的教程。[
通过遵循本教程,您成功创建了一个数据流,以从CRM导入数据并获得了有关监视数据集的洞察。 要进一步了解如何创建数据流,您可以通过观看以下视频来补充您的学习。 此外,下游Platform服务(如Real-time Customer Profile和Data Science Workspace)现可使用传入数据。 有关更多详细信息,请参阅以下文档:
以下视频中显示的Platform UI已过期。 有关最新的UI屏幕截图和功能,请参阅上面的文档。
以下部分提供了有关使用源连接器的其他信息。
创建数据流时,它会立即变为活动状态,并根据给定的计划接收数据。 您可以按照以下说明随时禁用活动数据流。
在authentication屏幕中,选择与要禁用的数据流关联的连接名称。
将显示源活动页。 从列表中选择活动数据流以在屏幕右侧打开其属性列,该列包含一个已启用切换按钮。 单击切换以禁用数据流。 在禁用数据流后,可以使用相同的切换重新启用数据流。
源连接器的入站数据可用于丰富和填充Real-time Customer Profile数据。 有关填充Real-time Customer Profile数据的详细信息,请参阅关于用户档案填充的教程。