在UI中为电子商务连接配置数据流

数据流是从源中检索数据并将其引入Platform数据集的计划任务。 本教程提供了使用​eCommerce​帐户配置新数据流的步骤。

入门指南

本教程需要对Adobe Experience Platform的以下组件有充分的了解:

此外,本教程要求您已经创建了​eCommerce​帐户。 在源连接器概述中,可以找到有关在UI中创建不同​eCommerce​连接器的列表教程。

选择数据

创建​eCommerce​帐户后,将显示​Select data​步骤,为您提供一个交互式界面来浏览文件层次结构。

  • 界面的左半部分是目录浏览器,显示服务器的文件和目录。
  • 该界面的右半部分允许您从一个兼容文件预览多达100行数据。

您可以使用页面顶部的​Search​选项快速识别要使用的源数据。

注意

搜索源数据选项适用于所有基于表格的源连接器,不包括分析、分类、事件集线器和Kinesis连接器。

找到源数据后,选择目录,然后选择​Next

select-data

将数据字段映射到XDM模式

将出现​Mapping​步骤,提供一个交互式界面,将源数据映射到Platform数据集。

为要摄取的入站数据选择数据集。 您可以使用现有数据集或创建新数据集。

使用现有数据集

要将数据收录到现有数据集中,请选择​Use existing dataset,然后单击数据集图标。

use-existing-dataset

出现​Select dataset​对话框。 找到您要使用的数据集,选择它,然后单击​Continue

select-existing-dataset

使用新数据集

要将数据收录到新数据集中,请选择​Create new dataset,并在提供的字段中输入数据集的名称和说明。

可以通过在​Select schema​搜索栏中输入模式名称来附加模式字段。 您还可以选择下拉图标以查看现有模式的列表。 或者,您也可以选择​Advanced search​访问现有模式的屏幕,包括其各自的详细信息。

在此步骤中,您可以为Real-time Customer Profile启用数据集,并创建实体属性和行为的整体视图。 Profile中将包含所有已启用数据集中的数据,并在保存数据流时应用更改。

切换​Profile dataset​按钮,为Profile启用目标数据集。

create-new-dataset

出现​Select schema​对话框。 选择要应用于新数据集的模式,然后单击​Done

select-模式

根据您的需要,您可以选择直接映射字段,或使用映射器函数转换源数据以导出计算值或计算值。 有关模式映射和映射器函数的详细信息,请参阅有关将CSV数据映射到XDM字段的教程。

小贴士

Platform 根据您选择的目标模式或数据集,为自动映射字段提供智能建议。您可以手动调整映射规则以适合您的使用案例。

选择​Preview data​可查看所选数据集中最多100行样本数据的映射结果。

在该预览中,标识列作为第一字段进行优先级排序,因为它是验证映射结果时所需的关键信息。

映射源数据后,选择​Close

计划摄取运行

将显示​Scheduling​步骤,允许您配置摄取计划,以使用配置的映射自动摄取所选源数据。 下表概述了用于计划的不同可配置字段:

字段 描述
频度 可选频率包括OnceMinuteHourDayWeek
间隔 一个整数,用于设置所选频率的间隔。
开始时间 一个UTC时间戳,指示何时设置第一次摄取。
回填 一个布尔值,它确定最初摄取的数据。 如果启用​Backfill,则在首次计划引入期间将摄取指定路径中的所有当前文件。 如果​Backfill​被禁用,则只会摄取在第一次摄取和开始时间之间加载的文件。 不会摄取在开始时间之前加载的文件。
增量列 包含类型、日期或时间的一组已过滤源模式字段的选项。 此字段用于区分新数据和现有数据。 增量数据将根据所选列的时间戳被摄取。

数据流设计为按计划自动收录数据。 开始。 接下来,设置时间间隔以指定两个流运行之间的时间段。 间隔的值应为非零整数,并应设置为大于或等于15。

要设置摄取的开始时间,请调整开始时间框中显示的日期和时间。 或者,您也可以选择日历图标来编辑开始时间值。 开始时间必须大于或等于当前UTC时间。

选择​Load incremental data by​以分配增量列。 此字段区分新数据和现有数据。

设置一次性摄取数据流

要设置一次性摄取,请选择频率下拉箭头并选择​Once

小贴士

IntervalBackfill 一次性摄取时不可见。

向计划提供适当值后,请选择​Next

提供数据流详细信息

将出现​Dataflow detail​步骤,允许您命名新数据流并提供有关新数据流的简短说明。

在此过程中,您还可以启用​Partial ingestion​和​Error diagnostics。 启用​Partial ingestion​后,能够摄取包含错误且最高达到某个阈值的数据。 启用​Partial ingestion​后,拖动​Error threshold %​拨号以调整批的错误阈值。 或者,也可以通过选择输入框手动调整阈值。 有关详细信息,请参阅部分批摄取概述

为数据流提供值,然后选择​Next

数据流详细信息

查看数据流

将显示​Review​步骤,允许您在创建新数据流之前查看新数据流。 详细信息按以下类别分组:

  • Connection:显示源类型、所选源文件的相关路径以及该源文件中的列数。
  • Assign dataset & map fields:显示接收源数据的模式集,包括数据集附带的数据集。
  • Scheduling:显示摄取计划的活动期、频率和间隔。

查看数据流后,单击​Finish​并允许一段时间创建数据流。

审查

监控数据流

创建数据流后,您可以监视通过它摄取的数据,以查看有关摄取率、成功和错误的信息。 有关如何监视数据流的详细信息,请参阅有关在UI中监视帐户和数据流的教程。

删除数据流

您可以删除不再需要的或使用​Dataflows​工作区中可用的​Delete​函数创建错误的数据流。 有关如何删除数据流的详细信息,请参阅有关在UI🔗中删除数据流的教程。

后续步骤

通过本教程,您成功创建了一个数据流,以导入​eCommerce​数据并获得了对监视数据集的洞察。 现在,下游Platform服务(如Real-time Customer Profile和Data Science Workspace)可以使用传入数据。 有关更多详细信息,请参阅以下文档:

在此页面上