在UI中使用分析源创建数据流
数据流是一种计划任务,用于在源中检索数据并将其摄取到Adobe Experience Platform中的数据集。 本教程提供了有关如何使用Experience Platform UI为分析源创建数据流的步骤。
快速入门
本教程需要对以下Experience Platform组件有一定的了解:
-
源: Experience Platform允许从各种源摄取数据,同时允许您使用Experience Platform服务来构建、标记和增强传入数据。
-
Experience Data Model (XDM) 系统: Experience Platform用于组织客户体验数据的标准化框架。
-
Real-Time Customer Profile:根据来自多个源的汇总数据,提供统一的实时使用者个人资料。
-
Data Prep:允许数据工程师映射、转换和验证与Experience Data Model (XDM)之间的数据。
提供数据流详细信息
Dataflow detail页面允许您选择是使用现有数据集还是新数据集。 在此过程中,您还可以配置Profile dataset、Error diagnostics、Partial ingestion和Alerts的设置。
使用现有数据集
要将数据摄取到现有数据集,请选择Existing dataset。 您可以使用Advanced search选项或通过滚动下拉菜单中的现有数据集列表来检索现有数据集。 选择数据集后,为数据流提供名称和描述。
使用新数据集
要摄取到新数据集中,请选择New dataset,然后提供输出数据集名称和可选描述。 接下来,使用Advanced search选项或通过滚动下拉菜单中的现有架构列表来选择要映射到的架构。 选择架构后,为数据流提供名称和描述。
启用Profile和错误诊断
接下来,选择 Profile dataset 切换开关以启用Profile的数据集。 这允许您创建实体的属性和行为的整体视图。 来自所有已启用Profile的数据集的数据将包含在Profile中,并且更改会在您保存数据流时应用。
Error diagnostics允许为数据流中发生的任何错误记录生成详细的错误消息,而Partial ingestion允许您摄取包含错误的数据,摄取阈值为您手动定义的特定阈值。 有关详细信息,请参阅部分批次摄取概述。
启用警报
您可以启用警报以接收有关数据流状态的通知。 从列表中选择警报以订阅接收有关数据流状态的通知。 有关警报的详细信息,请参阅使用UI订阅源警报指南。
完成向数据流提供详细信息后,选择Next。
将数据字段映射到XDM架构
此时将显示Mapping步骤,为您提供了一个界面,用于将源架构中的源字段映射到目标架构中相应的目标XDM字段。
Experience Platform根据您选择的目标架构或数据集,为自动映射的字段提供智能推荐。 您可以手动调整映射规则以适合您的用例。 根据需要,您可以选择直接映射字段,或使用数据准备函数转换源数据以派生计算值或计算值。 有关使用映射器界面和计算字段的全面步骤,请参阅数据准备UI指南。
成功映射源数据后,请选择Next。
计划摄取运行
此时将显示Scheduling步骤,允许您配置摄取计划,以使用配置的映射自动摄取选定的源数据。 默认情况下,计划设置为Once。 要调整摄取频率,请选择Frequency,然后从下拉菜单中选择一个选项。
如果将摄取频率设置为Minute、Hour、Day或Week,则必须设置一个间隔,以便在每次摄取之间建立一个设置的时间范围。 例如,摄取频率设置为Day,间隔设置为15意味着您的数据流计划每15天摄取一次数据。
在此步骤中,您还可以启用 回填 并为增量数据摄取定义列。 回填用于摄取历史数据,而您为增量摄取定义的列允许从现有数据中区分新数据。
有关计划配置的详细信息,请参阅下表。
配置频率以指示数据流运行的频率。 您可以将频率设置为:
- 一次:将频率设置为
once以创建一次性引入。 创建一次性摄取数据流时,间隔和回填配置不可用。 默认情况下,调度频率设置为一次。 - 分钟:将频率设置为
minute,以计划数据流以每分钟摄取数据。 - 小时:将频率设置为
hour,以计划数据流每小时摄取数据。 - 天:将频率设置为
day,以计划数据流每天摄取数据。 - 周:将频率设置为
week,以计划数据流每周摄取数据。
选择频率后,可以配置间隔设置以建立每次引入之间的时间范围。 例如,如果将频率设置为天并将间隔配置为15,则数据流将每15天运行一次。 不能将间隔设置为零。 每个频率的最小接受间隔值如下:
- 一次:不适用
- 分钟: 15
- 小时: 1
- 天: 1
- 周: 1
查看您的数据流
此时将显示 Review 步骤,允许您在创建新数据流之前对其进行查看。 详细信息分为以下类别:
- Connection:显示源类型、所选源文件的相关路径以及该源文件中的列数。
- Assign dataset & map fields:显示要将源数据摄取到哪个数据集,包括该数据集所遵循的架构。
- Scheduling:显示摄取计划的活动时段、频率和间隔。
查看数据流后,选择 Finish 并留出一段时间来创建数据流。
监测数据流
创建数据流后,您可以监视通过它摄取的数据,以查看有关摄取率、成功和错误的信息。 有关如何监视数据流的详细信息,请参阅有关UI中监视帐户和数据流的教程。
删除您的数据流
您可以删除不再必需的数据流或使用 Delete 工作区中可用的 Dataflows 功能错误创建的数据流。 有关如何删除数据流的详细信息,请参阅有关在UI中删除数据流的教程。
后续步骤
通过学习本教程,您已成功地创建了一个数据流,以将数据从您的分析源引入Experience Platform。 下游Experience Platform服务(如Real-Time Customer Profile和Data Science Workspace)现在可以使用传入数据。 有关更多详细信息,请参阅以下文档: