启用Profile和错误诊断
接下来,选择 配置文件数据集 切换开关以为Profile启用您的数据集。 这允许您创建实体的属性和行为的整体视图。 来自所有已启用Profile的数据集的数据将包含在Profile中,并且更改会在您保存数据流时应用。
错误诊断允许为数据流中发生的任何错误记录生成详细的错误消息,而部分摄取允许您摄取包含错误的数据,摄取阈值为您手动定义的某个阈值。 有关详细信息,请参阅部分批次摄取概述。
启用警报
您可以启用警报以接收有关数据流状态的通知。 从列表中选择警报以订阅接收有关数据流状态的通知。 有关警报的详细信息,请参阅使用UI订阅源警报指南。
完成向数据流提供详细信息后,选择 下一步。
将数据字段映射到XDM架构
此时将显示映射步骤,该步骤为您提供了一个接口,用于将源架构中的源字段映射到目标架构中相应的目标XDM字段。
Experience Platform根据您选择的目标架构或数据集,为自动映射的字段提供智能推荐。 您可以手动调整映射规则以适合您的用例。 根据需要,您可以选择直接映射字段,或使用数据准备函数转换源数据以派生计算值或计算值。 有关使用映射器界面和计算字段的全面步骤,请参阅数据准备UI指南。
成功映射源数据后,选择 下一步。
计划摄取运行
此时将显示计划步骤,允许您配置摄取计划,以使用配置的映射自动摄取选定的源数据。 默认情况下,计划设置为Once
。 要调整您的摄取频率,请选择 频率,然后从下拉菜单中选择一个选项。
如果将摄取频率设置为Minute
、Hour
、Day
或Week
,则必须设置一个间隔,以便在每次摄取之间建立一个设置的时间范围。 例如,摄取频率设置为Day
,间隔设置为15
意味着您的数据流计划每15天摄取一次数据。
在此步骤中,您还可以启用 回填 并为增量数据摄取定义列。 回填用于摄取历史数据,而您为增量摄取定义的列允许从现有数据中区分新数据。
有关计划配置的详细信息,请参阅下表。
计划配置 | 描述 |
---|---|
频度 |
配置频率以指示数据流运行的频率。 您可以将频率设置为:
|
间隔 |
选择频率后,可以配置间隔设置以建立每次引入之间的时间范围。 例如,如果将频率设置为天并将间隔配置为15,则数据流将每15天运行一次。 不能将间隔设置为零。 每个频率的最小接受间隔值如下:
|
开始时间 | 预计运行的时间戳,以UTC时区显示。 |
回填 | 回填可确定最初摄取的数据。 如果启用了回填,则指定路径中的所有当前文件将在第一次计划摄取期间摄取。 如果禁用回填,则只摄取在第一次引入运行到开始时间之间加载的文件。 将不会摄取在开始时间之前加载的文件。 |
加载增量数据依据 | 一个选项,其中包含一组类型为、日期或时间的源架构字段。 您为 加载增量数据()选择的字段必须具有UTC时区的日期时间值,才能正确加载增量数据。 所有基于表的批处理源均可通过将增量列时间戳值与相应的流运行窗口UTC时间进行比较,然后复制源中的数据(如果在UTC时间窗口内发现任何新数据)来选择增量数据。 |