数据集规则
数据集规则可帮助您将协调的字段与您在Mix Modeler中摄取的数据中的字段进行映射。
- 对于在Adobe Experience Platform中摄取的聚合数据,可将一个或多个可用数据集字段映射到相应的协调字段。
- 对于事件数据,您可以直接或使用条件将一个或多个协调的字段单独映射到数据集中的字段。
管理数据集规则
要查看可用数据集规则的表,请在Mix Modeler界面中执行以下操作:
-
从左边栏中选择
Harmonized data。 -
从顶部栏中选择Dataset rules。 您会看到数据集规则的表。
您可以使用
表列指定有关数据集规则的详细信息:
数据集的名称。 使用
-
View以查看数据集规则配置。 所有字段均被禁用。 -
Edit以编辑数据集规则配置。 -
Delete以删除数据集规则配置。 系统会提示您在“删除数据集”对话框中确认删除。 选择 Delete 以永久删除数据集规则配置。
创建数据集规则
要创建数据集规则,请在Mix Modeler的
在 Create 屏幕中,
-
在 Dataset details 中,从 Select dataset 中选择数据集以开始配置。 在列表中,数据集在Summary、Adobe Analytics、Experience Event、Factors和 Consumer Experience Events 中分类。
-
为 Start of the week 选择日期。
-
为 Daily 选择Weekly、Monthly、Yearly或Granularity。
-
当您选择了 Summary 或 Factors 类别的数据集时,请为 Aggregation 选择 Replacement 或Data restatement is by。
对于营销分析人员而言,来自发布者的报表数据非常重要,因为与发布者合作通常意味着大量支出,并且报表数据的更改可能会导致洞察信息和投资计划出现很大差异。 此外,营销分析师需要准确的数据才能获得正确的洞察力,并提出令人信服的提案以获得利益相关者的信心。 但是,这些发布者(如Google和Facebook)在协调数据时通常会重新声明或删除报表数据。 大多数更改的时间范围在报告媒体性能后的7天内。 30天内可能会对数据做其他更改。 通常,在30天后,书籍会被视为已结账且数据已完整。
Mix Modeler支持数据重述。 确保用于报表、建模和规划的数据准确无误。 并且这些数据能够支持品牌和营销分析师的期望和需求。
您可以在Experience Platform数据集中将重述的摘要数据行作为增量行发送,协调服务将使用该重述数据更新协调的数据集。 同样,您也可以删除需要反映在协调服务中的汇总数据行。
-
在 Map to harmonized fields 部分中,从 Standard harmonized field 中选择协调字段。 要快速创建新的协调字段,请选择Create new。
-
当所选协调字段为指标类型时:
-
从 Count 中选择 Sum 或Mapping type。
-
选择您希望协调字段默认映射到的AEP数据集字段。
-
-
当所选字段属于维度类型时:
-
从 Map Into 中选择 Case 或Mapping type。
-
选择 Map Into 后,请选择 Field 和 AEP数据集字段 或 Value 以及默认值,以便默认情况下将协调字段映射到数据集字段或输入的值。
-
当您选择 Case 时,请选择 Field 和 AEP数据集字段 或 Value 以及默认值,以便默认情况下将协调字段映射到数据集字段或输入的值。
-
要显式设置值,可定义一个或多个情况,其中包含一个或多个条件。 每个条件都可以检查特定的AEP数据集字段,无论它是 Exists 还是Not Exists,或者它是Contains、Not Contains、Equals、Not Equals、Starts With还是 Ends With 在处输入的值输入值。
-
要添加另一个案例,请选择
Add case;要添加另一个条件,请选择 Add condition。 -
要删除案例或条件,请在相应的容器中选择
。 -
要选择是应该将任何条件还是所有条件应用于案例,请选择 Any of 或All of。
-
要设置案例的结果值,请在 Then 处输入值。
-
以下示例:
-
使用Map Into Mapping type将 Channel Type At Source 协调字段映射到 channel_type 数据集中的 Luma Transactions 字段。
-
使用Case Mapping type有条件地将 marketing.campaignName 数据集中 Luma Transactions 字段的值映射到 Campaign 协调字段。 Campaign协调字段设置为:
Black Friday为 marketing.campaignName 或_black_friday时的BlackFriday。- 到所有其它情况下的 marketing.campaignName 的值。
-
-
-
选择
Add field以定义其他字段。
完成后,选择 Save as draft 以保存规则的草稿版本,或选择 Save 以保存并激活规则。 选择 Cancel 取消规则配置。
摘要数据集
当您从摘要数据集中映射标准协调字段时,Mix Modeler会尝试推导相应的Experience Platform数据集字段。 成功后:
- 如果字段为维度类型,则选择 Map into 作为Mapping type。
- 如果字段为量度类型,则选择 Sum 作为Mapping type。
- 已选择 Field 作为 Default 映射类型。
- 将自动为 Experience Platform数据集字段 插入相应的AEP数据集字段。
如果任何建议值不正确或不支持您的特定用例,则可以更改这些值。
因子数据集
将协调字段映射到因子数据集中的字段,这样您就可以添加因子作为模型配置的一部分。
将协调字段映射到因子数据集中的字段时,将应用以下内容:
因子名称
当您从因子数据集映射标准协调因子字段并且该因子数据集包含单个因子时,使用 Map into 作为 Mapping type 并为 Factor Name 协调字段输入默认值。
如果因子数据集包含多个因子,请使用 Case As 作为 Mapping Type 来定义因子名称协调字段和每个不同因子名称之间的映射。
因子类型
在因子数据集和架构中,此字段是可选的。 如果在因子数据集和架构中定义了 Factor type 并指定了 Internal 或External,则使用提供的值。 如果未指定值,则使用默认Internal。
值类型
在因子数据集和架构中,此字段是可选的。 如果在因子数据集和架构中定义了 Value type 并指定了 Actual 或Forecasted,则使用提供的值。 如果未指定值,则使用默认Actual。
粒度
当因子数据集中的所有因子具有相同的源粒度时,您可以为因子数据集的粒度定义数据集规则。
一旦协调了因子数据集,所有数据集就会在协调的数据集中遵循最高级别的粒度。
因子值
对于 Factor value 协调字段,使用聚合运算符之一作为Mapping Type。 在因子数据集中定义多个因子时,聚合运算符将应用于所有因子。
示例
-
您有一个因子数据集,其中包含以下示例数据:
table 0-row-3 1-row-3 2-row-3 3-row-3 4-row-3 5-row-3 6-row-3 3-align-right 7-align-right 11-align-right 15-align-right 19-align-right 23-align-right 27-align-right 时间戳 因子名称 因子值 2025年3月13日 _definedsp500 10 2025年3月13日 _cpi 20 2025年3月14日 _definedsp500 30 2025年3月14日 _cpi 40 2025年3月15日 _definedsp500 50 2025年3月15日 _cpi 60 -
您为Factor Name、Factor Value和 Granularity 定义了以下数据集规则:
-
这将产生以下统一数据:
table 0-row-4 1-row-4 2-row-4 2-align-right 7-align-right 12-align-right 因子名称 因子值 因子类型 值类型 CPI 20 内部 实际 标准普尔500指数 10 内部 实际 由于没有为 Factor Type 和 Value Type 定义数据集规则,因此使用默认值。
编辑数据集规则
要编辑数据集规则,请在Mix Modeler的
- 在
更多Dataset。 - 从上下文菜单中,选择
Edit以开始编辑数据集规则。 有关详细信息,请参阅创建数据集规则。
删除数据集规则
要删除数据集规则,请在Mix Modeler的
- 在
更多Dataset。 - 从上下文菜单中,选择
Delete以删除数据集规则。 系统会提示您进行确认。 选择 Delete 以永久删除选定的数据集规则。
同步数据
要在协调的数据与汇总数据集和/或事件数据集之间同步数据,同时在数据集规则中应用逻辑,请执行以下操作:
-
选择 Sync data。
-
从 Sync data for dataset rules 对话框中,选择
- Refresh harmonized data for summary datasets,
- Refresh harmonized data for event datasets,或
- Refresh harmonized data for both summary + event datasets。
-
要根据定义的数据集规则在数据集中的协调数据和数据之间启动同步,请选择Sync。 要取消同步,请选择Cancel。
数据合并首选项 data-merge-preferences
为了确保准确的模型预测,您可以定义数据合并首选项。 此功能使用户能够解决合并摘要级别数据和事件级别数据后的任何冲突。
您可以配置要在更新发生冲突时应用的默认量度首选项。 此默认量度可以是以下三个选项之一:
- Summary data
- Sum of summary and event data
- Event data
在协调期间,当多个数据源尝试更新给定渠道的量度字段时,将应用用户配置的默认首选项。 此首选项应用于沙盒级别,除非被另外配置的特定基于量度的首选项覆盖。
在 Metric based preferences 下,用户可以配置给定量度的特定源(Summary或Event)以及该量度的相应转化类型。
典型用例包括:
- 在多个数据集中测量和报告相同的广告量度,或
- 某些数据集中的量度测量可能不完整,而另一个数据集可能是特定量度的超集,从而导致重复计数。
配置
要配置数据合并首选项,请执行以下操作:
-
选择
[测试版]{class="badge informative"}。 -
在Data merge preferences [测试版]{class="badge informative"}对话框中:
-
选择Default metric preference。 在协调期间,如果多个数据源更新了给定渠道的量度字段,则会应用选定的默认量度首选项。 首选项应用于沙盒级别,除非针对基于特定量度的首选项被覆盖。 您可以选择介于Summary data、Event data和 Sum of summary and event data 之间。
-
要添加基于特定量度的首选项,请执行以下操作:
-
选择
Add a metric。- 从 量度选择 列表中选择一个量度。
- 选择 CHANNELS 或CONVERSION TYPES。 从列表中选择 All 或特定的渠道或转化类型。
- 选择 Summary 或 Event 以指定在合并数据时汇总数据或事件数据是否优先于量度(以及所有或选定的渠道)。
要添加一个或多个其他渠道或转化类型,请执行以下操作:
- 选择
Add a channel或 Add a conversion type。 - 选择 Summary 或 Event。
要删除渠道或转换类型,请选择
。 -
要添加基于首选项的更具体的量度,请重复上一步骤。
-
-
要删除基于现有的特定量度的首选项,请选择
。
-
-
选择 Save 以保存数据合并首选项。 数据重新同步已启动。
选择要取消的Cancel。
删除源数据集
当您删除协调数据中使用的源数据集时,该源数据集上的基础条目将从Harmonized data中删除。 但是,已删除源数据集的数据集规则仍保留在数据集规则配置列表中,其图标为
- 从上下文菜单中选择
和 View。
Dataset rule mapping - Fields对话框显示有关已删除的源数据集的信息以及数据集规则配置中使用的字段。
当您返回 Dataset rules 配置时,您会看到一个对话框,说明一个或多个源数据集已删除。 协调后的数据会在下一次临时或计划同步时受到影响。 查看数据集规则配置。
在下次特定同步或计划同步时,在不删除源数据的情况下更新协调数据。 但是,您仍会看到警告对话框,提示您根据已删除的源数据集删除数据集规则。 此警报允许用户查看和评估已删除数据集中受影响的字段。 并确定对在任何模型中可能使用的营销接触点或转化的影响。 查看并减轻此影响后,您应该从数据集规则配置列表中删除数据集规则。