Adobe Experience Platform中的数据质量

Adobe Experience Platform为通过批量摄取或流式摄取上传的任何数据提供了明确定义的完整性、准确性和一致性保证。 以下文档概要介绍了中支持的批量和流式引入检查和验证行为 Experience Platform.

支持的检查

批量摄取 流式摄取
数据类型检查
枚举检查
范围检查(最小、最大)
必填字段检查
模式检查
格式检查

支持的验证行为

批量摄取和流式摄取都会通过移动错误数据以在 Data Lake. 数据摄取为批量摄取和流式摄取提供了以下验证。

批量摄取

已完成以下批量摄取验证:

验证区域 描述
架构 确保架构为 not empty并包含对并集架构的引用,如下所示: "meta:immutableTags": ["union"]
identityField 确保定义所有有效的身份描述符。
createdUser 确保允许摄取批次的用户摄取该批次。

流式摄取

对流式引入完成了以下验证:

验证区域 描述
架构 确保架构为 not empty并包含对并集架构的引用,如下所示: "meta:immutableTags": ["union"]
identityField 确保定义所有有效的身份描述符。
JSON 确保JSON有效。
IMS组织 确保列出的IMS组织是有效的组织。
源名称 确保指定数据源的名称。
数据集 确保指定、启用且未删除数据集。
标头 确保指定了标头并且有效。

有关如何 Platform 可在 监控数据流文档.

身份值验证

下表概述了为了确保身份值成功验证必须遵循的现有规则。

命名空间 验证规则 违反规则时的系统行为
ECID
  • ECID的标识值必须恰好为38个字符。
  • ECID的标识值只能由数字组成。
  • 如果ECID的标识值不完全为38个字符,则会跳过该记录。
  • 如果ECID的标识值包含非数字字符,则会跳过该记录。
非ECID 标识值不能超过1024个字符。 如果标识值超过1024个字符,则会跳过该记录。

有关 Identity Service 护栏,看 Identity Service 护栏概述.

在此页面上