Adobe Experience Platform中的数据质量

Adobe Experience Platform为通过批量摄取或流式摄取上传的任何数据提供了完整、准确和一致的明确定义保证。 以下文档汇总了Experience Platform中支持批量摄取和流式摄取的检查和验证行为。

支持的检查

批量摄取
流式摄取
数据类型检查
枚举检查
范围检查(最小、最大)
必填字段检查
图案检查
格式检查

支持的验证行为

通过将不良数据移动到Data Lake中进行检索和分析,批次摄取和流式摄取都会防止故障数据向下游传输。 数据摄取为批量摄取和流式摄取提供了以下验证。

批量摄取

对批量摄取会完成以下验证:

验证区域
描述
架构
确保架构为​ ​空并包含对合并架构的引用,如下所示: "meta:immutableTags": ["union"]
identityField
确保已定义所有有效的身份描述符。
createdUser
确保允许提取批次的用户提取批次。

流式摄取

对流式摄取执行以下验证:

验证区域
描述
架构
确保架构为​ ​空并包含对合并架构的引用,如下所示: "meta:immutableTags": ["union"]
identityField
确保已定义所有有效的身份描述符。
JSON
确保JSON有效。
组织
确保列出的组织是有效的。
源名称
确保指定了数据源的名称。
数据集
确保指定、启用且未移除数据集。
标头
确保标头已指定并且有效。

有关Platform如何监视和验证数据的详细信息,请参阅监视数据流文档

身份值验证

下表概述了必须遵循的现有规则,以确保成功验证标识值。

命名空间
验证规则
违反规则时的系统行为
ECID
  • ECID的标识值必须刚好38个字符。
  • ECID的标识值必须仅由数字组成。
  • 如果ECID的标识值不完全为38个字符,则会跳过该记录。
  • 如果ECID的标识值包含非数字字符,则会跳过记录。
非ECID
标识值不能超过1024个字符。
如果标识值超过1024个字符,则会跳过该记录。

有关Identity Service护栏的详细信息,请参阅Identity Service 护栏概述

recommendation-more-help
2ee14710-6ba4-4feb-9f79-0aad73102a9a