数据准备和摄入 Blueprint

数据准备和摄入 Blueprint 包含准备数据并将其摄入到 Adobe Experience Platform 的所有方法。

数据准备包括将源数据映射到体验数据模型 (XDM) 架构。它还包括对数据执行转换,包括日期格式、字段拆分/串联/转化,以及对记录进行连接/合并/重新设置键。数据准备有助于统一客户数据以提供汇总/筛选的分析,包括报告或准备数据以用于客户档案汇编/数据科学/激活。

架构

数据准备和摄入 Blueprint 的参考架构

数据摄入护栏

下图说明了将数据摄入到 Adobe Experience Platform 的平均性能护栏和延迟。

Experience Platform 数据流

数据摄入方法

摄入方法 描述
Web/Mobile SDK 延迟:
  • 实时 — 到 Edge Network 的同一页面集合
  • 流式摄入到用户档案 ~1 分钟
  • 流式摄入到数据湖(微批量 ~15 分钟)
文档:
流传输源 延迟:
  • 实时 — 到 Edge Network 的同一页面集合
  • 流式摄入到用户档案 ~1 分钟
  • 流式摄入到数据湖(微批量 ~15 分钟)
文档
流传输 API 延迟:
  • 实时 — 到 Edge Network 的同一页面集合
  • 流式摄入到用户档案 ~1 分钟
  • 流式摄入到数据湖(微批量 ~15 分钟)
  • 7 GB/小时
文档
ETL 工具 使用 ETL 工具在将企业数据摄入到 Experience Platform 之前对其进行修改和转换。

延迟:
  • 根据外部 ETL 工具的调度进行定时,然后根据摄入方法应用标准摄入护栏。
批次源 计划从源获取
延迟:~ 200 GB/小时文档视频

文档
视频教程
批处理 API 延迟:
  • 根据大小和流量负载,批次摄入到用户档案需要约 45 分钟
  • 根据大小和流量负载,批次摄入到数据湖
文档
Adobe 应用程序连接器 自动摄入来自 Adobe Experience Cloud 应用程序的数据

数据准备方法

数据准备方法 描述
数据科学工作区 - 数据准备 模型驱动的转换,脚本转换。
文档
外部 ETL 工具(Snaplogic、Mulesoft、Informatica等) 在 ETL 工具中执行复杂的转换,并使用标准 Experience Platform 流服务 API 或源连接器收集生成数据。
查询服务 - 数据准备 将数据联接、拆分、合并、转换、查询和筛选到新数据集。使用 Create Table as Select (CTAS)
文档
XDM 映射器和数据准备功能(流式和批次) 在 Experience Platform 摄入过程中,将 CSV 或 JSON 格式的源属性映射到 XDM 属性。
在摄入数据时计算有关数据的函数;即数据格式化、拆分、串联等。
文档

相关博客帖子

在此页面上