[Beta 版]{class="badge informative"}
镜像并使用基于模型的数据
本快速入门指南介绍如何使用适用于Customer Journey Analytics的Experience Platform Data Mirror,从Adobe Experience Platform中的Data Warehouse本机解决方案镜像基于模型的数据。 然后在Customer Journey Analytics中使用该数据。
要完成此用例,您需要:
-
使用Data Warehouse本机解决方案 存储您要在Experience Platform中镜像的数据。 然后,将这些数据用于Customer Journey Analytics中的报告和分析。
-
在Experience Platform中设置架构 以定义要镜像的数据的模型(架构)。
-
在Experience Platform中使用源连接器 将镜像数据导入数据集。
-
在 Customer Journey Analytics 中 设置连接。此连接应(至少)包含您的Experience Platform基于模型的数据集。
-
在 Customer Journey Analytics 中 设置数据视图 以定义要在 Analysis Workspace 中使用的量度和维度。
-
在 Customer Journey Analytics 中 设置一个项目 以构建报告和可视化图表。
Experience Platform Data Mirror for Customer Journey Analytics需要基于模型的架构。
使用Data Warehouse本机解决方案
本快速入门指南使用Google BigQuery作为Data Warehouse本机解决方案。 其他支持的解决方案为Snowflake和Azure Databricks。
在Google BigQuery内,以下示例数据在名为 eventdata 的表中存储和定期更新。
table 0-row-7 1-row-7 2-row-7 3-row-7 4-row-7 5-row-7 6-row-7 7-row-7 8-row-7 9-row-7 10-row-7 11-row-7 12-row-7 13-row-7 14-row-7 15-row-7 16-row-7 17-row-7 18-row-7 19-row-7 20-row-7 1-align-left 2-align-right 3-align-left 4-align-left 5-align-left 6-align-right 7-align-left 9-align-left 10-align-right 11-align-left 12-align-left 13-align-left 14-align-right 15-align-left 17-align-left 18-align-right 19-align-left 20-align-left 21-align-left 22-align-right 23-align-left 25-align-left 26-align-right 27-align-left 28-align-left 29-align-left 30-align-right 31-align-left 33-align-left 34-align-right 35-align-left 36-align-left 37-align-left 38-align-right 39-align-left 41-align-left 42-align-right 43-align-left 44-align-left 45-align-left 46-align-right 47-align-left 49-align-left 50-align-right 51-align-left 52-align-left 53-align-left 54-align-right 55-align-left 57-align-left 58-align-right 59-align-left 60-align-left 61-align-left 62-align-right 63-align-left 65-align-left 66-align-right 67-align-left 68-align-left 69-align-left 70-align-right 71-align-left 73-align-left 74-align-right 75-align-left 76-align-left 77-align-left 78-align-right 79-align-left 81-align-left 82-align-right 83-align-left 84-align-left 85-align-left 86-align-right 87-align-left 89-align-left 90-align-right 91-align-left 92-align-left 93-align-left 94-align-right 95-align-left 97-align-left 98-align-right 99-align-left 100-align-left 101-align-left 102-align-right 103-align-left 105-align-left 106-align-right 107-align-left 108-align-left 109-align-left 110-align-right 111-align-left 113-align-left 114-align-right 115-align-left 116-align-left 117-align-left 118-align-right 119-align-left 121-align-left 122-align-right 123-align-left 124-align-left 125-align-left 126-align-right 127-align-left 129-align-left 130-align-right 131-align-left 132-align-left 133-align-left 134-align-right 135-align-left 137-align-left 138-align-right 139-align-left 140-align-left 141-align-left 142-align-right 143-align-left 145-align-left 146-align-right 147-align-left 148-align-left 149-align-left 150-align-right 151-align-left 153-align-left 154-align-right 155-align-left 156-align-left 157-align-left 158-align-right 159-align-left 161-align-left 162-align-right 163-align-left 164-align-left 165-align-left 166-align-right 167-align-left | ||||||
---|---|---|---|---|---|---|
timestamp | ID | pagename | 个性化 | trackingcode | 订单 | 收入金额 |
2025-03-06T19:15:39+00:00 | 10001 | 主页 | person-1abc123 | abc123 | ||
2025-03-06T19:15:39+00:00 | 10002 | 确认页面 | person-1abc123 | 1 | 174.25 | |
2025-03-06T19:15:39+00:00 | 10003 | 主页 | person-2def123 | def123 | ||
2025-03-06T19:15:39+00:00 | 10004 | 主页 | person-3ghi123 | ghi123 | ||
2025-03-06T19:15:39+00:00 | 10005 | 确认页面 | person-3ghi123 | 1 | 149.25 | |
2025-03-06T19:15:39+00:00 | 10006 | 主页 | person-4abc456 | abc456 | ||
2025-03-06T19:15:39+00:00 | 10007 | 主页 | person-5def456 | def456 | ||
2025-03-06T19:15:39+00:00 | 10008 | 主页 | person-6ghi456 | ghi456 | ||
2025-03-06T19:15:39+00:00 | 10009 | 确认页面 | person-6ghi456 | 1 | 159.25 | |
2025-03-06T19:15:39+00:00 | 10010 | 主页 | person-7abc789 | abc789 | ||
2025-03-06T19:15:39+00:00 | 10011 | 主页 | person-8def789 | def789 | ||
2025-03-06T19:15:39+00:00 | 10012 | 主页 | person-9ghi789 | ghi789 | ||
2025-03-06T19:15:39+00:00 | 10013 | 确认页面 | person-9ghi789 | 1 | 124.25 | |
2025-03-06T19:15:39+00:00 | 10014 | 主页 | person-10abc987 | abc987 | ||
2025-03-06T19:15:39+00:00 | 10015 | 主页 | person-11def987 | def987 | ||
2025-03-06T19:15:39+00:00 | 10016 | 主页 | person-12ghi987 | ghi987 | ||
2025-03-06T19:15:39+00:00 | 10017 | 主页 | person-13abc654 | abc654 | ||
2025-03-06T19:15:39+00:00 | 10018 | 主页 | person-14def654 | def654 | ||
2025-03-06T19:15:39+00:00 | 10019 | 主页 | person-15ghi654 | ghi654 | ||
2025-03-06T19:15:39+00:00 | 10020 | 确认页面 | person-15ghi654 | 1 | 174.25 |
该数据存储在具有关联模式的数据库表中。 检查数据库表:
-
登录到Google BigQuery。
-
选择 BigQuery > 工作室。
-
选择您的项目、数据集和表。 在 架构 选项卡中,您会看到事件数据的架构概述。
要检查数据:
-
选择 查询。
-
在查询编辑器中运行示例查询,其中
project
是项目的名称,datasets
是数据集的名称:code language-sql SELECT * FROM `project.datasets.eventdata` LIMIT 100
对于Experience Platform Data Mirror for Customer Journey Analytics,必须为更改历史记录启用Data Warehouse本机解决方案中的表。 要验证是否已为更改历史记录启用该表,请执行以下操作:
-
在查询编辑器中运行以下SQL语句以检查设置,其中
project
是项目的名称,datasets
是数据集的名称:code language-sql SELECT table_name, MAX(CASE WHEN option_name = 'enable_change_history' THEN option_value END) AS enable_change_history FROM `project.datasets.INFORMATION_SCHEMA.TABLE_OPTIONS` WHERE table_name = 'eventdata' GROUP BY table_name ORDER BY table_name;
-
如果结果不是 TRUE,请使用以下SQL语句启用更改历史记录,其中
project
是项目的名称,datasets
是数据集的名称:code language-sql ALTER TABLE `project.datasets.eventdata` SET OPTIONS (enable_change_history = TRUE);
您的Data Warehouse本机解决方案中的表中的数据已准备好用于Experience Platform Data Mirror for Customer Journey Analytics。
设置架构
要在Experience Platform中镜像数据,您必须首先定义数据的架构。 您要在Experience Platform中镜像并使用Experience Platform Data Mirror for Customer Journey Analytics的所有数据都必须符合基于模型的架构。
定义用于对此数据进行建模的架构。 设置您的架构:
-
在Adobe Experience Platform UI的左边栏中,选择 数据管理 中的 架构。
-
选择 创建架构。
-
从下拉菜单中,选择 基于模型。
-
如果您看到一个弹出窗口,其中提供了在 手动创建 或 上传DDL文件 之间选择的选项:
-
选择 选择手动创建。
-
选择 下一步。
-
-
在 架构 > 创建基于模型的架构 界面中:
-
输入 架构显示名称。 例如:
Sample Event Feed Schema
。 -
输入 描述。 例如:
Sample event feed schema for a model-based schema
。 -
选择 时间序列 作为 架构行为。 您为基于时间序列的数据选择 时间序列,为基于记录的数据选择 记录。 行为定义架构的结构和包含的属性。
适用于Customer Journey Analytics的Experience Platform Data Mirror主要用于时间序列数据(例如事件数据)。
-
选择 完成。
-
-
在 架构 > 示例事件馈送架构 界面中,您会看到一则警告,指出基于模型的架构支持作为更改行的摄取。
作为更改行的摄取也称为更改数据捕获(CDC)。 要支持变更数据捕获,架构需要:
- 主键。
- 版本描述符。
- 时间序列数据的时间戳描述符。
-
选择
table 0-row-4 1-row-4 2-row-4 3-row-4 4-row-4 5-row-4 6-row-4 7-row-4 字段名称 显示名称 类型 其他属性 id
Id
整数 orders
Orders
整数 pagename
Page Name
字符串 personid
Person Id
字符串
为标识命名空间选择CRMID。revenueamount
Revenue Amount
双精度 timestamp
Timestamp
日期时间 trackingcode
Tracking Code
字符串 -
id 字段配置为 版本描述符。
-
已将 personid 字段与 时间戳 一起配置为 主键。 选择
personid 字段也配置为 标识,将 CRMID 配置为 标识命名空间。
-
已将 timestamp 字段与 personid 字段一起配置为 主键。 时间戳 字段也配置为 时间戳描述符。 对于基于时间序列模型的数据,您只需要将字段定义为 时间戳描述符。
如果您已正确定义 主键、版本描述符 和 时间戳描述符,则架构定义顶部的警告将消失。
-
-
选择 保存 以保存架构。
使用源连接器
使用源连接器将Data Warehouse本机解决方案连接到Experience Platform。
在Experience Platform界面中:
- 选择 源。
- 选择或搜索 Google BigQuery。
- 选择 添加数据。
添加数据向导将指导您完成以下步骤,将数据从Google BigQuery中的表连接到Experience Platform。
身份验证
在 身份验证 步骤中,选择:
-
现有帐户(您已设置Google BigQuery的帐户)。 继续执行选择数据步骤。
-
需要连接到Google BigQuery时 新帐户。
-
指定 帐户名 和(可选)描述。
-
选择您的 身份验证类型: 基本身份验证 或 服务身份验证。 根据您的选择,提供所需的输入。
-
选择 连接到源
已验证您的连接。
-
选择 下一步。
有关在使用Azure Databricks或Snowflake连接器时如何连接和身份验证的详细信息,请参阅Experience Platform文档。
-
选择数据
在 选择数据 步骤中:
-
从表列表中选择表。 例如: eventdata。
您会看到为验证而显示的数据示例。
-
选择 下一步 以继续。
数据流详细信息
在 数据流详细信息 步骤中:
-
选择 启用变更数据捕获。 显示 变更数据捕获要求 信息框,其中包含更多信息。
-
为 目标数据集 选择 新数据集 以创建包含镜像数据的新数据集。
-
输入 输出数据集名称。 例如:
event-data-mirror
。 -
从 架构 下拉菜单中选择您之前创建的基于模型的架构。 例如:示例事件信息源架构。
-
指定其他详细信息。
-
选择 下一步。
映射
在 映射 步骤中:
-
映射字段。 从Google BigQuery中的架构(Source数据)到您在Experience Platform中定义的架构中的字段(目标字段)。
-
如果所有字段均正确映射,请选择 下一步 以继续。
日程计划
在 计划 步骤中:
-
指定 频率 和 间隔 以计划镜像数据的同步。
-
为计划指定 开始时间。
-
选择 下一步 以继续。
请查看
在 审核 步骤中。
-
查看源连接器的配置。
-
选择 完成。 您将被定向到配置的数据流。
设置连接
在本快速入门指南中,您将创建一个新连接以使用来自Experience Platform的镜像数据。 或者,可以将镜像数据添加到现有连接中。
在Customer Journey Analytics界面中:
-
从 数据管理 菜单中选择 连接。
-
选择 创建新连接。
-
指定所需的 连接名称、沙盒、平均每日事件数 以及其他可选参数。
-
选择 添加数据集。
-
在 添加数据集 的 选择数据集 步骤中:
-
选择包含镜像数据的数据集。 例如: event-data-mirror。 数据集具有 模型 作为 数据集类型。
-
添加与连接相关的任何其他数据集。
-
选择 下一步。
-
-
在 添加数据集 的 数据集设置 步骤中:
对于 event-data-mirror 基于模型的数据集
-
选择 事件 作为 数据集类型。
-
选择 人员ID 字段作为 人员ID。
-
时间戳 自动填充为 时间戳。
-
选择 其他 作为 数据源类型。
-
输入
Google BigQuery Event Data
作为 数据源描述。 -
指定其他详细信息,如 导入所有新数据 和 回填所有现有数据。
(可选)指定其他数据集的详细信息。
-
-
选择 添加数据集。
-
-
选择 保存。
创建连接后,您可以执行各种管理任务。 例如选择和组合数据集、检查连接数据集的状态以及数据摄取的状态等等。
设置数据视图
创建您的数据视图:
-
在Customer Journey Analytics界面中,从顶部菜单中选择 数据视图(可选)从 数据管理 中选择。
-
选择 创建新数据视图。
-
在 配置 步骤中:
-
从 连接 列表中选择您的连接。
-
名称并(可选)描述您的连接。
-
选择 保存并继续。
-
-
在 组件 步骤中:
-
将您要包含的任何架构字段和/或标准组件添加到 METRICS 或 DIMENSIONS 组件框中。 确保从包含镜像数据的数据集中添加相关字段。 要访问这些字段,请执行以下操作:
-
选择 事件数据集。
-
选择 临时和基于模型的字段。
-
将基于模型的架构中的字段拖放到 METRICS 或 DIMENSIONS 上。
-
-
为不具有相应类型、格式不正确或由于其他原因要修改的字段定义派生字段。 例如,对于 收入金额。
-
选择 创建派生字段。
-
在派生字段编辑器中:
-
定义新的
Revenue Amount (Numeric)
字段,如下所示。 -
选择 保存。
-
-
将新的 收入金额(数字) 派生字段拖放到 METRICS 中。
-
-
选择 保存并继续。
-
-
在 设置 步骤中:
保持设置不变并选择 保存并完成。
有关如何创建和编辑数据视图的更多信息,请参阅数据视图概述。 以及在数据视图中使用哪些组件以及如何使用区段和会话设置。
设置项目
Analysis Workspace是一款灵活的浏览器工具,允许您快速构建分析并根据数据分享见解。 您可以使用工作区项目来组合数据组件、表和可视化,以制作分析并与组织中的任何人共享。
要创建您的项目:
-
在Customer Journey Analytics界面中,从顶部菜单中选择 Workspace。
-
选择左侧导航中的 项目。
-
选择 创建项目。 在弹出窗口中:
-
选择 空白Workspace项目。
-
选择 创建。
-
-
要创建您的第一个报表,请将维度和量度拖放到 自由格式 面板的 自由格式表 上。 例如,将 收入金额(数字) 拖动到 将量度拖动到此处。 并拖动 PersonId 并将该字段放在第一列标题上。 根据需要进行其他调整。
最终结果是基于源自Google BigQuery表的镜像数据的用户档案及其收入概述。
请参阅 Analysis Workspace 概述,了解有关如何使用组件、可视化和面板创建项目和构建分析的更多信息。