拼合嵌套数据结构以用于第三方BI工具

通过第三方BI工具连接到数据库时,Adobe Experience Platform查询服务支持FLATTEN设置。 此功能可拼合第三方BI工具中的嵌套数据结构,以提高其可用性并减少检索、分析、转换和报告数据所需的工作量。

许多BI工具(如Tableau和Power BI)本身不支持嵌套数据结构。 FLATTEN设置删除了在使用临时架构时,基于您的数据创建SQL视图以提供平面版本的需要,或者删除使用查询服务CTASINSERT INTO作业将您的数据集复制到平面版本的需要。

FLATTEN设置将每个叶字段的结构提取到表的根中,并在原始命名空间之后命名该字段。 这允许您使用点表示法将字段与其体验数据模型(XDM)路径进行匹配,同时保留字段的上下文。

先决条件

使用FLATTEN设置需要您对Adobe Experience Platform的以下组件有一定的了解:

  • XDM System: XDM及其在Experience Platform中的实现的高级概述。

    • 创建临时架构:具有仅供单个数据集使用的命名字段的XDM架构称为临时架构。 临时架构用于各种数据摄取工作流中,用于Experience Platform和创建特定类型的源连接。
  • 沙盒:Experience Platform提供了将单个Platform实例划分为多个单独的虚拟环境的虚拟沙盒,以帮助开发和改进数字体验应用程序。

  • 嵌套数据结构:此文档提供了如何使用复杂数据类型(包括嵌套数据结构)创建、处理或转换数据集的示例。

使用FLATTEN设置连接到数据库 connect-with-flatten

FLATTEN设置将嵌套数据结构拼合到单独的列中,其中属性名称成为保存行值的列名称。 在不支持嵌套数据结构的BI工具中处理数据时,此设置提高了临时架构的可用性并减少了必要的工作量。

使用您选择的第三方客户端连接到查询服务时,将FLATTEN设置附加到数据库名称。 有关如何连接特定BI工具的信息,请参阅将客户端连接到查询服务概述中相应文档。 连接字符串应包含:

  • 沙盒名称。
  • 冒号后跟all或特定的数据集ID、视图ID或数据库名称。
  • 问号(?) 后跟FLATTEN关键字。

输入内容应采用以下格式:

{sandbox_name}:{all/ID/database_name}?FLATTEN

连接字符串示例可能如下所示:

prod:all?FLATTEN

示例 example

本指南中使用的示例架构使用了标准字段组Commerce详细信息,该组使用commerce对象结构和productListItems数组。 有关Commerce详细信息字段组🔗的更多信息,请参阅XDM文档。 架构结构的表示形式可以在下图中看到。

Commerce详细信息字段组的架构图,包括和结构。

如果BI工具不支持嵌套数据结构,则当嵌套字段包含序列化值(例如,示例架构中的commerceproductListItems)时,可能很难引用这些字段。 这些值可能会显示为单个编码的commerce字符串字段的一部分,并且实际上并非不可用。

以下值在格式不正确的嵌套字段中表示commerce.order.priceTotal (3018.0)、commerce.order.purchaseID (c9b5aff9-25de-450b-98f4-4484a2170180)和commerce.purchases.value (1.0)。

("(3018.0,c9b5aff9-25de-450b-98f4-4484a2170180)","(1.0)")

通过使用FLATTEN设置,您可以使用点表示法及其原始路径名访问架构中的单独字段或嵌套数据结构的整个部分。 下面给出了使用commerce字段组的格式示例。

commerce.order.priceTotal
commerce.order.purchaseID
commerce.purchases.value

在处理其他数据结构时,FLATTEN设置有一定的限制。 限制部分中提供了完整的详细信息。

为查询中的字段使用引号 quotation-marks

扁平化的根字段现在使用点表示法来匹配其XDM路径。 在查询中使用时,字段需要用引号(“ ”)括起来。

下面的SQL示例显示了嵌套查询的原始状态:

SELECT YEAR(timestamp) AS year,
       SUM(commerce.order.priceTotal) AS revenue
FROM purchase_events_dataset
WHERE commerce.purchases.value > 0
GROUP BY 1;

使用拼合数据字段时,使用点表示法编写查询并将其括在引号中,如下所示:

SELECT YEAR(timestamp) AS year,
       SUM("commerce.order.priceTotal") AS revenue
FROM purchase_events_dataset
WHERE "commerce.purchases.value" > 0
GROUP BY 1;

限制 limitations

FLATTEN设置当前未拼合以下数据结构:

数据结构
限制
数组
使用显式数组索引或EXPLODE函数访问数组。
地图
使用字符串键访问映射下的值以访问映射。

要解决Map和Array的限制,您需要使用BI工具原始SQL编辑,如Power BI中的“高级选项” — > SQL语句。

需要使用BI工具(如原始SQL编辑)来解决映射和数组限制。 请参阅有关如何使用Power BI高级选项在SQL语句部分中输入自定义SQL查询的指南。

后续步骤

本文档介绍了如何拼合嵌套数据结构以用于第三方BI工具。 如果您尚未连接客户端,请参阅客户端连接概述,以获取支持的第三方客户端列表。

recommendation-more-help
ccf2b369-4031-483f-af63-a93b5ae5e3fb