[Beta 版]{class="badge informative"}

(Beta) 使用计算字段导出平面模式文件中的数组 use-calculated-fields-to-export-arrays-in-flat-schema-files

AVAILABILITY
  • Beta中当前提供了通过计算字段导出数组的功能。 文档和功能可能会发生变化。

了解如何通过计算字段将阵列从平面架构文件中的Real-Time CDP导出到云存储目标。 请阅读本文档以了解此功能启用的用例。

获取有关计算字段的丰富信息 — 这些字段是什么以及它们为什么重要。 请阅读以下链接页面,了解有关数据准备中计算字段的介绍以及有关所有可用函数的更多信息:

Platform中的数组和其他对象类型 arrays-strings-other-objects

在Experience Platform中,您可以使用XDM架构管理不同的字段类型。 以前,您可以将简单的键值对类型字段(如字符串不Experience Platform)导出到所需的目标。 以前支持导出的此类字段示例为personalEmail.addressjohndoe@acme.org

Experience Platform中的其他字段类型包括数组字段。 阅读有关Experience PlatformUI🔗中管理数组字段的更多信息。 除了以前支持的字段类型之外,您现在还可以导出数组对象,例如: organizations:[marketing, sales, engineering]。 请参阅下面的大量示例,了解如何使用各种函数访问数组的元素、将数组元素加入字符串等。

已知限制 known-limitations

请注意此功能测试版的以下已知限制:

  • 目前不支持导出到具有分层架构的JSON或Parquet文件。 您只能将数组导出为平面架构CSV、JSON和Parquet文件。
  • 此时,您只能将简单数组(或基元值数组)导出到云存储目标。 这意味着您可以导出包含字符串、int或布尔值的数组对象。 无法导出映射或对象数组。计算字段模式窗口仅显示可导出的数组。

先决条件 prerequisites

连接到所需的云存储目标,完成云存储目标的激活步骤并转到映射步骤。

如何导出计算字段 how-to-export-calculated-fields

在云存储目标的激活工作流的映射步骤中,选择​ (Beta)添加计算字段

添加在批处理激活工作流的映射步骤中突出显示的计算字段。

这将打开一个模式窗口,您可以在其中选择可用于将属性导出到Experience Platform之外的属性。

IMPORTANT
在​ 字段 ​视图中,XDM架构中的部分字段仅可用。 您可以看到字符串值以及字符串、整数和布尔值的数组。 例如,不会显示segmentMembership数组,因为它包含其他数组值。

尚未选择函数的计算字段功能的模式窗口。

例如,使用如下所示的loyaltyID字段上的join函数将忠诚度ID数组导出为CSV文件中与下划线连接的字符串。 查看🔗下方的有关此示例和其他示例的详细信息。

选定联接函数的计算字段功能的模态窗口。

选择​ 保存 ​以保留计算字段并返回映射步骤。

选定联接函数且突出显示“保存”控件的计算字段功能的模式窗口。

返回工作流的映射步骤,使用导出文件中该字段所需的列标题值填写​ 目标字段

映射步骤,目标字段突出显示。

选择目标字段2

准备就绪后,选择​ 下一步 ​以继续执行激活工作流的下一步。

映射步骤,其中目标字段高亮显示且目标值已填充。

支持的函数 supported-functions

将数据激活到基于文件的目标时,支持所有记录的数据准备功能

但是,请注意,当前仅为以下函数提供了广泛的用例描述和示例输出信息,并且这些函数仅在计算字段的Beta版本中以及目标数组支持中提供:

  • join
  • coalesce
  • size_of
  • iif
  • index-based array access
  • add_to_array
  • to_array
  • first
  • last
  • sha256
  • md5

用于导出数组的函数示例 examples

有关上面列出的某些函数,请参阅以下部分中的示例和更多信息。 对于列出的其余函数,请参阅数据准备部分🔗中的常规函数文档。

join函数以导出数组 join-function-export-arrays

使用所需的分隔符(如_|),使用join函数将数组的元素连接到字符串中。

例如,您可以使用join('_',loyalty.loyaltyID)语法将以下XDM字段组合在一起,如映射屏幕快照中所示:

  • "organizations": ["Marketing","Sales,"Finance"]数组
  • person.name.firstName字符串
  • person.name.lastName字符串
  • personalEmail.address字符串

包含连接函数的映射示例。

在这种情况下,您的输出文件将如下所示。 请注意如何使用_字符将数组的三个元素连接到单个字符串中。

`First_Name,Last_Name,Personal_Email,Organization
John,Doe,johndoe@acme.org, "Marketing_Sales_Finance"

iif函数以导出数组 iif-function-export-arrays

使用iif函数在特定条件下导出数组的元素。 例如,继续使用上面的organizations数组对象,可以编写简单的条件函数,如iif(organizations[0].equals("Marketing"), "isMarketing", "isNotMarketing")

映射示例包括iif函数。

在这种情况下,您的输出文件将如下所示。 在这种情况下,数组的第一个元素是营销,因此人员是营销部门的成员。

`First_Name,Last_Name, Personal_Email, Is_Member_Of_Marketing_Dept
John,Doe, johndoe@acme.org, "isMarketing"

add_to_array函数以导出数组 add-to-array-function-export-arrays

使用add_to_array函数将元素添加到导出的数组。 您可以将此函数与上面进一步描述的join函数组合。

使用上面的organizations数组对象继续,您可以编写函数,如source: join('_', add_to_array(organizations,"2023")),返回人员在2023年所属的组织。

映射示例包括add_to_array函数。

在这种情况下,您的输出文件将如下所示。 请注意如何使用字符_将数组的三个元素连接到单个字符串中,并将2023也附加到字符串的末尾。

`First_Name,Last_Name,Personal_Email,Organization_Member_2023
John,Doe, johndoe@acme.org,"Marketing_Sales_Finance_2023"

coalesce函数以导出数组 coalesce-function-export-arrays

使用coalesce函数访问数组的第一个非null元素并将其导出到字符串中。

例如,通过使用coalesce(subscriptions.hasPromotion)语法返回数组中false值的前true个,您可以组合下面的XDM字段,如映射屏幕快照中所示:

  • "subscriptions.hasPromotion": [null, true, null, false, true]数组
  • person.name.firstName字符串
  • person.name.lastName字符串
  • personalEmail.address字符串

包括coalesce函数的映射示例。

在这种情况下,您的输出文件将如下所示。 请注意如何在文件中导出数组中的第一个非空true值。

First_Name,Last_Name,hasPromotion
John,Doe,true

size_of函数以导出数组 sizeof-function-export-arrays

使用size_of函数指示数组中存在多少个元素。 例如,如果您有一个具有多个时间戳的purchaseTime数组对象,则可以使用size_of函数来指示某个人分别进行了多少次购买。

例如,您可以合并下面的以下XDM字段,如映射屏幕快照中所示。

  • "purchaseTime": ["1538097126","1569633126,"1601255526","1632791526","1664327526"]阵列,指示客户分别购买五次
  • personalEmail.address字符串

映射示例包括size_of函数。

在这种情况下,您的输出文件将如下所示。 请注意第二列如何指示数组中的元素数,对应于客户进行的单独购买次数。

`Personal_Email,Times_Purchased
johndoe@acme.org,"5"

基于索引的阵列访问 index-based-array-access

您可以访问数组的索引以从数组导出单个项。 例如,与上述针对size_of函数的示例类似,如果您只想在客户购买特定产品时访问和导出,则可以使用purchaseTime[0]导出时间戳的第一个元素,使用purchaseTime[1]导出时间戳的第二个元素,使用purchaseTime[2]导出时间戳的第三个元素,依此类推。

显示如何访问数组元素的映射示例。

在这种情况下,您的输出文件如下所示,在客户首次购买时导出:

`Personal_Email,First_Purchase
johndoe@acme.org,"1538097126"

firstlast函数以导出数组 first-and-last-functions-export-arrays

使用firstlast函数导出数组中的第一个或最后一个元素。 例如,使用前面示例中具有多个时间戳的purchaseTime数组对象继续,您可以使用这些对函数进行导出,以导出人员进行的首次购买或上次购买时间。

映射示例,包括第一个和最后一个函数。

在这种情况下,您的输出文件将如下所示,导出客户第一次和最后一次购买的时间:

`Personal_Email,First_Purchase, Last_Purchase
johndoe@acme.org,"1538097126","1664327526"

哈希函数 hashing-functions

除了从数组导出数组或元素的特定函数之外,您还可以使用散列函数对导出文件中的属性进行散列。 例如,如果您在属性中有任何个人身份信息,则可以在导出这些字段时对其进行哈希处理。

您可以直接散列字符串值,例如md5(personalEmail.address)。 如果需要,您还可以散列数组字段的各个元素,假定数组中的元素是字符串,如下所示: md5(purchaseTime[0])

支持的哈希函数包括:

函数
示例表达式
sha1
sha1(organizations[0])
sha256
sha256(organizations[0])
sha512
sha512(organizations[0])
hash
hash("crc32", organizations[0], "UTF-8")
md5
md5(organizations[0], "UTF-8")
crc32
crc32(organizations[0])
recommendation-more-help
7f4d1967-bf93-4dba-9789-bb6b505339d6