[Beta 版]{class="badge informative"}
(Beta) 使用计算字段导出平面模式文件中的数组 use-calculated-fields-to-export-arrays-in-flat-schema-files
- Beta中当前提供了通过计算字段导出数组的功能。 文档和功能可能会发生变化。
了解如何通过计算字段将阵列从平面架构文件中的Real-Time CDP导出到云存储目标。 请阅读本文档以了解此功能启用的用例。
获取有关计算字段的丰富信息 — 这些字段是什么以及它们为什么重要。 请阅读以下链接页面,了解有关数据准备中计算字段的介绍以及有关所有可用函数的更多信息:
Platform中的数组和其他对象类型 arrays-strings-other-objects
在Experience Platform中,您可以使用XDM架构管理不同的字段类型。 以前,您可以将简单的键值对类型字段(如字符串不Experience Platform)导出到所需的目标。 以前支持导出的此类字段示例为personalEmail.address
:johndoe@acme.org
。
Experience Platform中的其他字段类型包括数组字段。 阅读有关Experience PlatformUI🔗中管理数组字段的更多信息。 除了以前支持的字段类型之外,您现在还可以导出数组对象,例如: organizations:[marketing, sales, engineering]
。 请参阅下面的大量示例,了解如何使用各种函数访问数组的元素、将数组元素加入字符串等。
已知限制 known-limitations
请注意此功能测试版的以下已知限制:
- 目前不支持导出到具有分层架构的JSON或Parquet文件。 您只能将数组导出为平面架构CSV、JSON和Parquet文件。
- 此时,您只能将简单数组(或基元值数组)导出到云存储目标。 这意味着您可以导出包含字符串、int或布尔值的数组对象。 无法导出映射或对象数组。计算字段模式窗口仅显示可导出的数组。
先决条件 prerequisites
将连接到所需的云存储目标,完成云存储目标的激活步骤并转到映射步骤。
如何导出计算字段 how-to-export-calculated-fields
在云存储目标的激活工作流的映射步骤中,选择 (Beta)添加计算字段。
这将打开一个模式窗口,您可以在其中选择可用于将属性导出到Experience Platform之外的属性。
segmentMembership
数组,因为它包含其他数组值。
例如,使用如下所示的loyaltyID
字段上的join
函数将忠诚度ID数组导出为CSV文件中与下划线连接的字符串。 查看🔗下方的有关此示例和其他示例的详细信息。
选择 保存 以保留计算字段并返回映射步骤。
返回工作流的映射步骤,使用导出文件中该字段所需的列标题值填写 目标字段。
准备就绪后,选择 下一步 以继续执行激活工作流的下一步。
支持的函数 supported-functions
将数据激活到基于文件的目标时,支持所有记录的数据准备功能。
但是,请注意,当前仅为以下函数提供了广泛的用例描述和示例输出信息,并且这些函数仅在计算字段的Beta版本中以及目标数组支持中提供:
join
coalesce
size_of
iif
index-based array access
add_to_array
to_array
first
last
sha256
md5
用于导出数组的函数示例 examples
有关上面列出的某些函数,请参阅以下部分中的示例和更多信息。 对于列出的其余函数,请参阅数据准备部分🔗中的常规函数文档。
join
函数以导出数组 join-function-export-arrays
使用所需的分隔符(如_
或|
),使用join
函数将数组的元素连接到字符串中。
例如,您可以使用join('_',loyalty.loyaltyID)
语法将以下XDM字段组合在一起,如映射屏幕快照中所示:
"organizations": ["Marketing","Sales,"Finance"]
数组person.name.firstName
字符串person.name.lastName
字符串personalEmail.address
字符串
在这种情况下,您的输出文件将如下所示。 请注意如何使用_
字符将数组的三个元素连接到单个字符串中。
`First_Name,Last_Name,Personal_Email,Organization
John,Doe,johndoe@acme.org, "Marketing_Sales_Finance"
iif
函数以导出数组 iif-function-export-arrays
使用iif
函数在特定条件下导出数组的元素。 例如,继续使用上面的organizations
数组对象,可以编写简单的条件函数,如iif(organizations[0].equals("Marketing"), "isMarketing", "isNotMarketing")
。
在这种情况下,您的输出文件将如下所示。 在这种情况下,数组的第一个元素是营销,因此人员是营销部门的成员。
`First_Name,Last_Name, Personal_Email, Is_Member_Of_Marketing_Dept
John,Doe, johndoe@acme.org, "isMarketing"
add_to_array
函数以导出数组 add-to-array-function-export-arrays
使用add_to_array
函数将元素添加到导出的数组。 您可以将此函数与上面进一步描述的join
函数组合。
使用上面的organizations
数组对象继续,您可以编写函数,如source: join('_', add_to_array(organizations,"2023"))
,返回人员在2023年所属的组织。
在这种情况下,您的输出文件将如下所示。 请注意如何使用字符_
将数组的三个元素连接到单个字符串中,并将2023也附加到字符串的末尾。
`First_Name,Last_Name,Personal_Email,Organization_Member_2023
John,Doe, johndoe@acme.org,"Marketing_Sales_Finance_2023"
coalesce
函数以导出数组 coalesce-function-export-arrays
使用coalesce
函数访问数组的第一个非null元素并将其导出到字符串中。
例如,通过使用coalesce(subscriptions.hasPromotion)
语法返回数组中false
值的前true
个,您可以组合下面的XDM字段,如映射屏幕快照中所示:
"subscriptions.hasPromotion": [null, true, null, false, true]
数组person.name.firstName
字符串person.name.lastName
字符串personalEmail.address
字符串
在这种情况下,您的输出文件将如下所示。 请注意如何在文件中导出数组中的第一个非空true
值。
First_Name,Last_Name,hasPromotion
John,Doe,true
size_of
函数以导出数组 sizeof-function-export-arrays
使用size_of
函数指示数组中存在多少个元素。 例如,如果您有一个具有多个时间戳的purchaseTime
数组对象,则可以使用size_of
函数来指示某个人分别进行了多少次购买。
例如,您可以合并下面的以下XDM字段,如映射屏幕快照中所示。
"purchaseTime": ["1538097126","1569633126,"1601255526","1632791526","1664327526"]
阵列,指示客户分别购买五次personalEmail.address
字符串
在这种情况下,您的输出文件将如下所示。 请注意第二列如何指示数组中的元素数,对应于客户进行的单独购买次数。
`Personal_Email,Times_Purchased
johndoe@acme.org,"5"
基于索引的阵列访问 index-based-array-access
您可以访问数组的索引以从数组导出单个项。 例如,与上述针对size_of
函数的示例类似,如果您只想在客户购买特定产品时访问和导出,则可以使用purchaseTime[0]
导出时间戳的第一个元素,使用purchaseTime[1]
导出时间戳的第二个元素,使用purchaseTime[2]
导出时间戳的第三个元素,依此类推。
在这种情况下,您的输出文件如下所示,在客户首次购买时导出:
`Personal_Email,First_Purchase
johndoe@acme.org,"1538097126"
first
和last
函数以导出数组 first-and-last-functions-export-arrays
使用first
和last
函数导出数组中的第一个或最后一个元素。 例如,使用前面示例中具有多个时间戳的purchaseTime
数组对象继续,您可以使用这些对函数进行导出,以导出人员进行的首次购买或上次购买时间。
在这种情况下,您的输出文件将如下所示,导出客户第一次和最后一次购买的时间:
`Personal_Email,First_Purchase, Last_Purchase
johndoe@acme.org,"1538097126","1664327526"
哈希函数 hashing-functions
除了从数组导出数组或元素的特定函数之外,您还可以使用散列函数对导出文件中的属性进行散列。 例如,如果您在属性中有任何个人身份信息,则可以在导出这些字段时对其进行哈希处理。
您可以直接散列字符串值,例如md5(personalEmail.address)
。 如果需要,您还可以散列数组字段的各个元素,假定数组中的元素是字符串,如下所示: md5(purchaseTime[0])
支持的哈希函数包括:
sha1
sha1(organizations[0])
sha256
sha256(organizations[0])
sha512
sha512(organizations[0])
hash
hash("crc32", organizations[0], "UTF-8")
md5
md5(organizations[0], "UTF-8")
crc32
crc32(organizations[0])