数据集UI指南

本用户指南提供了在Adobe Experience Platform用户界面中使用数据集时执行常用操作的说明。

快速入门

本用户指南要求您对Adobe Experience Platform的以下组件有一定的了解:

查看数据集 view-datasets

在Experience Platform UI中,从左侧导航中选择​ 数据集 ​以打开​ 数据集 ​仪表板。 仪表板列出您组织的所有可用数据集。 会显示每个列出数据集的详细信息,包括其名称、数据集所遵循的架构以及最近摄取运行的状态。

左侧导航栏中突出显示了数据集项的Platform UI。

从浏览选项卡中选择数据集的名称以访问其​ 数据集活动 ​屏幕,并查看所选数据集的详细信息。 活动选项卡包含一个图表,其中可查看消息使用率,以及成功批次和失败批次的列表。

选定数据集的量度和可视化图表突出显示。
与选定数据集相关的示例批次突出显示。

更多操作 more-actions

您可以从数据集详细信息视图中删除或为配置文件启用数据集。 要查看可用的操作,请选择​ …UI右上角的更多。 出现下拉菜单。

具有的数据集工作区……其他下拉菜单突出显示。

如果选择​ 为配置文件 ​启用数据集,则会显示确认对话框。 选择​ 启用 ​以确认您的选择。

NOTE
要为配置文件启用数据集,数据集所遵循的架构必须兼容,才能在实时客户配置文件中使用。 有关详细信息,请参阅为配置文件启用数据集。

启用数据集确认对话框。

如果选择​ 删除,将显示删除数据集确认对话框。 选择​ 删除 ​以确认您的选择。

NOTE
您无法删除系统数据集。

您还可以从浏览选项卡上的内联操作中删除数据集或添加数据集以用于实时客户配置文件。 有关详细信息,请参阅内联操作部分

删除数据集确认对话框。

内联数据集操作 inline-actions

数据集UI现在为每个可用数据集提供一组内联操作。 选择要管理的数据集的省略号(…)可在弹出菜单中查看可用选项。 可用的操作包括:

有关这些可用操作的更多信息,请参阅其各自部分。 要了解如何同时管理大量数据集,请参阅批量操作部分。

预览数据集 preview

您可以从浏览选项卡的内联选项以及数据集活动视图中预览数据集样本数据。 从浏览选项卡中,选择要预览的数据集名称旁边的省略号(…)。 出现一个选项菜单列表。 接下来,从可用选项列表中选择​ 预览数据集。 如果数据集为空,则预览链接将被停用,并改为表示预览不可用。

选定数据集的“数据集”工作区的“浏览”选项卡,其中突出显示了省略号和预览数据集选项。

这将打开预览窗口,其中数据集的架构的分层视图显示在右侧。

NOTE
视图左侧的架构图仅显示包含数据的字段。 无数据的字段会自动隐藏,以简化UI并专注于相关信息。

将显示数据集预览对话框,其中包含有关数据集的结构信息以及示例值。

或者,从​ 数据集活动 ​屏幕中,选择屏幕右上角附近的​ 预览数据集 ​以预览最多100行数据。

预览数据集按钮突出显示。

对于更可靠的数据访问方法,Experience Platform提供下游服务,如Query Service和JupyterLab,以浏览和分析数据。 有关详细信息,请参阅以下文档:

在数据集上管理和强制执行数据治理 manage-and-enforce-data-governance

您可以通过选择浏览选项卡的内联选项来管理数据集的数据治理标签。 选择要管理的数据集名称旁边的省略号(…),然后从下拉菜单中选择​ 管理数据和访问标签

通过在架构级别应用数据使用标签,您可以根据应用于该数据的使用策略对数据集和字段进行分类。 请参阅数据管理概述以了解有关标签的更多信息,或参阅数据使用标签用户指南以了解有关如何将标签应用于架构以传播到数据集的说明。

为实时客户个人资料启用数据集 enable-profile

每个数据集都能够使用其摄取的数据扩充客户用户档案。 为此,数据集所遵循的架构必须兼容才能在Real-Time Customer Profile中使用。 兼容的架构满足以下要求:

  • 架构至少有一个指定为标识属性的属性。
  • 架构具有定义为主标识的标识属性。

有关为Profile启用架构的更多信息,请参阅架构编辑器用户指南

您可以从浏览选项卡的内联选项以及数据集活动视图中启用配置文件的数据集。 从数据集工作区的浏览选项卡中,选择要为配置文件启用的数据集的省略号。 出现一个选项菜单列表。 接下来,从可用选项列表中选择​ 启用统一配置文件

突出显示省略号和启用统一配置文件的数据集工作区的“浏览”选项卡。

或者,从数据集的​ 数据集活动 ​屏幕中,选择​ 属性 ​列中的​ 配置文件 ​切换开关。 启用后,还将使用摄取到数据集的数据来填充客户配置文件。

NOTE
如果某个数据集已包含数据,然后为Profile启用,则Profile不会自动使用现有数据。 为Profile启用数据集后,建议您重新摄取任何现有数据,以使其贡献到客户个人资料。

数据集详细信息页面中高亮显示配置文件切换。

也可通过此条件筛选为配置文件启用的数据集。 请参阅有关如何筛选启用配置文件的数据集的部分,以获取更多信息。

管理数据集标记 manage-tags

添加自定义创建的标记以组织数据集并改进搜索、筛选和排序功能。 从数据集工作区的浏览选项卡中,选择要管理的数据集的省略号,然后从下拉菜单中选择​ 管理标记

选定数据集的“数据集”工作区的“浏览”选项卡(带有省略号和“管理标记”选项)突出显示。

出现管理标记对话框。 输入简短描述以创建自定义标记,或从预先存在的标记中选择以标记您的数据集。 选择​ 保存 ​以确认您的设置。

突出显示自定义标记的“管理标记”对话框。

管理标记对话框也可以从数据集中删除现有标记。 只需选择要删除的标记旁边的“x”并选择​ 保存 ​即可。

将标记添加到数据集后,可以根据相应的标记过滤数据集。 有关详细信息,请参阅有关如何按标记筛选数据集的部分。

有关如何对业务对象进行分类以便于发现和分类的详细信息,请参阅管理元数据分类指南。 本指南详细介绍具有适当权限的用户如何在Platform UI中创建预定义标记、为标记分配类别以及执行标记和标记类别的所有相关CRUD操作。

(Beta)设置数据保留策略 data-retention-policy

AVAILABILITY
数据保留设置当前为测试版,仅在​ 有限版本 ​中可供选定组织使用。 您的UI可能无法反映下面描述的功能。

从数据集工作区的浏览选项卡管理数据集级别的数据集到期和保留策略。 您可以使用此功能为已摄取到Data Lake和Profile Services中的数据配置保留策略。 到期日期基于数据摄取到Platform中的时间和您的保留规则。

要打开设置数据保留对话框,请从下拉菜单中选择数据集旁边的省略号,然后选择​ 设置数据保留策略

带有省略号的数据集工作区的“浏览”选项卡和突出显示的设置数据保留策略选项。

出现设置数据保留对话框。 该对话框显示沙盒级别的许可证使用量度、数据集级别的详细信息和数据湖设置。 这些量度显示您的使用情况与您的授权。 数据集详细信息包括数据集名称、类型、配置文件启用状态和当前数据湖存储使用情况。

NOTE
沙盒级别许可的数据湖存储指标仍在开发中,不可用。

设置数据保留对话框。

在配置数据集保留策略之前,该对话框显示建议的保留设置。 默认建议保留期为一个月。 要调整标准保留策略,请选择并更新数字,然后选择所需的时段(天、月、年)。 您可以单独配置数据湖和配置文件服务的保留设置。

NOTE
数据湖的最短数据保留时间为30天。 配置文件服务的最短数据保留持续时间为一天。

包含持续时间下拉列表和突出显示的保存的“设置数据保留”对话框。

有关定义数据集过期日期范围的规则和配置数据保留策略的最佳实践的更多信息,请参阅常见问题页面

(Beta)提高了保留期和存储指标的可见性 retention-and-storage-metrics

Beta版用户可以使用四个新列,以便更清楚地了解您的数据管理:数据湖存储数据湖保留配置文件存储 ​和​ 配置文件保留。 这些量度显示数据在Data Lake和Profile服务中占用的存储量及其保留持续时间。 这些详细信息可帮助您优化保留策略,根据权利跟踪使用情况,并确保遵守组织和法规标准。 这种更高的可见性使您能够做出明智的决策、管理成本、简化治理并清楚地了解您的数据环境。

数据集工作区的“浏览”选项卡,其中突出显示了四个新的存储和保留列。

下表概述了测试版中可用的新保留和存储指标。 它详细介绍了每列的用途以及它如何帮助在Platform UI中管理数据保留和存储。

列标题
描述
数据湖保留
显示每个数据集的当前保留持续时间。 可以在每个数据集的保留设置中修改此值。数据湖保留策略可设置规则来确定数据存储的时间长度以及应在不同服务中删除数据的时间。
数据湖存储
显示数据湖中每个数据集的当前存储使用情况。 此量度有助于跟踪每个数据集占用的空间,从而有助于管理存储限制和优化利用率。
配置文件存储
显示配置文件服务中每个数据集的当前存储使用情况。 使用此信息可监控存储消耗并确保它符合您的数据管理目标。
配置文件保留
指示每个配置文件数据集的保留持续时间。 可以在数据集的保留设置中调整此值,帮助您控制配置文件数据在删除前的存储时间。

移至文件夹 move-to-folders

您可以将数据集放在文件夹中,以便更好地管理数据集。 要将数据集移动到文件夹中,请选择要管理的数据集名称旁边的省略号(…),然后从下拉菜单中​ 移动到文件夹

突出显示带有椭圆形和移动到文件夹的数据集仪表板。

出现将数据集移动到文件夹对话框。 选择要将受众移动到的文件夹,然后选择​ 移动。 弹出通知会告知您已成功移动数据集。

突出显示带有移动的移动数据集对话框。

TIP
您还可以直接从“移动数据集”对话框创建文件夹。 要创建文件夹,请选择创建文件夹图标( 创建文件夹图标)。 )。
突出显示了移动数据集对话框(创建文件夹图标)。

数据集位于文件夹中后,您可以选择仅显示属于特定文件夹的数据集。 要打开文件夹结构,请选择显示文件夹图标( 显示文件夹图标 )。 接下来,选择您选择的文件夹以查看所有关联的数据集。

显示数据集文件夹结构的数据集仪表板、显示文件夹图标和突出显示的选定文件夹。

删除数据集 delete

您可以从浏览选项卡或数据集活动视图右上角的数据集内联操作中删除数据集。 从浏览视图中,选择要删除的数据集名称旁边的省略号(…)。 出现一个选项菜单列表。 接下来,从下拉菜单中选择​ 删除

选定数据集的“数据集”工作区的“浏览”选项卡上带有省略号,且“删除”选项突出显示。

将显示确认对话框。 选择​ 删除 ​以确认。

或者,从​ 数据集活动 ​屏幕中选择​ 删除数据集

NOTE
无法删除由Adobe应用程序和服务(如Adobe Analytics、Adobe Audience Manager或Offer Decisioning)创建和使用的数据集。

“删除数据集”按钮在数据集详细信息页面中突出显示。

将出现一个确认框。 选择​ 删除 ​以确认删除数据集。

将显示删除的确认模式,并突出显示删除按钮。

删除启用配置文件的数据集

如果为配置文件启用了某个数据集,则通过UI删除该数据集会将其从数据湖、身份服务以及配置文件存储中与该数据集关联的任何配置文件数据中删除。

您可以使用实时客户个人资料API从Profile存储中删除与数据集关联的个人资料数据(将数据保留在数据湖中)。 有关详细信息,请参阅配置文件系统作业API终结点指南

搜索和筛选数据集 search-and-filter

要搜索或筛选可用数据集的列表,请选择筛选器图标( 筛选器图标)。 )。 左边栏中显示一组过滤器选项。 有多种方法可用于筛选可用数据集。 这些包括:显示系统数据集包含在配置文件中、标记创建日期修改日期、创建者架构

应用的过滤器列表显示在过滤结果上方。

已应用筛选器列表突出显示的数据集工作区的“浏览”选项卡。

显示系统数据集 show-system-datasets

默认情况下,仅显示已摄取数据的数据集。 如果要查看系统生成的数据集,请选择显示系统数据集部分中的​ ​复选框。 系统生成的数据集仅用于处理其他组件。 例如,系统生成的配置文件导出数据集用于处理配置文件仪表板。

突出显示显示系统数据集节的数据集工作区的筛选器选项。

启用筛选配置文件的数据集 filter-profile-enabled-datasets

为配置文件数据启用的数据集用于在引入数据后填充客户配置文件。 请参阅有关为配置文件启用数据集的部分以了解详情。

要根据是否已为配置文件启用数据集来筛选数据集,请从筛选选项中选择是复选框。

已突出显示包含在配置文件部分的数据集工作区的筛选器选项。

按标记筛选数据集 filter-by-tag

在标记输入中输入您的自定义标记名称,然后从可用选项列表中选择您的标记,以搜索和筛选与该标记对应的数据集。

数据集工作区的筛选器选项,突出显示标记输入和筛选器图标。

按创建日期筛选数据集 filter-by-creation-date

可以在自定义时段内按创建日期筛选数据集。 这可用于排除历史数据或生成特定的按时间顺序排列的数据洞察和报表。 通过选择每个字段的日历图标,选择开始日期和结束日期。 之后,只有符合该条件的数据集才会显示在浏览选项卡中。

按修改日期筛选数据集 filter-by-modified-date

与创建日期过滤器类似,您可以根据上次修改数据集的日期来筛选数据集。 在修改日期部分中,通过选择每个字段的日历图标来选择开始日期和结束日期。 之后,只有在该时段修改的数据集才会显示在浏览选项卡中。

按架构筛选 filter-by-schema

您可以根据定义数据集结构的架构筛选数据集。 选择下拉图标或将架构名称输入文本字段。 此时将显示一个潜在匹配项列表。 从列表中选择相应的架构。

批量操作 bulk-actions

使用批量操作提高操作效率,并对大量数据集同时执行多项操作。 您可以通过批量操作(如移动到文件夹编辑标记删除数据集)来节省时间并保持有条理的数据结构。

要一次处理多个数据集,请选中每行带有复选框的单个数据集,或选中带有列标题的整个页面。 选中后,将出现批量操作栏。

数据集浏览选项卡,其中选定了大量数据集并突出显示批量操作栏。

对数据集应用批量操作时,将应用以下条件:

  • 您可以从UI的不同页面选择数据集。
  • 如果选择筛选器,则选定的数据集将重置。

按创建日期排序数据集 sort

浏览选项卡中的数据集可以按升序或降序日期排序。 选择Created或Last updated列标题在升序和降序之间替换。 选中后,列将通过列标题侧的向上或向下箭头指示此信息。

数据集工作区的“浏览”选项卡,其中已创建列和上次更新列突出显示。

创建数据集 create

要创建新数据集,请在​ 数据集 ​仪表板中选择​ 创建数据集

已突出显示“创建数据集”按钮。

在下一个屏幕中,您将看到用于创建新数据集的以下两个选项:

使用现有架构创建数据集 schema

在​ 创建数据集 ​屏幕中,选择​ 从架构创建数据集 ​以创建新的空数据集。

从架构创建数据集按钮突出显示。

出现​ 选择架构 ​步骤。 浏览架构列表并选择数据集将遵循的架构,然后选择​ 下一步

将显示架构列表。 将用于创建数据集的架构已突出显示。

将显示​ 配置数据集 ​步骤。 为数据集提供名称和可选描述,然后选择​ 完成 ​以创建数据集。

已插入数据集的配置详细信息。 这包括数据集名称和描述等详细信息。

可以使用架构筛选器从UI中的可用数据集列表中筛选数据集。 有关详细信息,请参阅有关如何按架构筛选数据集的部分。

使用CSV文件创建数据集 csv

使用CSV文件创建数据集时,将创建一个临时架构,以便为数据集提供匹配提供的CSV文件的结构。 在​ 创建数据集 ​屏幕中,选择​ 从CSV文件创建数据集

已突出显示“从CSV文件创建数据集”按钮。

出现​ 配置 ​步骤。 为数据集提供名称和可选描述,然后选择​ 下一步

已插入数据集的配置详细信息。 这包括数据集名称和描述等详细信息。

出现​ 添加数据 ​步骤。 通过将CSV文件拖放到屏幕中心来上载该文件,或者选择​ 浏览 ​浏览文件目录。 文件大小最多可达10 GB。 上传CSV文件后,选择​ 保存 ​以创建数据集。

NOTE
CSV列名称必须以字母数字字符开头,并且只能包含字母、数字和下划线。

将显示“添加数据”屏幕。 您可以为数据集上传CSV文件的位置突出显示。

监测数据摄取

在Experience Platform UI的左侧导航中选择​ 监视。 通过​ 监控 ​仪表板,可查看来自批处理或流式摄取的入站数据状态。 要查看各个批次的状态,请选择​ 批次端对端 ​或​ 流式端对端。 仪表板将列出所有批次或流式摄取运行,包括成功、失败或仍在进行的批次或流式摄取运行。 每个列表都提供了批次的详细信息,包括批次ID、目标数据集的名称和摄取的记录数。 如果为Profile启用了目标数据集,则还会显示已摄取的身份和配置文件记录数。

将显示监控批次的端到端屏幕。 监视和批处理都高亮显示。

您可以选择单个​ 批次ID ​来访问​ 批次概述 ​仪表板,并查看批次的详细信息,包括批次无法摄取时的错误日志。

显示选定批次的详细信息。 这包括摄取的记录数、失败的记录数、批次状态、文件大小、摄取的开始和结束时间、数据集和批次ID、组织ID、数据集名称和访问信息。

如果要删除批次,请选择仪表板右上角附近的​ 删除批次。 删除批次也会从最初将批次摄取到的数据集中删除其记录。

NOTE
如果已为配置文件启用并处理了摄取的数据,则删除批次不会从配置文件存储中删除该数据。

数据集详细信息页面上突出显示了“删除批处理”按钮。

后续步骤

本用户指南提供了在Experience Platform用户界面中使用数据集时执行常用操作的说明。 有关执行涉及数据集的常见Platform工作流的步骤,请参阅以下教程:

recommendation-more-help
c5c02be6-79a3-4a2f-b766-136bffe8b676