数据集UI指南
本用户指南提供了在Adobe Experience Platform用户界面中使用数据集时执行常用操作的说明。
快速入门
本用户指南要求您对Adobe Experience Platform的以下组件有一定的了解:
-
数据集: Experience Platform中用于数据持久性的存储和管理结构。
-
Experience Data Model (XDM) System: Experience Platform用于组织客户体验数据的标准化框架。
-
Real-Time Customer Profile:根据来自多个源的汇总数据,提供统一的实时使用者个人资料。
-
Adobe Experience Platform Data Governance:确保遵守有关客户数据使用的法规、限制和策略。
查看数据集 view-datasets
在Experience Platform UI中,从左侧导航中选择 数据集 以打开 数据集 仪表板。 仪表板列出您组织的所有可用数据集。 会显示每个列出数据集的详细信息,包括其名称、数据集所遵循的架构以及最近摄取运行的状态。
从浏览选项卡中选择数据集的名称以访问其 数据集活动 屏幕,并查看所选数据集的详细信息。 活动选项卡包含一个图表,其中可查看消息使用率,以及成功批次和失败批次的列表。
更多操作 more-actions
您可以从数据集详细信息视图中删除或为配置文件启用数据集。 要查看可用的操作,请选择 …UI右上角的更多。 出现下拉菜单。
如果选择 为配置文件 启用数据集,则会显示确认对话框。 选择 启用 以确认您的选择。
如果选择 删除,将显示删除数据集确认对话框。 选择 删除 以确认您的选择。
您还可以从浏览选项卡上的内联操作中删除数据集或添加数据集以用于实时客户配置文件。 有关详细信息,请参阅内联操作部分。
内联数据集操作 inline-actions
数据集UI现在为每个可用数据集提供一组内联操作。 选择要管理的数据集的省略号(…)可在弹出菜单中查看可用选项。 可用的操作包括:
有关这些可用操作的更多信息,请参阅其各自部分。 要了解如何同时管理大量数据集,请参阅批量操作部分。
预览数据集 preview
您可以从浏览选项卡的内联选项以及数据集活动视图中预览数据集样本数据。 从浏览选项卡中,选择要预览的数据集名称旁边的省略号(…)。 出现一个选项菜单列表。 接下来,从可用选项列表中选择 预览数据集。 如果数据集为空,则预览链接将被停用,并改为表示预览不可用。
这将打开预览窗口,其中数据集的架构的分层视图显示在右侧。
或者,从 数据集活动 屏幕中,选择屏幕右上角附近的 预览数据集 以预览最多100行数据。
对于更可靠的数据访问方法,Experience Platform提供下游服务,如Query Service和JupyterLab,以浏览和分析数据。 有关详细信息,请参阅以下文档:
在数据集上管理和强制执行数据治理 manage-and-enforce-data-governance
您可以通过选择浏览选项卡的内联选项来管理数据集的数据治理标签。 选择要管理的数据集名称旁边的省略号(…),然后从下拉菜单中选择 管理数据和访问标签。
通过在架构级别应用数据使用标签,您可以根据应用于该数据的使用策略对数据集和字段进行分类。 请参阅数据管理概述以了解有关标签的更多信息,或参阅数据使用标签用户指南以了解有关如何将标签应用于架构以传播到数据集的说明。
为实时客户个人资料启用数据集 enable-profile
每个数据集都能够使用其摄取的数据扩充客户用户档案。 为此,数据集所遵循的架构必须兼容才能在Real-Time Customer Profile中使用。 兼容的架构满足以下要求:
- 架构至少有一个指定为标识属性的属性。
- 架构具有定义为主标识的标识属性。
有关为Profile启用架构的更多信息,请参阅架构编辑器用户指南。
您可以从浏览选项卡的内联选项以及数据集活动视图中启用配置文件的数据集。 从数据集工作区的浏览选项卡中,选择要为配置文件启用的数据集的省略号。 出现一个选项菜单列表。 接下来,从可用选项列表中选择 启用统一配置文件。
或者,从数据集的 数据集活动 屏幕中,选择 属性 列中的 配置文件 切换开关。 启用后,还将使用摄取到数据集的数据来填充客户配置文件。
也可通过此条件筛选为配置文件启用的数据集。 请参阅有关如何筛选启用配置文件的数据集的部分,以获取更多信息。
管理数据集标记 manage-tags
添加自定义创建的标记以组织数据集并改进搜索、筛选和排序功能。 从数据集工作区的浏览选项卡中,选择要管理的数据集的省略号,然后从下拉菜单中选择 管理标记。
出现管理标记对话框。 输入简短描述以创建自定义标记,或从预先存在的标记中选择以标记您的数据集。 选择 保存 以确认您的设置。
管理标记对话框也可以从数据集中删除现有标记。 只需选择要删除的标记旁边的“x”并选择 保存 即可。
将标记添加到数据集后,可以根据相应的标记过滤数据集。 有关详细信息,请参阅有关如何按标记筛选数据集的部分。
有关如何对业务对象进行分类以便于发现和分类的详细信息,请参阅管理元数据分类指南。 本指南详细介绍具有适当权限的用户如何在Platform UI中创建预定义标记、为标记分配类别以及执行标记和标记类别的所有相关CRUD操作。
(Beta)设置数据保留策略 data-retention-policy
从数据集工作区的浏览选项卡管理数据集级别的数据集到期和保留策略。 您可以使用此功能为已摄取到Data Lake和Profile Services中的数据配置保留策略。 到期日期基于数据摄取到Platform中的时间和您的保留规则。
要打开设置数据保留对话框,请从下拉菜单中选择数据集旁边的省略号,然后选择 设置数据保留策略。
出现设置数据保留对话框。 该对话框显示沙盒级别的许可证使用量度、数据集级别的详细信息和数据湖设置。 这些量度显示您的使用情况与您的授权。 数据集详细信息包括数据集名称、类型、配置文件启用状态和当前数据湖存储使用情况。
在配置数据集保留策略之前,该对话框显示建议的保留设置。 默认建议保留期为一个月。 要调整标准保留策略,请选择并更新数字,然后选择所需的时段(天、月、年)。 您可以单独配置数据湖和配置文件服务的保留设置。
有关定义数据集过期日期范围的规则和配置数据保留策略的最佳实践的更多信息,请参阅常见问题页面。
(Beta)提高了保留期和存储指标的可见性 retention-and-storage-metrics
Beta版用户可以使用四个新列,以便更清楚地了解您的数据管理:数据湖存储、数据湖保留、配置文件存储 和 配置文件保留。 这些量度显示数据在Data Lake和Profile服务中占用的存储量及其保留持续时间。 这些详细信息可帮助您优化保留策略,根据权利跟踪使用情况,并确保遵守组织和法规标准。 这种更高的可见性使您能够做出明智的决策、管理成本、简化治理并清楚地了解您的数据环境。
下表概述了测试版中可用的新保留和存储指标。 它详细介绍了每列的用途以及它如何帮助在Platform UI中管理数据保留和存储。
移至文件夹 move-to-folders
您可以将数据集放在文件夹中,以便更好地管理数据集。 要将数据集移动到文件夹中,请选择要管理的数据集名称旁边的省略号(…),然后从下拉菜单中 移动到文件夹。
出现将数据集移动到文件夹对话框。 选择要将受众移动到的文件夹,然后选择 移动。 弹出通知会告知您已成功移动数据集。
数据集位于文件夹中后,您可以选择仅显示属于特定文件夹的数据集。 要打开文件夹结构,请选择显示文件夹图标( )。 接下来,选择您选择的文件夹以查看所有关联的数据集。
删除数据集 delete
您可以从浏览选项卡或数据集活动视图右上角的数据集内联操作中删除数据集。 从浏览视图中,选择要删除的数据集名称旁边的省略号(…)。 出现一个选项菜单列表。 接下来,从下拉菜单中选择 删除。
将显示确认对话框。 选择 删除 以确认。
或者,从 数据集活动 屏幕中选择 删除数据集。
将出现一个确认框。 选择 删除 以确认删除数据集。
删除启用配置文件的数据集
如果为配置文件启用了某个数据集,则通过UI删除该数据集会将其从数据湖、身份服务以及配置文件存储中与该数据集关联的任何配置文件数据中删除。
您可以使用实时客户个人资料API从Profile存储中删除与数据集关联的个人资料数据(将数据保留在数据湖中)。 有关详细信息,请参阅配置文件系统作业API终结点指南。
搜索和筛选数据集 search-and-filter
要搜索或筛选可用数据集的列表,请选择筛选器图标( )。 左边栏中显示一组过滤器选项。 有多种方法可用于筛选可用数据集。 这些包括:显示系统数据集、包含在配置文件中、标记、创建日期、修改日期、创建者和架构。
应用的过滤器列表显示在过滤结果上方。
显示系统数据集 show-system-datasets
默认情况下,仅显示已摄取数据的数据集。 如果要查看系统生成的数据集,请选择显示系统数据集部分中的 是 复选框。 系统生成的数据集仅用于处理其他组件。 例如,系统生成的配置文件导出数据集用于处理配置文件仪表板。
启用筛选配置文件的数据集 filter-profile-enabled-datasets
为配置文件数据启用的数据集用于在引入数据后填充客户配置文件。 请参阅有关为配置文件启用数据集的部分以了解详情。
要根据是否已为配置文件启用数据集来筛选数据集,请从筛选选项中选择是复选框。
按标记筛选数据集 filter-by-tag
在标记输入中输入您的自定义标记名称,然后从可用选项列表中选择您的标记,以搜索和筛选与该标记对应的数据集。
按创建日期筛选数据集 filter-by-creation-date
可以在自定义时段内按创建日期筛选数据集。 这可用于排除历史数据或生成特定的按时间顺序排列的数据洞察和报表。 通过选择每个字段的日历图标,选择开始日期和结束日期。 之后,只有符合该条件的数据集才会显示在浏览选项卡中。
按修改日期筛选数据集 filter-by-modified-date
与创建日期过滤器类似,您可以根据上次修改数据集的日期来筛选数据集。 在修改日期部分中,通过选择每个字段的日历图标来选择开始日期和结束日期。 之后,只有在该时段修改的数据集才会显示在浏览选项卡中。
按架构筛选 filter-by-schema
您可以根据定义数据集结构的架构筛选数据集。 选择下拉图标或将架构名称输入文本字段。 此时将显示一个潜在匹配项列表。 从列表中选择相应的架构。
批量操作 bulk-actions
使用批量操作提高操作效率,并对大量数据集同时执行多项操作。 您可以通过批量操作(如移动到文件夹、编辑标记和删除数据集)来节省时间并保持有条理的数据结构。
要一次处理多个数据集,请选中每行带有复选框的单个数据集,或选中带有列标题的整个页面。 选中后,将出现批量操作栏。
对数据集应用批量操作时,将应用以下条件:
- 您可以从UI的不同页面选择数据集。
- 如果选择筛选器,则选定的数据集将重置。
按创建日期排序数据集 sort
浏览选项卡中的数据集可以按升序或降序日期排序。 选择Created或Last updated列标题在升序和降序之间替换。 选中后,列将通过列标题侧的向上或向下箭头指示此信息。
创建数据集 create
要创建新数据集,请在 数据集 仪表板中选择 创建数据集。
在下一个屏幕中,您将看到用于创建新数据集的以下两个选项:
使用现有架构创建数据集 schema
在 创建数据集 屏幕中,选择 从架构创建数据集 以创建新的空数据集。
出现 选择架构 步骤。 浏览架构列表并选择数据集将遵循的架构,然后选择 下一步。
将显示 配置数据集 步骤。 为数据集提供名称和可选描述,然后选择 完成 以创建数据集。
可以使用架构筛选器从UI中的可用数据集列表中筛选数据集。 有关详细信息,请参阅有关如何按架构筛选数据集的部分。
使用CSV文件创建数据集 csv
使用CSV文件创建数据集时,将创建一个临时架构,以便为数据集提供匹配提供的CSV文件的结构。 在 创建数据集 屏幕中,选择 从CSV文件创建数据集。
出现 配置 步骤。 为数据集提供名称和可选描述,然后选择 下一步。
出现 添加数据 步骤。 通过将CSV文件拖放到屏幕中心来上载该文件,或者选择 浏览 浏览文件目录。 文件大小最多可达10 GB。 上传CSV文件后,选择 保存 以创建数据集。
监测数据摄取
在Experience Platform UI的左侧导航中选择 监视。 通过 监控 仪表板,可查看来自批处理或流式摄取的入站数据状态。 要查看各个批次的状态,请选择 批次端对端 或 流式端对端。 仪表板将列出所有批次或流式摄取运行,包括成功、失败或仍在进行的批次或流式摄取运行。 每个列表都提供了批次的详细信息,包括批次ID、目标数据集的名称和摄取的记录数。 如果为Profile启用了目标数据集,则还会显示已摄取的身份和配置文件记录数。
您可以选择单个 批次ID 来访问 批次概述 仪表板,并查看批次的详细信息,包括批次无法摄取时的错误日志。
如果要删除批次,请选择仪表板右上角附近的 删除批次。 删除批次也会从最初将批次摄取到的数据集中删除其记录。
后续步骤
本用户指南提供了在Experience Platform用户界面中使用数据集时执行常用操作的说明。 有关执行涉及数据集的常见Platform工作流的步骤,请参阅以下教程: