数据集UI指南

本用户指南提供了有关在Adobe Experience Platform用户界面中处理数据集时执行常见操作的说明。

入门指南

本用户指南需要对Adobe Experience Platform的以下组件有充分的了解:

视图数据集

在Experience Platform UI中,单击左侧导航中的​Datasets​以打开​Datasets​仪表板。 仪表板会列表您组织的所有可用数据集。 将显示每个列出的数据集的详细信息,包括其名称、数据集附带的模式和最近摄取运行的状态。

单击数据集的名称以访问其​Dataset activity​屏幕并查看您选择的数据集的详细信息。 “活动”选项卡包括图形,该图形可视化消费消息的速率,以及成功和失败批的列表。


预览数据集

在​Dataset activity​屏幕中,单击屏幕右上角附近的​Preview dataset​以预览最多100行数据。 如果预览集为空,则预览链接将停用,而是表示该数据集不可用。

在“预览”窗口中,右侧将显示模式集的分层视图。

要获得更可靠的数据访问方法,Experience Platform提供下游服务,如Query Service和JupyterLab来浏览和分析数据。 有关更多信息,请参阅以下文档:

创建数据集

要创建新数据集,请单击​Datasets​仪表板中的​Create dataset​进行开始。

在下一个屏幕中,您将看到以下两个用于创建新数据集的选项:

使用现有模式创建数据集

在​Create dataset​屏幕中,单击​Create dataset from schema​以创建新的空数据集。

出现​Select schema​步骤。 浏览模式列表,选择模式集将遵循的,然后单击​Next

出现​Configure dataset​步骤。 为数据集提供名称和可选描述,然后单击​Finish​以创建数据集。

使用CSV文件创建数据集

使用CSV文件创建数据集时,会创建一个专门模式来为数据集提供与提供的CSV文件匹配的结构。 在​Create dataset​屏幕中,单击显示​Create dataset from CSV file​的框。

出现​Configure​步骤。 为数据集提供名称和可选描述,然后单击​Next

出现​Add data​步骤。 通过将CSV文件拖放到屏幕的中心,或单击​Browse​浏览您的文件目录,即可上传该CSV文件。 文件最大可以有10GB大小。 上载CSV文件后,单击​Save​创建数据集。

注意

CSV列名必须与字母数字字符开始,并且只能包含字母、数字和下划线。

为实时客户用户档案启用数据集

每个数据集都能用摄取的数据丰富客户用户档案。 为此,数据集附带的模式必须兼容,才能在Real-time Customer Profile中使用。 兼容模式满足以下要求:

  • 该模式至少具有一个指定为标识属性的属性。
  • 模式具有定义为主标识的标识属性。

有关为Profile启用模式的详细信息,请参阅模式编辑器用户指南

要启用用户档案数据集,请访问其​Dataset activity​屏幕,然后单击​Properties​列中的​Profile​切换。 启用后,引入到数据集中的数据还将用于填充客户用户档案。

注意

如果数据集已包含数据,然后为Profile启用,则Profile不会自动使用现有数据。 在为Profile启用数据集后,建议您重新摄取任何现有数据,以使其向客户用户档案贡献。

管理和强制数据集上的数据管理

数据使用标签允许您根据应用于该数据的使用策略对数据集和字段进行分类。 请参阅数据治理概述以了解有关标签的更多信息,或参阅数据使用标签用户指南以获取有关如何将标签应用到数据集的说明。

删除数据集

您可以先访问数据集的​Dataset activity​屏幕,以删除数据集。 然后,单击​Delete dataset​将其删除。

注意

无法删除由Adobe应用程序和服务(如Adobe Analytics、Adobe Audience Manager或Offer Decisioning)创建和使用的数据集。

此时将显示确认框。 单击​Delete​以确认删除数据集。

删除启用用户档案的数据集

如果Profile启用了数据集,则通过UI删除该数据集将从平台中的用户档案库和数据湖中删除它。

您只能使用Real-time Customer用户档案API从Profile存储中删除数据集(将数据保留在数据湖中)。 有关详细信息,请参阅用户档案系统作业API端点指南

监控数据获取

在Experience Platform UI中,单击左侧导航中的​MonitoringMonitoring​仪表板允许您视图来自批处理或流摄取的入站数据的状态。 要视图单个批的状态,请单击​Batch end-to-end​或​Streaming end-to-end。 仪表板列表所有批处理或流式摄取运行,包括那些成功、失败或仍在进行的运行。 每个列表都提供批的详细信息,包括批ID、目标数据集的名称和摄取的记录数。 如果为Profile启用目标数据集,则还会显示所摄取的标识和用户档案记录数。

您可以单击单个​Batch ID​访问​Batch overview​仪表板,并查看该批的详细信息,包括当该批未能收录时的错误日志。

如果要删除批,可以单击仪表板右上角附近的​Delete batch​进行删除。 这样做还会从最初摄取批的数据集中删除其记录。

后续步骤

本用户指南提供了有关在Experience Platform用户界面中处理数据集时执行常见操作的说明。 有关执行涉及数据集的常见Platform工作流的步骤,请参阅以下教程:

在此页面上