[Beta 版]{class="badge informative"}

机器学习辅助模式创建

AVAILABILITY
  • 机器学习辅助模式创建当前处于Beta阶段。 文档和功能可能会发生变化。

使用ML算法从示例数据生成架构。 在为大型复杂数据集定义结构、字段和数据类型时,此过程可节省时间并提高准确性。

利用ML模式生成,您可以快速集成新数据源,并减少手动创建的错误。 非技术用户可以使用它来生成架构或管理大型复杂数据集,而无需任何额外的工作。 此帮助可加快从获取数据到获得洞察信息的过程,并使合并新数据源和执行数据分析变得更轻松。

快速入门

本教程需要对创建架构的要求有一定的了解。 在继续本指南之前,您应该阅读有关创建和编辑架构的UI指南

本指南介绍如何使用机器学习(ML)算法创建架构,以从示例数据生成架构。 有关在架构编辑器中创建架构或有关基于字段的工作流的文档的信息,请参阅手动架构创建工作流指南,以加深您对架构创建过程的了解。

NOTE
您还可以使用Schema Registry API编写架构。 要使用API手动创建架构,请先阅读Schema Registry 开发人员指南,然后再尝试阅读有关使用API创建架构的教程。

导航到创建架构工作流 navigate-to-schema-creation-workflow

从Platform UI的左侧导航中,选择​ 架构 ​工作区。 出现​ 架构 ​工作区。 选择​ 创建架构 ​以添加新架构以启动架构创建工作流。

左侧导航中带有架构的架构工作区和“创建架构”突出显示。

创建架构 create-a-schema

出现创建架构对话框。 选择​ [ML辅助] ​架构创建选项,然后选择​ 选择 ​以确认您的选择。

已突出显示ML — 辅助的创建架构对话框。

选择基类 select-base-class

出现创建架构工作流。 为您的架构选择一个基类,然后选择​ 下一步

架构详细信息工作区,其中包含类并突出显示下一个类。

上传 CSV 文件 upload-csv

此时将显示创建工作流的​ 选择数据 ​阶段。 从​ 上载文件 ​部分,选择​ 选择文件 ​或​ 拖放文件 ​部分。 从您的计算机中选择一个.csv文件以生成架构。

上载文件部分突出显示的创建架构工作流的“选择数据”阶段。

预览数据 preview-data

上载文件部分显示您导入的CSV文件的名称,预览 ​部分显示您上载的文件中的示例数据行。 选择​ 下一步 ​以继续工作流。

在预览部分中突出显示的样本数据行,以及“下一步”突出显示的样本数据行。

查看和编辑架构 review-schema

此时将显示创建工作流的​ 查看和编辑 ​阶段,该阶段在表格视图中显示机器学习辅助的​ 架构推荐。 在此阶段,您可以从机器学习模型生成的推荐架构中编辑、添加或删除字段。 该表包含以下字段:

字段名称
描述
数据表
字段所在的数据集或数据库。
Source字段
源系统中的原始字段名称。
目标字段
数据将映射到的目标系统中的字段名称。
显示名称
用于在用户界面中显示字段的名称。 此名称应当更加便于用户使用或者更具描述性。
数据类型
存储在字段中的数据类型(例如,StringDate)。
字段组
基于字段使用或上下文的字段分类(例如,人口统计详细信息、Commerce详细信息)。

架构创建工作流的审核和编辑阶段。

添加字段 add-field

若要向架构中添加字段,请选择​ 添加新字段

架构创建工作流的“审核并编辑”阶段中突出显示了添加新字段。

出现选择字段对话框。 该对话框包含当前存在的架构的图表。 选择所需的字段并选择​ [选择] ​以向架构中添加新字段。 选择​ [取消] ​关闭对话框(如果需要)。

选择字段对话框,其中选定了字段并突出显示了“选择”。

推荐的架构上将显示一个新行。 您现在可以编辑该字段。

编辑字段 edit-field

要编辑字段,请选择要编辑的行的铅笔图标。 右侧将显示一个详细信息面板,您可以在其中编辑自定义字段映射。 详细信息面板包含目标字段、显示名称、数据类型和字段组。 进行任何必要的更改,然后选择​ 应用 ​进行确认。 再次选择铅笔图标以关闭详细信息面板。

架构创建工作流的“审阅和编辑”阶段中铅笔图标和详细信息面板突出显示。

删除字段 remove-field

要删除字段,请选择要删除的行上的减号图标。

CAUTION
删除此项目时,不显示确认对话框。

架构创建工作流的“审核和编辑”阶段中反白了减号图标。

批准推荐的架构 approve

要批准建议的架构并继续​ 创建架构 ​工作流,请选择​ [下一步]

架构创建工作流的“审核和编辑”阶段中突出显示“下一步”。

命名并保存架构 name-and-save

此时将显示创建工作流的​ Name和save ​阶段。 输入​ [架构显示名称] ​和可选描述。 [生成的架构] ​部分提供了ML生成的架构的图表。 选择​ [完成] ​以完成架构创建工作流。

已突出显示“完成”的架构创建工作流的“名称”和“保存架构”阶段。

在架构编辑器中查看 view-in-editor

此时将显示架构编辑器,您新创建的架构将显示在画布中。 选择​ 保存 ​以返回架构工作区。

架构编辑器显示您命名的ML生成的架构。

后续步骤

创建架构后,您可以使用架构编辑器进行进一步的修改(如有必要)。 您的新架构现在已准备好与数据源集成并用于数据分析。

有关使用架构编辑器的详细信息,请参阅编辑现有架构指南

recommendation-more-help
62e9ffd9-1c74-4cef-8f47-0d00af32fc07