[ベータ版]{class="badge informative"}

機械学習によるスキーマ作成

AVAILABILITY
  • 機械学習によるスキーマ作成は、現在ベータ版です。 ドキュメントと機能は変更される場合があります。

ML アルゴリズムを使用して、サンプルデータからスキーマを生成します。 このプロセスにより、大規模で複雑なデータセットの構造、フィールド、データタイプを定義する際の時間が節約され、精度が向上します。

ML スキーマの生成を使用すると、新しいデータソースをすばやく統合し、手動で作成した場合のミスを減らすことができます。 技術に詳しくないユーザーでも、このテンプレートを使用してスキーマを生成したり、大きくて複雑なデータセットを追加の手間をかけずに管理したりできます。 この支援により、データの取得からインサイトの獲得までのプロセスが迅速化され、新しいデータソースの組み合わせやデータ分析の実行が容易になります。

はじめに

このチュートリアルでは、スキーマ作成の要件について十分に理解している必要があります。 このガイドを進める前に、 スキーマの作成および編集の UI ガイドを参照する必要があります。

このガイドでは、機械学習(ML)アルゴリズムを使用してスキーマを作成し、サンプルデータからスキーマを生成する方法について説明します。 スキーマの作成について詳しくは、 手動スキーマ作成ワークフローガイドを参照してください。また、スキーマ作成プロセスを理解しやすくするために、スキーマエディターの フィールドベースのワークフローに関するドキュメントを参照してください。

NOTE
Schema Registry API を使用してスキーマを作成することもできます。 API を使用して手動でスキーマを作成するには、まず Schema Registry 開発者ガイドを参照してから、API を使用したスキーマの作成に関するチュートリアルを試してください。

スキーマ作成ワークフローに移動します。 navigate-to-schema-creation-workflow

Platform UI の左側のナビゲーションから、「スキーマ ワークスペースを選択します。 スキーマ ワークスペースが表示されます。 スキーマを作成 を選択して、新しいスキーマを追加し、スキーマ作成ワークフローを開始します。

左側のナビゲーションでスキーマがハイライト表示され、スキーマを作成したスキーマワークスペース。

スキーマの作成 create-a-schema

​ スキーマを作成 ​ ダイアログが表示されます。 [ML-Assisted] スキーマ作成オプションを選択し、続いて 選択 を選択して選択内容を確定します。

ML – 支援 がハイライト表示された スキーマを作成 ダイアログ

基本クラスを選択 select-base-class

​ スキーマを作成 ​ ワークフローが表示されます。 スキーマの基本クラスを選択し、続いて 次へ を選択します。

クラスと「次へ」がハイライト表示されたスキーマの詳細ワークスペース。

CSV ファイルのアップロード upload-csv

作成ワークフローの データを選択 ステージが表示されます。 「ファイルをアップロード」セクションで、「ファイルを選択 または「ファイルをドラッグ&ドロップ」セクションを選択します。 コンピューターから.csv ファイルを選択して、スキーマを生成します。

ファイルのアップロードセクションがハイライト表示されたスキーマ作成ワークフローのデータを選択ステージ。

データのプレビュー preview-data

「​ ファイルをアップロード ​」セクションにはインポートした CSV ファイルの名前が表示され、「プレビュー」セクションにはアップロードしたファイルのサンプルデータの行が表示されます。 「次へ」を選択して、ワークフローを続行します。

プレビューセクションでハイライト表示されたサンプルデータの行、および「次へ」がハイライト表示されています。

スキーマのレビューと編集 review-schema

作成ワークフローの レビューと編集 ステージが表示され、機械学習による支援 スキーマのレコメンデーション が表形式で表示されます。 この段階では、機械学習モデルで生成された推奨スキーマから、フィールドを編集、追加、削除できます。 このテーブルには、次のフィールドが含まれています。

フィールド名
説明
​ データテーブル ​
フィールドが発生するデータセットまたはデータベース。
Source フィールド ​
ソースシステムからの元のフィールド名。
​ ターゲットフィールド ​
データがマッピングされるターゲットシステムのフィールド名。
表示名
ユーザーインターフェイスにフィールドを表示するために使用される名前。 この名前は、よりわかりやすい、または説明的である必要があります。
​ データタイプ ​
フィールドに保存されるデータのタイプ (例:StringDate)。
​ フィールドグループ ​
使用またはコンテキストに基づくフィールドの分類(例:​ デモグラフィックの詳細 ​、Commerceの詳細 ​)。

スキーマ作成ワークフローのレビューと編集ステージ

フィールドを追加 add-field

スキーマにフィールドを追加するには、「新しいフィールドを追加」を選択します。

「新しいフィールドを追加」がハイライト表示されたスキーマ作成ワークフローのレビューと編集ステージ。

​ フィールドを選択 ​ ダイアログが表示されます。 ダイアログには、現在のスキーマの図が含まれています。 目的のフィールドを選択し、「[選択]」を選択して、スキーマに新しいフィールドを追加します。 必要に応じて、「[キャンセル]」を選択してダイアログを閉じます。

フィールドが選択され「選択」がハイライト表示されたフィールドを選択ダイアログ

推奨スキーマに新しい行が表示されます。 これで、フィールドを編集できます。

フィールドの編集 edit-field

フィールドを編集するには、編集する行の鉛筆アイコンを選択します。 詳細パネルが右側に表示され、カスタムフィールドマッピングを編集できます。 詳細パネルには、​ ターゲットフィールド ​、​ 表示名 ​、​ データタイプ ​、および ​ フィールドグループ ​ が含まれています。 必要な変更を加え、「適用」を選択して確定します。 鉛筆アイコンをもう一度選択して、詳細パネルを閉じます。

鉛筆アイコンと詳細パネルがハイライト表示されたスキーマ作成ワークフローのレビューと編集ステージ。

フィールドを削除 remove-field

フィールドを削除するには、削除する行のマイナスアイコンを選択します。

CAUTION
この項目を削除するときに確認ダイアログが表示されません。

マイナスアイコンがハイライト表示されたスキーマ作成ワークフローのレビューと編集ステージ。

推奨スキーマを承認 approve

推奨スキーマを承認して スキーマを作成 ワークフローを続行するには、「[次へ]」を選択します。

「次へ」がハイライト表示された、スキーマ作成ワークフローのレビューと編集ステージ

スキーマに名前を付けて保存 name-and-save

作成ワークフローの 名前を付けて保存 ステージが表示されます。 [スキーマ表示名] と説明(オプション)を入力します。 「[スキーマの生成]」セクションには、ML で生成されたスキーマの図が表示されます。 「[完了]」を選択して、スキーマ作成ワークフローを完了します。

「完了」がハイライト表示されたスキーマ作成ワークフローの「名前を付けてスキーマを保存」ステージ

スキーマエディターで表示 view-in-editor

スキーマエディターが表示され、新しく作成したスキーマがキャンバスに表示されます。 「保存」を選択して、「​ スキーマ ​ ワークスペースに戻ります。

ML で生成された名前付きスキーマを表示するスキーマエディター

次の手順

スキーマを作成したら、スキーマエディターを使用して、必要に応じてさらに変更を加えることができます。 これで、新しいスキーマをデータソースと統合し、データ分析に使用する準備が整いました。

スキーマエディターの使用について詳しくは、 既存のスキーマの編集ガイドを参照してください。

recommendation-more-help
62e9ffd9-1c74-4cef-8f47-0d00af32fc07