UIでのデータベース接続のデータフローの設定

データフローは、ソースからPlatformデータセットにデータを取得して取り込むスケジュール済みタスクです。 このチュートリアルでは、データベースアカウントを使用して新しいデータフローを設定する手順を説明します。

はじめに

このチュートリアルは、Adobe Experience Platform の次のコンポーネントを実際に利用および理解しているユーザーを対象としています。

また、このチュートリアルでは、既にデータベースアカウントを作成している必要があります。 UIで様々なデータベースコネクタを作成するためのチュートリアルのリストは、ソースコネクタの概要を参照してください。

データの追加

データベースアカウントを作成した後、データの追加​手順が表示され、データベース階層を調べるためのインタラクティブなインターフェイスが提供されます。

  • インターフェイスの左半分は、アカウントのデータテーブルのリストを表示するブラウザーです。
  • インターフェイスの右半分で、最大100行のデータをプレビューできます。

ページ上部の「検索」オプションを使用して、使用するソースデータをすばやく特定できます。

メモ

ソースデータの検索オプションは、Analytics、分類、Event Hubs、Kinesisの各コネクタを除く、すべての表形式ベースのソースコネクタで使用できます。

ソースデータを見つけたら、テーブルを選択し、「次へ」を選択します。

select-data

XDMスキーマへのデータフィールドのマッピング

マッピング​手順が表示され、ソースデータをPlatformデータセットにマッピングするインタラクティブなインターフェイスが提供されます。

取り込む受信データのデータセットを選択します。 既存のデータセットを使用するか、新しいデータセットを作成できます。

既存のデータセットを使用する

データを既存のデータセットに取り込むには、Existing dataset​を選択し、データセットアイコンをクリックします。

データセットの選択​ダイアログが表示されます。 使用するデータセットを見つけ、選択して、「続行」をクリックします。

新しいデータセットの使用

データを新しいデータセットに取り込むには、New dataset​を選択し、提供されたフィールドにデータセットの名前と説明を入力します。

スキーマを選択​検索バーにスキーマ名を入力して、スキーマフィールドを添付できます。 また、ドロップダウンアイコンを選択して、既存のスキーマのリストを表示できます。 または、「詳細検索」を選択して、既存のスキーマの画面(それぞれの詳細を含む)にアクセスすることもできます。

この手順の間に、Real-time Customer Profileのデータセットを有効にし、エンティティの属性と動作の全体的な表示を作成できます。 有効なすべてのデータセットのデータはProfileに含まれ、データフローを保存すると変更が適用されます。

プロファイルデータセット」ボタンを切り替えて、Profileのターゲットデータセットを有効にします。

create-new-dataset

スキーマの選択​ダイアログが表示されます。 新しいデータセットに適用するスキーマを選択し、「完了」をクリックします。

必要に応じて、フィールドを直接マッピングするか、データ準備関数を使用してソースデータを変換し、計算済み値または計算済み値を導き出すことができます。 マッパー関数と計算フィールドの詳細については、『データ準備関数ガイド』または『計算フィールドガイド』を参照してください。

ヒント

Platform は、選択したターゲットスキーマまたはデータセットに基づいて、自動マッピングされたフィールドに対するインテリジェントな推奨事項を提供します。使用例に合わせてマッピングルールを手動で調整できます。

データのプレビュー」を選択すると、選択したデータセットから最大100行のサンプルデータのマッピング結果が表示されます。

プレビュー時、ID列は、マッピング結果を検証する際に必要な重要な情報なので、最初のフィールドとして優先順位付けされます。

ソースデータがマッピングされたら、「閉じる」を選択します。

取得の実行のスケジュール

スケジュール​手順が表示され、設定済みのマッピングを使用して選択したソースデータを自動的に取り込むように取り込みスケジュールを設定できます。 次の表に、スケジュール用の様々な設定可能フィールドの概要を示します。

フィールド 説明
頻度 選択可能な周波数は、OnceMinuteHourDayWeekです。
間隔 選択した頻度の間隔を設定する整数。
開始時間 最初の取り込みがいつ設定されるかを示すUTCタイムスタンプ。
バックフィル 最初に取り込まれるデータを決定するboolean値です。 バックフィル​が有効になっている場合、指定されたパス内の現在のファイルは、最初にスケジュールされた取り込みの間にすべて取り込まれます。 バックフィル​が無効になっている場合は、最初の取り込み実行から開始時刻までの間に読み込まれたファイルのみが取り込まれます。 開始時刻より前に読み込まれたファイルは取り込まれません。
デルタ列 タイプ、日付、時間のフィルターされたソーススキーマフィールドセットを含むオプション。 このフィールドは、新しいデータと既存のデータを区別するために使用されます。 増分データは、選択した列のタイムスタンプに基づいて取り込まれます。

データフローは、スケジュールに従ってデータを自動的に取り込むように設計されています。 まず、取得頻度を選択します。 次に、2つのフロー実行の間隔を指定する間隔を設定します。 間隔の値はゼロ以外の整数で、15以上に設定する必要があります。

取り込みの開始時間を設定するには、開始時間ボックスに表示される日時を調整します。 または、カレンダーアイコンを選択して開始時間の値を編集できます。 開始時刻は、現在のUTC時刻以上にする必要があります。

増分データを​で読み込む」を選択して、差分列を割り当てます。 このフィールドは、新しいデータと既存のデータの違いを示します。

1回限りの取得データフローの設定

1回限りの取り込みを設定するには、「頻度」ドロップダウン矢印を選択し、「1回」を選択します。

ヒント

1回限り ​の取り込み中にインターバランドバックフィルが表示されない。

スケジュールに適切な値を指定したら、「次へ」を選択します。

データフローの詳細の入力

データフローの詳細​手順が表示され、新しいデータフローに名前を付け、簡単な説明を入力できます。

このプロセスの間に、部分取得​および​エラー診断​を有効にすることもできます。 部分取得​を有効にすると、エラーを含むデータを特定のしきい値まで取り込むことができます。 部分取得​が有効になったら、エラーしきい値%​ダイヤルをドラッグして、バッチのエラーしきい値を調整します。 または、入力ボックスを選択して手動でしきい値を調整することもできます。 詳しくは、「バッチ取得の部分の概要」を参照してください。
データフローの値を指定し、「次へ」を選択します。

データフローの確認

レビュー」手順が表示され、新しいデータフローを作成前に確認できます。 詳細は、次のカテゴリにグループ化されます。

  • 接続:ソースのタイプ、選択したソースファイルの関連パス、およびそのソースファイル内の列の数を表示します。
  • データセットとマップのフィールドの割り当て:データセットが準拠するスキーマなど、ソースデータの取り込み先のデータセットを示します。
  • スケジュール:取り込みスケジュールのアクティブな期間、頻度、間隔が表示されます。

データフローをレビューしたら、「完了」をクリックし、データフローの作成にしばらく時間をかけます。

データフローの監視

データフローを作成したら、データフローを介して取り込まれるデータを監視して、取り込み率、成功、エラーに関する情報を確認できます。 データフローの監視方法の詳細については、UIでのアカウントとデータフローの監視に関するチュートリアルを参照してください。

データフローの削除

不要になったデータフローや誤って作成されたデータフローは、Dataflows​ワークスペースの​Delete​関数を使用して削除できます。 データフローの削除方法の詳細については、UIでのデータフローの削除に関するチュートリアルを参照してください。

次の手順

このチュートリアルでは、データフローを作成し、外部データベースからデータを取り込み、監視データセットに関するインサイトを得ました。 受信データは、Real-time Customer ProfileやData Science Workspaceなど、ダウンストリームのPlatformサービスで使用できるようになりました。 詳しくは、次のドキュメントを参照してください。

付録

以下の節では、ソースコネクタの操作に関する追加情報を示します。

データフローの無効化

データフローを作成すると、そのデータフローは直ちにアクティブになり、指定されたスケジュールに従ってデータを取り込みます。 以下の手順に従うことで、アクティブなデータフローをいつでも無効にできます。

ソース​ワークスペース内で、「データフロー」タブを選択します。 次に、無効にするデータフローを選択します。

プロパティ」列が画面の右側に表示されます。この列には、「有効」切り替えボタンが含まれます。 切り替えを選択してデータフローを無効にします。 同じ切り替えを使用して、データフローを無効にした後で再度有効にすることができます。

Profile母集団の受信データをアクティブ化

ソースコネクタからの受信データは、Real-time Customer Profileデータのエンリッチメントと入力に使用できます。 Real-time Customer Profileデータの入力について詳しくは、プロファイル母集団に関するチュートリアルを参照してください。

このページ