UI でのストリーミングソースのデータフローの監視
このチュートリアルでは、 ソース ワークスペースを使用してストリーミングソースのデータフローを監視する手順を説明します。
はじめに
このチュートリアルは、Adobe Experience Platform の次のコンポーネントを実際に利用および理解しているユーザーを対象としています。
- データフロー:データフローは、Platform 間でデータを移動するデータジョブを表します。データフローは異なるサービスをまたいで設定され、ソースコネクタからターゲットデータセット、Identity および Profile、Destinations へとデータを移動できます。
- データフロー実行:データフロー実行は、選択したデータフローの頻度設定に基づいて繰り返しスケジュールされたジョブです。
- ソース:Experience Platform を使用すると、データを様々なソースから取得しながら、Platform サービスを使用して受信データの構造化、ラベル付け、拡張を行うことができます。
- サンドボックス:Experience Platform には、単一の Platform インスタンスを別々の仮想環境に分割し、デジタルエクスペリエンスアプリケーションの開発と発展に役立つ仮想サンドボックスが用意されています。
ストリーミングソースのデータフローの監視
Platform の UI で、左側のナビゲーションバーで「Sources」を選択し、Sources のワークスペースにアクセスします。カタログ画面には、アカウントを作成できる様々なソースが表示されます。
ストリーミングソースの既存のデータフローを表示するには、上部のヘッダーから データフロー を選択します。
データフロー ページには、ソースデータ、アカウント名、データフロー実行ステータスに関する情報など、組織内の既存のすべてのデータフローのリストが含まれています。
表示するデータフローの名前を選択します。
データフロー実行ステータスについて詳しくは、次の表を参照してください。
Completed
」ステータスは、対応するデータフロー実行のすべてのレコードが 1 時間以内に処理されたことを示します。 データフロー実行のエラーは、Completed
ステータスに含まれることがあります。Success
」ステータスは、対応するデータフロー実行のすべてのレコードが 1 時間以内に処理され、データフローの実行中にエラーが発生しなかったことを示します。Processing
」ステータスは、データフローがまだアクティブでないことを示します。 このステータスは、多くの場合、新しいデータフローを作成した直後に発生します。Error
」ステータスは、データフローのアクティブ化プロセスが中断されたことを示します。No runs
」ステータスは、データフローは作成されたが、データフロー実行は開始されていないことを示します。 データフローアクティビティ ページには、ストリーミングデータフローに関する特定の情報が表示されます。 上部のバナーには、取り込まれたレコードと、選択した日付範囲でのすべてのストリーミングデータフロー実行に対して失敗したレコードの累積数が含まれています。
デフォルトでは、表示されるデータには、過去 7 日間の取り込みレートが含まれています。 表示されるレコードの時間枠を調整するには、「過去 7 日間」を選択します。
カレンダーポップアップウィンドウが表示され、代替取り込み時間枠のオプションが表示されます。 データフロー実行時間枠を設定して、過去 7 日間または過去 30 日間のフロー実行を表示できます。 または、選択したカスタム時間枠を設定するようにインタラクティブカレンダーを設定します。 完了したら、「適用」を選択します。
ページの下半分には、フロー実行ごとに受信、取り込み、失敗したレコードの数に関する情報が表示されます。 各フロー実行は、1 時間ごとの期間内に記録されます。
データフロー実行指標 dataflow-run-metrics
個々のデータフロー実行ごとに、次の詳細が表示されます。
- データフロー実行開始:データフロー実行が開始された時刻です。
- 処理時間:データフローが処理されるまでにかかった時間です。
- 受信したレコード:ソースコネクタからデータフローで受信したレコードの合計数です。
- 取り込まれたレコード:Data Lake に取り込まれたレコードの合計数です。
- 警告のあるレコード:取り込まれた警告のあるレコードの合計数です。 マッパー変換エラーはすべて警告としてレポートされ、部分的に取り込まれた行には、警告を含む
success
というラベルが付けられます。 メモ:警告を含むレコードの取り込みのサポートは、ストリーミングソースでのみ使用できます。 - 失敗したレコード:データのエラーが原因で Data Lake に取り込まれなかったレコードの数。
- 取り込みレート:Data Lake に取り込まれたレコードの成功率です。 この指標は、 部分取り込み が有効な場合に適用されます。
- ステータス:データフローの状態(完了または処理中)を表します。 完了 は、対応するデータフロー実行のすべてのレコードが 1 時間以内に処理されたことを意味します。 処理中は、データフロー実行がまだ終了していないことを意味します。
データフロー実行の概要 ページには、対応するデータフロー実行 ID、ターゲットデータセット、組織 ID など、データフローに関する追加情報が含まれています。
エラーを含むフロー実行には、実行の失敗につながった特定のエラーと失敗したレコードの合計数を表示する データフロー実行エラー パネルも含まれています。
警告のあるレコードの表示 warnings
警告のあるレコード フロー実行中に発生したマッパー変換警告のリストを表示します。 部分的に取り込まれた行は成功と見なされ、マッパー変換エラーが見つかった場合は警告が追加されます。
デフォルトでは、次の場合を除き、すべてのマッパー変換エラーは警告と見なされます。
- 構文エラー
- 存在しない属性への参照
- XDM データタイプの不一致
エラー診断を表示するには、「エラー診断をプレビュー」を選択します。
エラー診断のプレビュー ウィンドウでは、データフローの実行に関する最大 100 個のエラーや警告をプレビューできます。 ここから、Data Access API を使用して、取り込み失敗マニフェストをダウンロードして詳細を確認することもできます。
次の手順
このチュートリアルでは、 ソース ワークスペースを正常に使用して、ストリーミングデータフローを監視し、失敗したデータフローに至ったエラーを特定しました。 詳しくは、次のドキュメントを参照してください。