データ取り込みの概要
Adobe Experience Platform では、複数のソースからのデータを統合し、マーケターが顧客の行動をより深く理解できるようにします。Adobe Experience Platformのデータ取得は、Experience Platformがこれらのソースからデータを取得する複数の方法と、そのデータが Data Lake 内でどのように保持され、ダウンストリームのExperience Platformサービスで使用されるかを表します。
このドキュメントでは、データをExperience Platformに取り込む 3 つの主な方法を紹介し、詳細については、それぞれの概要ドキュメントへのリンクを示します。
バッチ取得
バッチ取り込みでは、データをバッチファイルとして Experience Platform に取り込むことができます。バッチとは、単一の単位として取得される 1 つ以上のファイルで構成されるデータの単位です。取り込まれたバッチには、正常に取り込まれたレコードの数と、失敗したレコードの数、および関連するエラーメッセージを示すメタデータが提供されます。
フラットな CSV ファイル(XDM スキーマにマッピングされる)や Parket データフレームなど、手動でアップロードしたデータファイルは、この方法を使用して取り込む必要があります。
詳しくは、バッチ取り込みの概要を参照してください。
ストリーミング取得
ストリーミング取得では、クライアントサイドおよびサーバーサイドのデバイスから、リアルタイムで Experience Platform にデータを送信できます。Experience Platformでは、受信したエクスペリエンスデータをストリーミングするためのデータインレットの使用をサポートしています。このデータインレットは、データレイク内のストリーミング対応データセットで保持されます。 データインレットは、収集したデータを自動的に認証するように設定でき、信頼できるソースからのデータであることを確認できます。
詳しくは、ストリーミング取得の概要を参照してください。
ソース
Experience Platform では、様々なデータプロバイダーへのソース接続を設定できます。これらの接続を使用すると、外部データソースの認証、取り込みの実行時間の設定、取り込みスループットの管理をおこなうことができます。
ソース接続は、他の Adobe アプリケーション(Adobe Analytics や Adobe Audience Manager など)、サードパーティのクラウドストレージソース(Azure Blob、Amazon、S3、FTP サーバー、SFTP サーバーなど)、サードパーティの CRM システム(Microsoft Dynamics や Salesforce など)からデータを収集するように設定できます。
詳しくは、ソースの概要を参照してください。
ML 支援スキーマの作成 ml-assisted-schema-creation
新しいデータソースをすばやく統合するために、機械学習アルゴリズムを使用して、サンプルデータからスキーマを生成できるようになりました。 この自動化により、正確なスキーマの作成が簡素化され、エラーが減り、データ収集から分析およびインサイトに至るプロセスが迅速化されます。
このワークフローについて詳しくは 🔗 ML-ASSISTED schema creation guide」を参照してください。
次の手順とその他のリソース
このドキュメントでは、Experience Platform での Data Ingestion の様々な側面について簡単に説明しました。各取り込み方法の概要ドキュメントを引き続き参照して、それぞれの機能、ユースケース、ベストプラクティスをよく理解してください。また、次の取り込みの概要ビデオを見ることで、理解を補うこともできます。取り込んだレコードのメタデータを Experience Platform で追跡する方法について詳しくは、Catalog Service の概要 を参照してください。