Flow Service APIを使用して、Azure HDInsightsベースの接続にApache Sparkを作成します。

メモ

Azure HDInsightsコネクタのApache Sparkはベータ版です。 ベータラベルのコネクタの使用について詳しくは、「ソースの概要」を参照してください。

ベース接続は、ソースとAdobe Experience Platform間の認証済み接続を表します。

このチュートリアルでは、Flow Service APIを使用してAzure HDInsightsのApache Spark(以下「Spark」と呼びます)の基本接続を作成する手順を説明します。

はじめに

このガイドでは、Adobe Experience Platform の次のコンポーネントに関する作業を理解している必要があります。

  • ソース: Experience Platform を使用すると、様々なソースからデータを取り込みながら、サービスを使用して受信データの構造化、ラベル付け、拡張をおこなうことがで Platform きます。
  • サンドボックス:Experience Platform は、単一の Platform インスタンスを別々の仮想環境に分割して、デジタルエクスペリエンスアプリケーションの開発と発展を支援する仮想サンドボックスを提供します。

以下の節では、Flow Service APIを使用してSparkに正常に接続するために知っておく必要がある追加情報を示します。

必要な資格情報の収集

Flow ServiceがSparkと接続するには、次の接続プロパティの値を指定する必要があります。

資格情報 説明
host SparkサーバーのIPアドレスまたはホスト名。
username Sparkサーバーにアクセスするために使用するユーザー名。
password ユーザーに対応するパスワード。
connectionSpec.id 接続仕様は、ベース接続とソース接続の作成に関連する認証仕様を含む、ソースのコネクタプロパティを返します。 Sparkの接続仕様IDは次のとおりです。6a8d82bc-1caf-45d1-908d-cadabc9d63a6

使い始める方法について詳しくは、このSparkドキュメントを参照してください。

Platform APIの使用

Platform APIを正常に呼び出す方法について詳しくは、Platform APIの使用の手引きを参照してください。

ベース接続を作成する

ベース接続は、ソースとプラットフォームの間の情報(ソースの認証資格情報、接続の現在の状態、一意のベース接続IDなど)を保持します。 ベース接続IDを使用すると、ソース内からファイルを参照およびナビゲートし、取得する特定の項目(データのタイプや形式に関する情報を含む)を特定できます。

ベースPOSTIDを作成するには、リクエストパラメーターの一部としてSpark認証資格情報を指定しながら、/connectionsエンドポイントに接続リクエストを実行します。

API 形式

POST /connections

リクエスト

次のリクエストは、Sparkのベース接続を作成します。

curl -X POST \
    'https://platform.adobe.io/data/foundation/flowservice/connections' \
    -H 'Authorization: Bearer {ACCESS_TOKEN}' \
    -H 'x-api-key: {API_KEY}' \
    -H 'x-gw-ims-org-id: {IMS_ORG}' \
    -H 'x-sandbox-name: {SANDBOX_NAME}' \
    -H 'Content-Type: application/json' \
    -d '{
        "name": "Spark test connection",
        "description": "A Spark test connection",
        "auth": {
            "specName": "HDInsights Basic Authentication",
        "params": {
            "host" :  "{HOST}",
            "username" : "{USERNAME}",
            "password" :"{PASSWORD}"
            }
        },
        "connectionSpec": {
            "id": "6a8d82bc-1caf-45d1-908d-cadabc9d63a6",
            "version": "1.0"
        }
    }'
パラメーター 説明
auth.params.host Sparkサーバのホスト。
auth.params.username Spark接続に関連付けられたユーザー名。
auth.params.password Spark接続に関連付けられたパスワード。
connectionSpec.id Spark接続仕様ID:6a8d82bc-1caf-45d1-908d-cadabc9d63a6.

応答

正常な応答は、新しく作成された接続の詳細(一意の識別子(id)を含む)を返します。 このIDは、次のチュートリアルでデータを調べるために必要です。

{
    "id": "a45f2f58-e3a2-46ba-9f2f-58e3a2b6baf2",
    "etag": "\"900009d6-0000-0200-0000-5e8500010000\""
}

次の手順

このチュートリアルでは、Flow Service APIを使用してSpark接続を作成し、接続の一意のID値を取得しました。 このIDは、次のチュートリアルでフローサービスAPI🔗を使用してデータベースを調べる方法を学ぶ際に使用できます。

このページ