建立 Apache Spark on Azure HDInsights基本連接,使用 Flow Service API

注意

此 Apache Spark on Azure HDInsights 連接器為測試版。 請參閱 來源概觀 有關使用測試版標籤連接器的詳細資訊。

基本連線代表來源和Adobe Experience Platform之間已驗證的連線。

本教學課程會逐步引導您完成建立基礎連線的步驟 Apache Spark on Azure HDInsights (下稱「Spark")使用 Flow Service API.

快速入門

本指南需要妥善了解下列Adobe Experience Platform元件:

  • 來源: Experience Platform 可讓您從各種來源擷取資料,同時使用來建構、加標籤及增強傳入資料 Platform 服務。
  • 沙箱: Experience Platform 提供可分割單一沙箱的虛擬沙箱 Platform 例項放入個別的虛擬環境,以協助開發及改進數位體驗應用程式。

以下各節提供您需要了解的其他資訊,以便成功連接到 Spark 使用 Flow Service API。

收集所需憑據

為了 Flow Service 連線 Spark,您必須提供下列連線屬性的值:

憑據 說明
host 的IP位址或主機名稱 Spark 伺服器。
username 您用來存取的使用者名稱 Spark 伺服器。
password 與用戶對應的密碼。
connectionSpec.id 連接規範返回源的連接器屬性,包括與建立基連接和源連接相關的驗證規範。 的連接規範ID Spark 為: 6a8d82bc-1caf-45d1-908d-cadabc9d63a6

如需快速入門的詳細資訊,請參閱 這個Spark檔案.

使用平台API

如需如何成功呼叫Platform API的詳細資訊,請參閱 Platform API快速入門.

建立基本連接

基本連接在源和平台之間保留資訊,包括源的驗證憑據、連接的當前狀態和唯一基本連接ID。 基本連線ID可讓您從來源探索和導覽檔案,並識別您要擷取的特定項目,包括其資料類型和格式的相關資訊。

若要建立基本連線ID,請向 /connections 端點提供 Spark 驗證憑證作為要求參數的一部分。

API格式

POST /connections

要求

下列請求會為 Spark:

curl -X POST \
    'https://platform.adobe.io/data/foundation/flowservice/connections' \
    -H 'Authorization: Bearer {ACCESS_TOKEN}' \
    -H 'x-api-key: {API_KEY}' \
    -H 'x-gw-ims-org-id: {IMS_ORG}' \
    -H 'x-sandbox-name: {SANDBOX_NAME}' \
    -H 'Content-Type: application/json' \
    -d '{
        "name": "Spark test connection",
        "description": "A Spark test connection",
        "auth": {
            "specName": "HDInsights Basic Authentication",
        "params": {
            "host":  "{HOST}",
            "username": "{USERNAME}",
            "password":"{PASSWORD}"
            }
        },
        "connectionSpec": {
            "id": "6a8d82bc-1caf-45d1-908d-cadabc9d63a6",
            "version": "1.0"
        }
    }'
參數 說明
auth.params.host 主機 Spark 伺服器。
auth.params.username 與您的 Spark 連線。
auth.params.password 與您的 Spark 連線。
connectionSpec.id 此 Spark 連接規範ID: 6a8d82bc-1caf-45d1-908d-cadabc9d63a6.

回應

成功的回應會傳回新建立連線的詳細資訊,包括其唯一識別碼(id)。 在下一個教學課程中探索資料時需要此ID。

{
    "id": "a45f2f58-e3a2-46ba-9f2f-58e3a2b6baf2",
    "etag": "\"900009d6-0000-0200-0000-5e8500010000\""
}

後續步驟

依照本教學課程,您已建立 Spark 使用 Flow Service API,並已取得連線的唯一ID值。 您可以在下一個教學課程中使用此ID,以了解如何 使用流服務API瀏覽資料庫.

本頁內容