使用Flow Service API在Azure HDInsights基连接上创建Apache Spark

注意

Azure HDInsights连接器上的Apache Spark处于测试阶段。 有关使用测试版标记的连接器的更多信息,请参阅源概述

基本连接表示源与Adobe Experience Platform之间经过验证的连接。

本教程将指导您完成使用Flow Service API在Azure HDInsights(以下称为“Spark”)上为Apache Spark创建基本连接的步骤。

快速入门

本指南要求您对Adobe Experience Platform的以下组件有一定的了解:

  • 来源: Experience Platform 允许从各种源摄取数据,同时让您能够使用服务来构建、标记和增强传入数 Platform 据。
  • 沙盒: Experience Platform 提供将单个实例分区为单独虚 Platform 拟环境的虚拟沙盒,以帮助开发和改进数字体验应用程序。

以下部分提供了您需要了解的其他信息,以便您能够使用Flow Service API成功连接到Spark。

收集所需的凭据

要使Flow Service与Spark连接,必须为以下连接属性提供值:

凭据 描述
host Spark服务器的IP地址或主机名。
username 用于访问Spark服务器的用户名。
password 与用户对应的密码。
connectionSpec.id 连接规范返回源的连接器属性,包括与创建基连接和源连接相关的验证规范。 Spark的连接规范ID是:6a8d82bc-1caf-45d1-908d-cadabc9d63a6

有关入门的详细信息,请参阅此Spark文档

使用Platform API

有关如何成功调用Platform API的信息,请参阅Platform API入门指南

创建基本连接

基本连接保留了源和平台之间的信息,包括源的身份验证凭据、连接的当前状态和唯一基本连接ID。 基本连接ID允许您从源中浏览和导航文件,并标识要摄取的特定项目,包括有关其数据类型和格式的信息。

要创建基本连接ID,请在请求参数中提供Spark身份验证凭据时,向/connections端点发出POST请求。

API格式

POST /connections

请求

以下请求为Spark创建基本连接:

curl -X POST \
    'https://platform.adobe.io/data/foundation/flowservice/connections' \
    -H 'Authorization: Bearer {ACCESS_TOKEN}' \
    -H 'x-api-key: {API_KEY}' \
    -H 'x-gw-ims-org-id: {IMS_ORG}' \
    -H 'x-sandbox-name: {SANDBOX_NAME}' \
    -H 'Content-Type: application/json' \
    -d '{
        "name": "Spark test connection",
        "description": "A Spark test connection",
        "auth": {
            "specName": "HDInsights Basic Authentication",
        "params": {
            "host" :  "{HOST}",
            "username" : "{USERNAME}",
            "password" :"{PASSWORD}"
            }
        },
        "connectionSpec": {
            "id": "6a8d82bc-1caf-45d1-908d-cadabc9d63a6",
            "version": "1.0"
        }
    }'
参数 描述
auth.params.host Spark服务器的主机。
auth.params.username 与Spark连接关联的用户名。
auth.params.password 与Spark连接关联的密码。
connectionSpec.id Spark连接规范ID:6a8d82bc-1caf-45d1-908d-cadabc9d63a6

响应

成功的响应返回新创建连接的详细信息,包括其唯一标识符(id)。 在下一个教程中探索数据时需要此ID。

{
    "id": "a45f2f58-e3a2-46ba-9f2f-58e3a2b6baf2",
    "etag": "\"900009d6-0000-0200-0000-5e8500010000\""
}

后续步骤

在本教程中,您已使用Flow Service API创建了Spark连接,并获取了该连接的唯一ID值。 在下一个教程中,您可以使用此ID,因为您正在学习如何使用流服务API浏览数据库。

在此页面上