Skapa en Apache Spark på Azure HDInsights-basanslutning med API:t Flow Service

NOTE
Apache Spark på Azure HDInsights-anslutningen är i betaversion. Mer information om hur du använder betatecknade anslutningar finns i Källöversikt.

En basanslutning representerar den autentiserade anslutningen mellan en källa och Adobe Experience Platform.

I den här självstudiekursen får du hjälp med att skapa en basanslutning för Apache Spark på Azure HDInsights (kallas nedan Spark) med Flow Service API.

Komma igång

Handboken kräver en fungerande förståelse av följande komponenter i Adobe Experience Platform:

  • Källor: Experience Platform tillåter att data kan hämtas från olika källor samtidigt som du kan strukturera, etikettera och förbättra inkommande data med Experience Platform-tjänster.
  • Sandlådor: Experience Platform innehåller virtuella sandlådor som partitionerar en enskild Experience Platform-instans till separata virtuella miljöer för att hjälpa till att utveckla och utveckla program för digitala upplevelser.

I följande avsnitt finns ytterligare information som du behöver känna till för att kunna ansluta till Spark med API:t Flow Service.

Samla in nödvändiga inloggningsuppgifter

För att Flow Service ska kunna ansluta till Spark måste du ange värden för följande anslutningsegenskaper:

Autentiseringsuppgifter
Beskrivning
host
IP-adressen eller värdnamnet för servern Spark.
username
Användarnamnet som du använder för att komma åt servern Spark.
password
Lösenordet som motsvarar användaren.
connectionSpec.id
Anslutningsspecifikationen returnerar en källas kopplingsegenskaper, inklusive autentiseringsspecifikationer för att skapa bas- och källanslutningarna. Anslutningsspecifikations-ID för Spark är: 6a8d82bc-1caf-45d1-908d-cadabc9d63a6

Mer information om hur du kommer igång finns i det här Spark-dokumentet.

Använda Experience Platform API:er

Information om hur du kan anropa Experience Platform API:er finns i guiden Komma igång med Experience Platform API:er.

Skapa en basanslutning

En basanslutning bevarar information mellan källan och Experience Platform, inklusive autentiseringsuppgifter för källan, anslutningens aktuella tillstånd och ditt unika basanslutnings-ID. Med det grundläggande anslutnings-ID:t kan du utforska och navigera bland filer inifrån källan och identifiera de specifika objekt som du vill importera, inklusive information om deras datatyper och format.

Om du vill skapa ett basanslutnings-ID skickar du en POST-begäran till /connections-slutpunkten och anger dina Spark-autentiseringsuppgifter som en del av parametrarna för begäran.

API-format

POST /connections

Begäran

Följande begäran skapar en basanslutning för Spark:

curl -X POST \
    'https://platform.adobe.io/data/foundation/flowservice/connections' \
    -H 'Authorization: Bearer {ACCESS_TOKEN}' \
    -H 'x-api-key: {API_KEY}' \
    -H 'x-gw-ims-org-id: {ORG_ID}' \
    -H 'x-sandbox-name: {SANDBOX_NAME}' \
    -H 'Content-Type: application/json' \
    -d '{
        "name": "Spark test connection",
        "description": "A Spark test connection",
        "auth": {
            "specName": "HDInsights Basic Authentication",
        "params": {
            "host":  "{HOST}",
            "username": "{USERNAME}",
            "password":"{PASSWORD}"
            }
        },
        "connectionSpec": {
            "id": "6a8d82bc-1caf-45d1-908d-cadabc9d63a6",
            "version": "1.0"
        }
    }'
Parameter
Beskrivning
auth.params.host
Värden för servern Spark.
auth.params.username
Användarnamnet som är associerat med din Spark-anslutning.
auth.params.password
Lösenordet som är kopplat till din Spark-anslutning.
connectionSpec.id
Anslutningsspecifikations-ID Spark: 6a8d82bc-1caf-45d1-908d-cadabc9d63a6.

Svar

Ett lyckat svar returnerar information om den nyligen skapade anslutningen, inklusive dess unika identifierare (id). Detta ID krävs för att utforska dina data i nästa självstudiekurs.

{
    "id": "a45f2f58-e3a2-46ba-9f2f-58e3a2b6baf2",
    "etag": "\"900009d6-0000-0200-0000-5e8500010000\""
}

Nästa steg

Genom att följa den här självstudiekursen har du skapat en Spark-basanslutning med API:t Flow Service. Du kan använda detta grundläggande anslutnings-ID i följande självstudier:

recommendation-more-help
337b99bb-92fb-42ae-b6b7-c7042161d089