Skapa en Apache Spark på Azure HDInsights-basanslutning med API:t Flow Service
En basanslutning representerar den autentiserade anslutningen mellan en källa och Adobe Experience Platform.
I den här självstudiekursen får du hjälp med att skapa en basanslutning för Apache Spark på Azure HDInsights (kallas nedan Spark) med Flow Service API.
Komma igång
Handboken kräver en fungerande förståelse av följande komponenter i Adobe Experience Platform:
- Källor: Experience Platform tillåter att data kan hämtas från olika källor samtidigt som du kan strukturera, etikettera och förbättra inkommande data med Platform-tjänster.
- Sandlådor: Experience Platform innehåller virtuella sandlådor som partitionerar en enskild Platform-instans till separata virtuella miljöer för att hjälpa till att utveckla och utveckla program för digitala upplevelser.
I följande avsnitt finns ytterligare information som du behöver känna till för att kunna ansluta till Spark med API:t Flow Service.
Samla in nödvändiga inloggningsuppgifter
För att Flow Service ska kunna ansluta till Spark måste du ange värden för följande anslutningsegenskaper:
host
username
password
connectionSpec.id
6a8d82bc-1caf-45d1-908d-cadabc9d63a6
Mer information om hur du kommer igång finns i det här Spark-dokumentet.
Använda plattforms-API:er
Mer information om hur du kan anropa plattforms-API:er finns i guiden Komma igång med plattforms-API:er.
Skapa en basanslutning
En basanslutning bevarar information mellan källan och plattformen, inklusive källans autentiseringsuppgifter, anslutningsstatus och ditt unika basanslutnings-ID. Med det grundläggande anslutnings-ID:t kan du utforska och navigera bland filer inifrån källan och identifiera de specifika objekt som du vill importera, inklusive information om deras datatyper och format.
Om du vill skapa ett grundläggande anslutnings-ID skickar du en POST till slutpunkten /connections
och anger dina autentiseringsuppgifter för Spark som en del av parametrarna för begäran.
API-format
POST /connections
Begäran
Följande begäran skapar en basanslutning för Spark:
curl -X POST \
'https://platform.adobe.io/data/foundation/flowservice/connections' \
-H 'Authorization: Bearer {ACCESS_TOKEN}' \
-H 'x-api-key: {API_KEY}' \
-H 'x-gw-ims-org-id: {ORG_ID}' \
-H 'x-sandbox-name: {SANDBOX_NAME}' \
-H 'Content-Type: application/json' \
-d '{
"name": "Spark test connection",
"description": "A Spark test connection",
"auth": {
"specName": "HDInsights Basic Authentication",
"params": {
"host": "{HOST}",
"username": "{USERNAME}",
"password":"{PASSWORD}"
}
},
"connectionSpec": {
"id": "6a8d82bc-1caf-45d1-908d-cadabc9d63a6",
"version": "1.0"
}
}'
auth.params.host
auth.params.username
auth.params.password
connectionSpec.id
6a8d82bc-1caf-45d1-908d-cadabc9d63a6
.Svar
Ett lyckat svar returnerar information om den nyligen skapade anslutningen, inklusive dess unika identifierare (id
). Detta ID krävs för att utforska dina data i nästa självstudiekurs.
{
"id": "a45f2f58-e3a2-46ba-9f2f-58e3a2b6baf2",
"etag": "\"900009d6-0000-0200-0000-5e8500010000\""
}
Nästa steg
Genom att följa den här självstudiekursen har du skapat en Spark-basanslutning med API:t Flow Service. Du kan använda detta grundläggande anslutnings-ID i följande självstudier: