Dokumentation Experience Platform Användarhandbok om datainmatning

API-översikt för gruppinmatning

Last update: Wed Sep 10 2025 00:00:00 GMT+0000 (Coordinated Universal Time)

Ämnen:
Datainhämtning

Skapat för:

Utvecklare

Med API:t för Adobe Experience Platform Batch Ingclosure kan du importera data till Experience Platform som gruppfiler. Data som ska importeras kan vara profildata från en platt fil (till exempel en Parquet-fil) eller data som följer ett känt schema i Experience Data Model (XDM)-registret.

API-referensen för gruppinmatning innehåller ytterligare information om dessa API-anrop.

I följande diagram visas batchintagsprocessen:

Komma igång

API-slutpunkterna som används i den här guiden ingår i API:t för gruppinmatning. Innan du fortsätter bör du läsa kom igång-guiden för att få länkar till relaterad dokumentation, en guide till hur du läser exempelanropen för API i det här dokumentet och viktig information om vilka huvuden som krävs för att kunna anropa ett Experience Platform-API.

Krav för Data Ingestion

Data som ska överföras måste vara antingen i Parquet- eller JSON-format.
En datauppsättning skapades i Catalog services.
Innehållet i Parquet-filen måste matcha en delmängd av schemat i datauppsättningen som överförs till.
Ha din unika åtkomsttoken efter autentisering.

Bästa praxis för gruppkonsumtion

Den rekommenderade batchstorleken är mellan 256 MB och 100 GB.
Varje grupp bör innehålla högst 1 500 filer.

Begränsningar för batchförbrukning

Batchdatainmatning har vissa begränsningar:

Maximalt antal filer per batch: 1 500
Maximal batchstorlek: 100 GB
Maximalt antal egenskaper eller fält per rad: 10000
Maximalt antal batchar i sjödata per minut, per användare: 2000

NOTE

Om du vill överföra en fil som är större än 512 MB måste filen delas upp i mindre segment. Instruktioner för att överföra en stor fil finns i avsnittet stor filöverföring i det här dokumentet.

Typer

När du importerar data är det viktigt att du förstår hur Experience Data Model (XDM)-scheman fungerar. Mer information om hur XDM-fälttyper mappas till olika format finns i Utvecklarhandbok för schemaregister.

Det finns viss flexibilitet vid inmatning av data - om en typ inte matchar vad som finns i målschemat konverteras data till den angivna måltypen. Om den inte kan det misslyckas gruppen med en TypeCompatibilityException.

Till exempel har varken JSON eller CSV typen date eller date-time. Därför uttrycks dessa värden med ISO 8601-formaterade strängar ("2018-07-10T15:05:59.000-08:00") eller Unix Time i millisekunder (1531263955 9000) och konverteras vid intag till mål-XDM-typen.

Tabellen nedan visar de konverteringar som stöds vid inmatning av data.

Inkommande (rad) kontra mål (kol)

Sträng

Byte

Kort

Heltal

Lång

Dubbel

Datum

Datum-tid

Objekt

Karta

Sträng

Byte

Kort

Heltal

Lång

Dubbel

Datum

Datum-tid

Objekt

Karta

NOTE

Booleaner och arrayer kan inte konverteras till andra typer.

Använda API:et

Med API:t Data Ingestion kan du importera data som grupper (en dataenhet som består av en eller flera filer som ska importeras som en enda enhet) till Experience Platform i tre grundläggande steg:

Skapa en ny batch.
Överför filer till en angiven datauppsättning som matchar datans XDM-schema.
Signalera slutet av gruppen.

Skapa en batch

Innan data kan läggas till i en datauppsättning måste de länkas till en batch, som senare överförs till en angiven datauppsättning.

POST /batches

Begäran

curl -X POST "https://platform.adobe.io/data/foundation/import/batches" \
  -H "Content-Type: application/json" \
  -H "x-gw-ims-org-id: {ORG_ID}" \
  -H "x-sandbox-name: {SANDBOX_NAME}" \
  -H "Authorization: Bearer {ACCESS_TOKEN}" \
  -H "x-api-key: {API_KEY}"
  -d '{
          "datasetId": "{DATASET_ID}"
      }'

Egenskap

Beskrivning

datasetId

ID:t för datauppsättningen som filerna ska överföras till.

Svar

{
    "id": "{BATCH_ID}",
    "imsOrg": "{ORG_ID}",
    "updated": 0,
    "status": "loading",
    "created": 0,
    "relatedObjects": [
        {
            "type": "dataSet",
            "id": "{DATASET_ID}"
        }
    ],
    "version": "1.0.0",
    "tags": {},
    "createdUser": "{USER_ID}",
    "updatedUser": "{USER_ID}"
}

Egenskap

Beskrivning

id

ID för den batch som precis skapades (används i efterföljande begäranden).

relatedObjects.id

ID:t för datauppsättningen som filerna ska överföras till.

Filöverföring

När du har skapat en ny batch för överföring kan filer sedan överföras till en viss datauppsättning.

Du kan överföra filer med hjälp av API:t för liten filöverföring. Om filerna är för stora och gatewaygränsen överskrids (t.ex. utökade tidsgränser, begäranden om kroppsstorlek har överskridits och andra begränsningar) kan du växla till API:t för stor filöverföring. Denna API överför filen i segment och sammanfogar data med API-anropet Large File Upload Complete.

NOTE

Batchinmatning kan användas för att stegvis uppdatera data i profilarkivet. Mer information finns i avsnittet Uppdatera en batch i Utvecklarhandbok för batchimport.

INFO

I exemplen nedan används filformatet Apache Parquet. Ett exempel som använder JSON-filformatet finns i Utvecklarhandboken för gruppfrågor.

Liten filöverföring

När en batch har skapats kan data överföras till en befintlig datauppsättning. Filen som överförs måste matcha det refererade XDM-schemat.

PUT /batches/{BATCH_ID}/datasets/{DATASET_ID}/files/{FILE_NAME}

Egenskap

Beskrivning

{BATCH_ID}

Batchens ID.

{DATASET_ID}

ID:t för datauppsättningen som ska överföras.

{FILE_NAME}

Namnet på filen så som den visas i datauppsättningen.

Begäran

curl -X PUT "https://platform.adobe.io/data/foundation/import/batches/{BATCH_ID}/datasets/{DATASET_ID}/files/{FILE_NAME}.parquet" \
  -H "content-type: application/octet-stream" \
  -H "x-gw-ims-org-id: {ORG_ID}" \
  -H "x-sandbox-name: {SANDBOX_NAME}" \
  -H "Authorization: Bearer {ACCESS_TOKEN}" \
  -H "x-api-key: {API_KEY}" \
  --data-binary "@{FILE_PATH_AND_NAME}.parquet"

Egenskap

Beskrivning

{FILE_PATH_AND_NAME}

Sökvägen till och filnamnet på filen som ska överföras till datauppsättningen.

Svar

#Status 200 OK, with empty response body

Stor filöverföring - skapa fil

Om du vill överföra en stor fil måste filen delas upp i mindre segment och överföras en åt gången.

POST /batches/{BATCH_ID}/datasets/{DATASET_ID}/files/{FILE_NAME}?action=initialize

Egenskap

Beskrivning

{BATCH_ID}

Batchens ID.

{DATASET_ID}

ID:t för datauppsättningen som importerar filerna.

{FILE_NAME}

Namnet på filen så som den visas i datauppsättningen.

Begäran

curl -X POST "https://platform.adobe.io/data/foundation/import/batches/{BATCH_ID}/datasets/{DATASET_ID}/files/part1=a/part2=b/{FILE_NAME}.parquet?action=initialize" \
  -H "x-gw-ims-org-id: {ORG_ID}" \
  -H "x-sandbox-name: {SANDBOX_NAME}" \
  -H "Authorization: Bearer {ACCESS_TOKEN}" \
  -H "x-api-key: {API_KEY}"

Svar

#Status 201 CREATED, with empty response body

Stor filöverföring - överför efterföljande delar

När filen har skapats kan alla efterföljande segment överföras genom upprepade PATCH-begäranden, en för varje del av filen.

PATCH /batches/{BATCH_ID}/datasets/{DATASET_ID}/files/{FILE_NAME}

Egenskap

Beskrivning

{BATCH_ID}

Batchens ID.

{DATASET_ID}

ID:t för datauppsättningen som filerna ska överföras till.

{FILE_NAME}

Namnet på filen så som den kommer att visas i datauppsättningen.

Begäran

curl -X PATCH "https://platform.adobe.io/data/foundation/import/batches/{BATCH_ID}/datasets/{DATASET_ID}/files/part1=a/part2=b/{FILE_NAME}.parquet" \
  -H "content-type: application/octet-stream" \
  -H "x-gw-ims-org-id: {ORG_ID}" \
  -H "x-sandbox-name: {SANDBOX_NAME}" \
  -H "Authorization: Bearer {ACCESS_TOKEN}" \
  -H "x-api-key: {API_KEY}" \
  -H "Content-Range: bytes {CONTENT_RANGE}" \
  --data-binary "@{FILE_PATH_AND_NAME}.parquet"

Egenskap

Beskrivning

{FILE_PATH_AND_NAME}

Sökvägen till och filnamnet på filen som ska överföras till datauppsättningen.

Svar

#Status 200 OK, with empty response

Slutförande av signalbatch

När alla filer har överförts till gruppen kan gruppen signaleras för slutförande. På så sätt skapas Catalog DataSetFile-posterna för de slutförda filerna och kopplas till den grupp som genereras ovan. Batchen Catalog markeras sedan som lyckad, vilket utlöser flödesomformningar för att importera tillgängliga data.

Begäran

POST /batches/{BATCH_ID}?action=COMPLETE

Egenskap

Beskrivning

{BATCH_ID}

ID för den batch som ska överföras till datauppsättningen.

curl -X POST "https://platform.adobe.io/data/foundation/import/batches/{BATCH_ID}?action=COMPLETE" \
-H "x-gw-ims-org-id: {ORG_ID}" \
-H "x-sandbox-name: {SANDBOX_NAME}" \
-H "Authorization: Bearer {ACCESS_TOKEN}" \
-H "x-api-key: {API_KEY}"

Svar

#Status 200 OK, with empty response

Kontrollera batchstatus

I väntan på att filerna ska överföras till gruppen kan batchens status kontrolleras för att se dess förlopp.

API-format

GET /batch/{BATCH_ID}

Egenskap

Beskrivning

{BATCH_ID}

ID för den batch som kontrolleras.

Begäran

curl GET "https://platform.adobe.io/data/foundation/catalog/batch/{BATCH_ID}" \
  -H "Authorization: Bearer {ACCESS_TOKEN}" \
  -H "x-gw-ims-org-id: {ORG_ID}" \
  -H "x-sandbox-name: {SANDBOX_NAME}" \
  -H "x-api-key: {API_KEY}"

Svar

{
    "{BATCH_ID}": {
        "imsOrg": "{ORG_ID}",
        "created": 1494349962314,
        "createdClient": "MCDPCatalogService",
        "createdUser": "{USER_ID}",
        "updatedUser": "{USER_ID}",
        "updated": 1494349963467,
        "externalId": "{EXTERNAL_ID}",
        "status": "success",
        "errors": [
            {
                "code": "err-1494349963436"
            }
        ],
        "version": "1.0.3",
        "availableDates": {
            "startDate": 1337,
            "endDate": 4000
        },
        "relatedObjects": [
            {
                "type": "batch",
                "id": "foo_batch"
            },
            {
                "type": "connection",
                "id": "foo_connection"
            },
            {
                "type": "connector",
                "id": "foo_connector"
            },
            {
                "type": "dataSet",
                "id": "foo_dataSet"
            },
            {
                "type": "dataSetView",
                "id": "foo_dataSetView"
            },
            {
                "type": "dataSetFile",
                "id": "foo_dataSetFile"
            },
            {
                "type": "expressionBlock",
                "id": "foo_expressionBlock"
            },
            {
                "type": "service",
                "id": "foo_service"
            },
            {
                "type": "serviceDefinition",
                "id": "foo_serviceDefinition"
            }
        ],
        "metrics": {
            "foo": 1337
        },
        "tags": {
            "foo_bar": [
                "stuff"
            ],
            "bar_foo": [
                "woo",
                "baz"
            ],
            "foo/bar/foo-bar": [
                "weehaw",
                "wee:haw"
            ]
        },
        "inputFormat": {
            "format": "parquet",
            "delimiter": ".",
            "quote": "`",
            "escape": "\\",
            "nullMarker": "",
            "header": "true",
            "charset": "UTF-8"
        }
    }
}

Egenskap

Beskrivning

{USER_ID}

ID för den användare som skapade eller uppdaterade gruppen.

Fältet "status" visar den aktuella statusen för den begärda batchen. Batcherna kan ha något av följande lägen:

Status för batchförtäring

Status

Beskrivning

Övergiven

Batchen har inte slutförts inom den förväntade tidsramen.

Avbruten

En avbrottsåtgärd har anropat explicit (via API:t för gruppinmatning) för den angivna gruppen. När batchen är i inläst läge kan den inte avbrytas.

Aktiv

Batchen har befordrats och är tillgänglig för nedladdning. Den här statusen kan användas omväxlande med "Lyckades".

Borttagen

Data för batchen har tagits bort helt.

Misslyckades

Ett terminaltillstånd som antingen beror på felaktig konfiguration och/eller felaktiga data. Data för en misslyckad batch visas inte. Den här statusen kan användas som ersättning med "Misslyckades".

Inaktiv

Batchen befordrades men har återförts eller gått ut. Batchen är inte längre tillgänglig för nedströmsförbrukning.

Inläst

Data för batchen har slutförts och batchen är klar för befordran.

Läser in

Data för den här batchen överförs och batchen är för närvarande inte klar att befordras.

Försöker igen

Data för den här batchen bearbetas. På grund av ett system- eller övergående fel misslyckades dock batchen. Detta innebär att batchen provas igen.

Mellanlagrad

Mellanlagringsfasen av befordringsprocessen för en batch är slutförd och åtkomsten har körts.

Mellanlagring

Data för batchen bearbetas.

Stängd

Data för batchen bearbetas. Batchkampanjen har dock avstannat efter ett antal försök.

recommendation-more-help

2ee14710-6ba4-4feb-9f79-0aad73102a9a