Exportera datauppsättningar till molnlagringsmål
- Den här funktionaliteten är tillgänglig för kunder som har köpt Real-Time CDP Prime- eller Ultimate-paketet, Adobe Journey Optimizer eller Customer Journey Analytics. Kontakta din Adobe-representant om du vill ha mer information.
I den här artikeln förklaras det arbetsflöde som krävs för att exportera datauppsättningar från Adobe Experience Platform till den molnlagringsplats som du föredrar, till exempel Amazon S3, SFTP-platser eller Google Cloud Storage med hjälp av användargränssnittet i Experience Platform.
Du kan också använda API:erna för Experience Platform för att exportera datauppsättningar. Mer information finns i API-självstudiekursen för exportdatamängder.
Tillgängliga datauppsättningar för export datasets-to-export
De datauppsättningar som du kan exportera varierar beroende på Experience Platform (Real-Time CDP, Adobe Journey Optimizer), nivån (Prime eller Ultimate) och eventuella tillägg som du har köpt (till exempel Data Distiller).
Använd tabellen nedan för att förstå vilka datamängdstyper du kan exportera beroende på ditt program, produktnivå och eventuella köpta tillägg:
- Data för profil- och upplevelsehändelser som har skapats i användargränssnittet i Experience Platform efter att ha inhämtat eller samlat in data via Sources, Web SDK, Mobile SDK, Analytics Data Connector och Audience Manager.
- Systemgenererad data för ögonblicksbild av profil.
Videosjälvstudiekurs video-tutorial
I videon nedan finns en komplett förklaring av arbetsflödet som beskrivs på den här sidan, fördelar med att använda exportdatauppsättningsfunktionen samt några förslag på användningsområden.
Mål som stöds supported-destinations
För närvarande kan du exportera datauppsättningar till molnlagringsmål som markeras i skärmbilden och visas nedan.
När målgrupper ska aktiveras eller datauppsättningar exporteras when-to-activate-audiences-or-activate-datasets
Vissa filbaserade mål i Experience Platform-katalogen stöder både målgruppsaktivering och datauppsättningsexport.
- Överväg att aktivera målgrupper när ni vill att era data ska struktureras i profiler grupperade efter målgruppsintressen eller kvalifikationer.
- Du kan också överväga att exportera datauppsättningar när du vill exportera rådatauppsättningar, som inte grupperas eller struktureras efter målgruppsintressen eller kvalifikationer. Du kan använda dessa data för rapportering, datavetenskapliga arbetsflöden och många andra användningsområden. Som administratör, datatekniker eller analytiker kan du till exempel exportera data från Experience Platform för synkronisering med ditt datalager, använda i BI-analysverktyg, externa XML-verktyg i molnet eller lagra i ditt system för långsiktig lagring.
Det här dokumentet innehåller all information som behövs för att exportera datauppsättningar. Om du vill aktivera målgrupper för molnlagring eller e-postmarknadsföringsmål läser du Aktivera målgruppsdata för att batchprofilera exportmål.
Förhandskrav prerequisites
Om du vill exportera datauppsättningar till molnlagringsmål måste du ha anslutit till ett mål. Om du inte redan har gjort det går du till målkatalogen, bläddrar bland de mål som stöds och konfigurerar det mål som du vill använda.
Nödvändiga behörigheter permissions
Om du vill exportera datauppsättningar behöver du behörigheterna View Destinations, View Datasets och Manage and Activate Dataset Destinations åtkomstkontroll. Läs åtkomstkontrollsöversikten eller kontakta produktadministratören för att få den behörighet som krävs.
Bläddra i målkatalogen för att kontrollera att du har de behörigheter som krävs för att exportera datauppsättningar och att målet har stöd för att exportera datauppsättningar. Om ett mål har en Activate- eller Export datasets-kontroll har du rätt behörighet.
Välj mål select-destination
Följ instruktionerna för att välja ett mål där du kan exportera datauppsättningar:
-
Gå till Connections > Destinations och välj fliken Catalog.
-
Välj Activate eller Export datasets på kortet som motsvarar målet som du vill exportera datauppsättningar till.
-
Välj Data type Datasets och välj den målanslutning som du vill exportera datauppsättningar till. Välj sedan Next.
- Vyn Select datasets visas. Gå till nästa avsnitt för att välja dina datauppsättningar för export.
Välj datauppsättningar select-datasets
Använd kryssrutorna till vänster om datauppsättningsnamnen för att markera de datauppsättningar som du vill exportera till målet och välj sedan Next.
Schemalägg datauppsättningsexport scheduling
Använd steget Scheduling för att:
- Ange ett startdatum och ett slutdatum samt en exportgräns för datauppsättningsexporter.
- Konfigurera om de exporterade datauppsättningsfilerna ska exportera hela datamängdens medlemskap eller bara stegvisa ändringar av medlemskapet för varje exportförekomst.
- Anpassa mappsökvägen på lagringsplatsen där datauppsättningar ska exporteras. Läs mer om hur du redigerar sökvägen till exportmappen.
Använd kontrollen Edit schedule på sidan om du vill redigera exportavslut och välja om du vill exportera fullständiga eller stegvisa filer.
Alternativet Export incremental files är markerat som standard. Detta utlöser en export av en eller flera filer som representerar en fullständig ögonblicksbild av datauppsättningen. Efterföljande filer är inkrementella tillägg till datauppsättningen sedan föregående export. Du kan också välja Export full files. I det här fallet väljer du frekvensen Once för en engångs fullständig export av datauppsättningen.
-
Använd Frequency-väljaren för att välja exportfrekvens:
- Daily: Schemalägg inkrementell filexport en gång om dagen, varje dag, vid den tidpunkt du anger.
- Hourly: Schemalägg stegvis filexport var 3, 6, 8 eller 12:e timme.
-
Använd väljaren Time för att välja tidpunkten på dagen, i formatet UTC, när exporten ska ske.
-
Använd Date-väljaren för att välja intervallet när exporten ska äga rum.
-
Välj Save om du vill spara schemat och fortsätta till steget Review.
Redigera mappsökväg edit-folder-path
Välj Edit folder path om du vill anpassa mappstrukturen på lagringsplatsen där exporterade datauppsättningar placeras.
Du kan använda flera tillgängliga makron för att anpassa ett mappnamn. Dubbelklicka på ett makro för att lägga till det i mappsökvägen och använd /
mellan makrona för att separera mapparna.
När du har valt makron kan du se en förhandsvisning av mappstrukturen som kommer att skapas på lagringsplatsen. Den första nivån i mappstrukturen representerar Folder path som du angav när du anslöt till målet för att exportera datamängder.
Granska review
På sidan Review kan du se en sammanfattning av ditt val. Välj Cancel om du vill dela upp flödet, Back om du vill ändra inställningarna eller Finish om du vill bekräfta ditt val och börja exportera datauppsättningar till målet.
Verifiera datauppsättningsexport verify
När du exporterar datauppsättningar skapar Experience Platform en eller flera .json
- eller .parquet
-filer på den lagringsplats som du angav. Förvänta dig att nya filer ska placeras på din lagringsplats enligt det exportschema som du angav.
Experience Platform skapar en mappstruktur på den lagringsplats du angav, där den sparar de exporterade datauppsättningsfilerna. Standardmönstret för mappexport visas nedan, men du kan anpassa mappstrukturen med dina favoritmakron.
folder-name-you-provided
- representerar Folder path som du angav när du anslöt till målet för att exportera datauppsättningar.folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM
Standardfilnamnet genereras slumpmässigt och säkerställer att de exporterade filnamnen är unika.
Exempeldatauppsättningsfiler sample-files
De här filerna finns i din lagringsplats, vilket är en bekräftelse på att exporten lyckades. Om du vill veta hur de exporterade filerna är strukturerade kan du hämta ett exempel på filen .parqueteller .json.
Komprimerade datauppsättningsfiler compressed-dataset-files
I anslut till målarbetsflödet kan du välja vilka exporterade datauppsättningsfiler som ska komprimeras, vilket visas nedan:
Observera skillnaden i filformat mellan de två filtyperna när de komprimeras:
- När du exporterar komprimerade JSON-filer är det exporterade filformatet
json.gz
. Formatet för den exporterade JSON-filen är NDJSON, som är standardformatet för utbyte i big data-ekosystemet. Adobe rekommenderar att du använder en NDJSON-kompatibel klient för att läsa de exporterade filerna. - Vid export av komprimerade parquet-filer är det exporterade filformatet
gz.parquet
Exportera till JSON-filer stöds endast i komprimerat läge. Export till Parquet-filer stöds i komprimerat och okomprimerat läge.
Ta bort datauppsättningar från mål remove-dataset
Följ stegen nedan för att ta bort datauppsättningar från ett befintligt dataflöde:
-
Logga in på Experience Platform-gränssnittet och välj Destinations i det vänstra navigeringsfältet. Välj Browse i den övre rubriken om du vill visa befintliga måldataflöden.
note tip TIP Välj filterikonen längst upp till vänster för att öppna sorteringspanelen. På sorteringspanelen finns en lista med alla mål. Du kan markera mer än ett mål i listan om du vill visa ett filtrerat urval av dataflöden som är kopplade till det valda målet. -
I kolumnen Activation data väljer du datauppsättningskontrollen för att visa alla datauppsättningar som är mappade till det här exportdataflödet.
-
Målsidan Activation data visas. Använd kryssrutorna till vänster i datauppsättningslistan för att markera de datauppsättningar som du vill ta bort och markera sedan Remove datasets i den högra listen för att utlösa en bekräftelsedialogruta för att ta bort datauppsättningen.
-
I bekräftelsedialogrutan väljer du Remove för att omedelbart ta bort datauppsättningen från exporter till målet.
Exportberättiganden för datauppsättning licensing-entitlement
Läs produktbeskrivningsdokumenten för att ta reda på hur mycket data du har rätt att exportera för varje Experience Platform-program, per år. Du kan till exempel visa Real-Time CDP produktbeskrivning här.
Observera att dataexporträttigheterna för olika program inte är additiva. Det innebär att om du köper Real-Time CDP Ultimate och Adobe Journey Optimizer Ultimate blir behörigheten för profilexport det större av de två berättigandena enligt produktbeskrivningarna. Volymberättigandena beräknas genom att man räknar ut det totala antalet licensierade profiler och multiplicerar med 500 kB för Real-Time CDP Prime eller 700 kB för Real-Time CDP Ultimate för att avgöra hur mycket data ni har rätt till.
Om du å andra sidan har köpt tillägg som Data Distiller, representerar dataexportgränsen som du är berättigad till summan av produktnivån och tillägget.
Du kan visa och spåra din profilexport mot avtalsgränserna på kontrollpanelen för licensanvändning.
Kända begränsningar known-limitations
Tänk på följande begränsningar för den allmänna tillgänglighetsreleasen för datauppsättningsexporter:
- För närvarande kan du bara exportera inkrementella filer och ett slutdatum kan inte väljas för datauppsättningsexporter.
- Experience Platform kan exportera flera filer även för små datauppsättningar. Datauppsättningsexport är utformad för system-till-system-integration och optimerad för prestanda. Därför går det inte att anpassa antalet exporterade filer.
- Det går för närvarande inte att anpassa exporterade filnamn.
- Datauppsättningar som skapas via API är för närvarande inte tillgängliga för export.
- Gränssnittet blockerar för närvarande inte dig från att ta bort en datauppsättning som exporteras till ett mål. Ta inte bort datauppsättningar som exporteras till destinationer. Ta bort datauppsättningen från ett måldataflöde innan du tar bort den.
- Övervakningsmåtten för datauppsättningsexport är för närvarande blandade med siffrorna för profilexporter, så de återspeglar inte de verkliga exportnumren.
- Data med en tidsstämpel som är äldre än 365 dagar exkluderas från datauppsättningsexporter. Mer information finns i skyddsutkast för schemalagda datauppsättningsexporter
Vanliga frågor faq
Kan vi generera en fil utan en mapp om vi bara sparar på /
som mappsökväg? Om vi inte behöver någon mappsökväg, hur genereras filer med duplicerade namn i en mapp eller på en plats?
+++
Från och med versionen från september 2024 är det möjligt att anpassa mappnamnet och till och med använda /
för att exportera filer för alla datauppsättningar i samma mapp. Adobe rekommenderar inte detta för mål som exporterar flera datauppsättningar eftersom systemgenererade filnamn som tillhör olika datauppsättningar kommer att blandas i samma mapp.
+++
Kan du dirigera manifestfilen till en mapp och datafiler till en annan mapp?
+++
Nej, det går inte att kopiera manifestfilen till en annan plats.
+++
Kan vi styra sekvensering och timing för filleverans?
+++
Det finns alternativ för att schemalägga exporten. Det finns inga alternativ för att fördröja eller sekvensera kopian av filerna. De kopieras till din lagringsplats så snart de har skapats.
+++
Vilka format är tillgängliga för manifestfilen?
+++
Manifestfilen har formatet .json.
+++
Finns det API-tillgänglighet för manifestfilen?
+++
Det finns inget API tillgängligt för manifestfilen, men det innehåller en lista över filer som innehåller exporten.
+++
Kan vi lägga till ytterligare information i manifestfilen (dvs. antal poster)? Om så är fallet, hur?
+++
Det finns ingen möjlighet att lägga till ytterligare information i manifestfilen. Antalet poster är tillgängligt via entiteten flowRun
(kan frågas via API). Läs mer om övervakning av destinationer.
+++
Hur delas datafiler? Hur många poster per fil?
+++
Datafiler delas upp enligt standardpartitionen i datavjön i Experience Platform. Större datauppsättningar har ett större antal partitioner. Standardpartitioneringen kan inte konfigureras av användaren eftersom den är optimerad för läsning.
+++
Kan vi ange ett tröskelvärde (antal poster per fil)?
+++
Nej, det är inte möjligt.
+++
Hur skickar vi om en datauppsättning om den första sändningen inte fungerar?
+++
Försök utförs automatiskt för de flesta typer av systemfel.
+++