Gegevenssets exporteren naar cloudopslagbestemmingen

AVAILABILITY
  • Deze functionaliteit is beschikbaar voor klanten die het Real-Time CDP Premiere of Ultimate-pakket, Adobe Journey Optimizer of Customer Journey Analytics hebben aangeschaft. Neem contact op met uw Adobe voor meer informatie.

Dit artikel verklaart het werkschema dat wordt vereist om datasetsvan Adobe Experience Platform naar uw aangewezen plaats van de wolkenopslag, zoals Amazon S3, plaatsen SFTP, of Google Cloud Storage uit te voeren door het Experience Platform UI te gebruiken.

U kunt de Experience Platform APIs ook gebruiken om datasets uit te voeren. Lees de leerprogramma's van de uitvoerdatasets APIvoor meer informatie.

Beschikbare gegevensbestanden voor exporteren datasets-to-export

De gegevenssets die u kunt exporteren, variëren op basis van de toepassing van het Experience Platform (Real-Time CDP, Adobe Journey Optimizer), de laag (Premier of Ultimate) en alle invoegtoepassingen die u hebt aangeschaft (bijvoorbeeld Data Distiller).

Gebruik de onderstaande tabel om te begrijpen welke gegevenstypen u kunt exporteren, afhankelijk van uw toepassing, productlaag en eventuele aangeschafte invoegtoepassingen:

Toepassing/invoegtoepassing
Tier
Beschikbare gegevens voor exporteren
Real-Time CDP
Eerste
De datasets van de Gebeurtenis van het profiel en van de Ervaring die in de Experience Platform UI na het opnemen van of het verzamelen van gegevens door Bronnen, Web SDK, Mobiele SDK, de Schakelaar van Gegevens van de Analyse, en Audience Manager worden gecreeerd.
Ultieme
  • De datasets van de Gebeurtenis van het profiel en van de Ervaring die in de Experience Platform UI na het opnemen van of het verzamelen van gegevens door Bronnen, Web SDK, Mobiele SDK, de Schakelaar van Gegevens van de Analyse, en Audience Manager worden gecreeerd.
  • systeem-geproduceerde dataset van de Momentopname van het Profiel.
Adobe Journey Optimizer
Eerste
Raadpleeg de documentatie van Adobe Journey Optimizer.
Ultieme
Raadpleeg de documentatie van Adobe Journey Optimizer.
Customer Journey Analytics
Alles
De datasets van de Gebeurtenis van het profiel en van de Ervaring die in de Experience Platform UI na het opnemen van of het verzamelen van gegevens door Bronnen, Web SDK, Mobiele SDK, de Schakelaar van Gegevens van de Analyse, en Audience Manager worden gecreeerd.
Data Distiller
Distiller-gegevens (invoegtoepassing)
Voortgekomen datasets die door de Dienst van de Vraag worden gecreeerd.

Videotutorial video-tutorial

Bekijk de onderstaande video voor een end-to-end uitleg van de workflow die op deze pagina wordt beschreven, de voordelen van het gebruik van de functie voor het exporteren van gegevenssets en enkele gebruiksscenario's.

Ondersteunde doelen supported-destinations

Momenteel, kunt u datasets naar de bestemmingen van de wolkenopslag uitvoeren die in het schermafbeelding worden benadrukt en hieronder worden vermeld.

de cataloguspagina die van Doelen toont welke bestemmingen dataset uitvoeren steunen.

Wanneer moet u het publiek activeren of gegevenssets exporteren when-to-activate-audiences-or-activate-datasets

Sommige op dossier-gebaseerde bestemmingen in de catalogus van het Experience Platform steunen zowel publieksactivering als dataset de uitvoer.

  • U kunt doelgroepen activeren als u uw gegevens wilt indelen in profielen die zijn gegroepeerd op belangen of kwalificaties van het publiek.
  • U kunt ook gegevenssets exporteren overwegen wanneer u onbewerkte gegevenssets wilt exporteren. Deze zijn niet gegroepeerd of gestructureerd op basis van belangen of kwalificaties van het publiek. U kunt deze gegevens gebruiken voor rapportage, workflows voor gegevenswetenschap en vele andere gebruiksgevallen. Bijvoorbeeld, als beheerder, gegevensingenieur, of analist, kunt u gegevens van Experience Platform uitvoeren om met uw gegevenspakhuis te synchroniseren, gebruik in de analysehulpmiddelen van BI, externe wolkenhulpmiddelen van XML, of opslag in uw systeem voor de opslagbehoeften op lange termijn.

Dit document bevat alle informatie die nodig is om gegevenssets te exporteren. Als u publiek aan cloudopslag of e-mail marketing bestemmingen wilt activeren, lees publieksgegevens aan de uitvoerbestemmingen van het partijprofielactiveren.

Vereisten prerequisites

Om datasets naar de bestemmingen van de wolkenopslag uit te voeren, moet u met succes verbonden aan een bestemminghebben. Als u dit niet reeds hebt gedaan, ga naar de bestemmingscatalogus, doorblader de gesteunde bestemmingen, en vorm de bestemming die u wilt gebruiken.

Vereiste machtigingen permissions

Om datasets uit te voeren, hebt u View Destinations, View Datasets, en Manage and Activate Dataset Destinations toegangsbeheertoestemmingennodig. Lees het overzicht van de toegangscontroleof contacteer uw productbeheerder om de vereiste toestemmingen te verkrijgen.

Om ervoor te zorgen dat u de noodzakelijke toestemmingen hebt om datasets uit te voeren en dat de bestemming het uitvoeren van datasets steunt, doorblader de bestemmingscatalogus. Als een doel een Activate - of Export datasets -besturingselement heeft, hebt u de juiste machtigingen.

Kies uw bestemming select-destination

Volg de instructies om een bestemming te selecteren waar u uw datasets kunt uitvoeren:

  1. Ga naar Connections > Destinations en selecteer de tab Catalog .

    de cataloguslusje van de Bestemming met benadrukte controle van de Catalogus.

  2. Selecteer Activate of Export datasets op de kaart die overeenkomt met het doel waarnaar u gegevenssets wilt exporteren.

    de cataloguslusje van de Bestemming met Activate benadrukte controle.

  3. Selecteer Data type Datasets en selecteer de doelverbinding waarnaar u gegevenssets wilt exporteren, en selecteer vervolgens Next .

TIP
Als u opstelling een nieuwe bestemming wilt om datasets uit te voeren, uitgezocht Configure new destination om te teweegbrengen verbind met bestemmingswerkschema.

benadrukt de activeringswerkschema van de Bestemming met de controle van Datasets.

  1. De weergave Select datasets wordt weergegeven. Ga aan de volgende sectie te werk aan selecteer uw datasetsvoor de uitvoer.

Uw gegevenssets selecteren select-datasets

Gebruik de controlevakjes links van de datasetnamen om de datasets te selecteren die u naar de bestemming wilt uitvoeren, dan uitgezocht Next.

de uitvoerwerkschema die van de Dataset de Uitgezochte datasetstap tonen waar u kunt selecteren welke datasets om uit te voeren.

Gegevensexport voor schema scheduling

Met de stap Scheduling kunt u:

  • Plaats een begindatum en een einddatum, evenals een uitvoerkadentie voor uw datasetuitvoer.
  • Vorm als de uitgevoerde datasetdossiers het volledige lidmaatschap van de dataset of enkel stijgende veranderingen in het lidmaatschap op elk uitvoervoorval zouden moeten uitvoeren.
  • Pas het mappad aan in uw opslaglocatie waar gegevenssets moeten worden geëxporteerd. Lees meer over hoe te de weg van de uitvoeromslaguitgeven.

Gebruik het besturingselement Edit schedule op de pagina om de exportsnelheid van exportbewerkingen te bewerken en om te bepalen of volledige of incrementele bestanden moeten worden geëxporteerd.

geeft programmacontrole uit die in de Plannende stap wordt benadrukt.

De optie Export incremental files is standaard geselecteerd. Dit brengt de uitvoer van één of veelvoudige dossiers teweeg die een volledige momentopname van de dataset vertegenwoordigen. De volgende dossiers zijn stijgende toevoegingen aan de dataset sinds de vorige uitvoer. U kunt ook Export full files selecteren. Selecteer in dit geval de frequentie Once voor een eenmalige volledige uitvoer van de dataset.

IMPORTANT
De eerste incrementele bestandsuitvoer bevat alle bestaande gegevens in de dataset, die als backfill werken. Het exporteren kan een of meerdere bestanden bevatten.

de uitvoerwerkschema die van de Dataset de het plannen stap tonen.

  1. Gebruik de kiezer Frequency om de exportfrequentie te selecteren:

    • Daily: Plan de incrementele bestandsexport eenmaal per dag, elke dag, op het opgegeven tijdstip.
    • Hourly: Plan het incrementele bestand om de 3, 6, 8 of 12 uur.
  2. Gebruik de kiezer van Time om in UTC -indeling de tijd van de dag te kiezen waarop het exporteren moet plaatsvinden.

  3. Gebruik de kiezer van Date om het interval te kiezen waarin het exporteren moet plaatsvinden.

  4. Selecteer Save om het schema op te slaan en door te gaan naar de stap Review .

NOTE
Voor het exporteren van gegevenssets hebben de bestandsnamen een vooraf ingestelde standaardindeling, die niet kan worden gewijzigd. Zie de sectie de succesvolle uitvoer van de datasetvoor meer informatie en voorbeelden van uitgevoerde dossiers verifiëren.

Mappad bewerken edit-folder-path

Selecteer Edit folder path om de mappenstructuur in uw opslagplaats aan te passen waar de uitgevoerde datasets worden gedeponeerd.

geeft de controle van de omslagweg uit die in de het plannen stap wordt benadrukt.

U kunt verschillende beschikbare macro's gebruiken om een gewenste mapnaam aan te passen. Dubbelklik op een macro om deze toe te voegen aan het mappad en gebruik / tussen de macro's om de mappen te scheiden.

de selectie van Macros die in het modale venster van de douanemap wordt benadrukt.

Nadat u de gewenste macro's hebt geselecteerd, ziet u een voorvertoning van de mapstructuur die op uw opslaglocatie wordt gemaakt. Het eerste niveau in de omslagstructuur vertegenwoordigt Folder path dat u wanneer u met de bestemmingverbond om datasets uit te voeren.

Voorproef van omslagweg die in het modale venster van de douaneomslag wordt benadrukt.

Controleren review

Op de pagina Review ziet u een overzicht van uw selectie. Selecteer Cancel om de stroom te verbreken, Back om uw montages te wijzigen, of Finish om uw selectie te bevestigen en datasets aan de bestemming te beginnen uitvoeren.

de uitvoerworkflow die van de Dataset de overzichtsstap toont.

Controleren of gegevensset is geëxporteerd verify

Bij het exporteren van gegevenssets maakt Experience Platform een of meerdere .json - of .parquet -bestanden op de opslaglocatie die u hebt opgegeven. Nieuwe bestanden worden naar verwachting op uw opslaglocatie gedeponeerd volgens het exportschema dat u hebt opgegeven.

Experience Platform leidt tot een omslagstructuur in de opslagplaats u specificeerde, waar het de uitgevoerde datasetdossiers bewaart. Het standaard patroon van de omslaguitvoer wordt hieronder getoond, maar u kunt de omslagstructuur met uw aangewezen macro'saanpassen.

TIP
Het eerste niveau in deze omslagstructuur - folder-name-you-provided - vertegenwoordigt Folder path die u wanneer u met de bestemmingverbonden om datasets uit te voeren.

folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM

De standaardbestandsnaam wordt willekeurig gegenereerd en zorgt ervoor dat geëxporteerde bestandsnamen uniek zijn.

Voorbeeldgegevenssetbestanden sample-files

De aanwezigheid van deze bestanden op uw opslaglocatie is een bevestiging van een geslaagde export. Om te begrijpen hoe de uitgevoerde dossiers gestructureerd zijn, kunt u een steekproef .parquet dossierof .json dossierdownloaden.

Gecomprimeerde gegevensbestanden compressed-dataset-files

In verbind met bestemmingswerkschema, kunt u de uitgevoerde datasetdossiers selecteren om worden samengeperst, zoals hieronder getoond:

het type van Dossier en compressieselectie wanneer het verbinden met een bestemming om datasets uit te voeren.

Houd rekening met het verschil in bestandsindeling tussen de twee bestandstypen bij het comprimeren:

  • Bij het exporteren van gecomprimeerde JSON-bestanden heeft de geëxporteerde bestandsindeling de waarde json.gz . De indeling van de geëxporteerde JSON is NDJSON, de standaardindeling voor gegevensuitwisseling in het ecosysteem big data. Adobe raadt u aan een NDJSON-compatibele client te gebruiken om de geëxporteerde bestanden te lezen.
  • Bij het exporteren van gecomprimeerde parketbestanden is de geëxporteerde bestandsindeling gz.parquet

De uitvoer naar JSON- dossiers wordt gesteund op een samengeperste slechts wijze. Exporteren naar Parquet-bestanden wordt ondersteund in een gecomprimeerde en niet-gecomprimeerde modus.

Gegevenssets verwijderen uit doelen remove-dataset

Om datasets uit een bestaande gegevensstroom te verwijderen, volg de stappen hieronder:

  1. Login aan het Experience Platform UIen selecteert Destinations van de linkernavigatiebar. Selecteer Browse in de bovenste koptekst om de bestaande doelgegevens weer te geven.

    doorbladert de Bestemming mening met een getoonde bestemmingsverbinding en de rest vervaagd uit.

    note tip
    TIP
    Selecteer het filterpictogram filter-pictogram op de bovenkant verlaten om het soortpaneel te lanceren. Het deelvenster Sorteren bevat een lijst met al uw doelen. U kunt meer dan één bestemming van de lijst selecteren om een gefilterde selectie van gegevensstromen te zien verbonden aan de geselecteerde bestemming.
  2. Van de Activation data kolom, selecteer de datasetcontrole om alle datasets te bekijken die aan dit de uitvoerdataflow in kaart worden gebracht.

    de beschikbare optie van de datasetnavigatie die in de kolom van de Gegevens van de Activering wordt benadrukt.

  3. De pagina Activation data voor het doel wordt weergegeven. Gebruik de selectievakjes aan de linkerkant van de lijst met gegevenssets om de gegevenssets te selecteren die u wilt verwijderen en selecteer vervolgens Remove datasets in de rechterrail om het dialoogvenster voor het bevestigen van gegevenssets te openen.

    verwijder datasetdialoog die de Remove datasetcontrole in het juiste spoor toont.

  4. Selecteer in het bevestigingsdialoogvenster Remove om de gegevensset direct te verwijderen uit het exporteren naar het doel.

    Dialoog die de bevestigingsoptie van de datasetverwijdering van dataflow toont.

Uitvoerrechten gegevensset licensing-entitlement

Raadpleeg de productbeschrijvingsdocumenten om te begrijpen hoeveel gegevens u per jaar voor elke Experience Platform-toepassing mag exporteren. Bijvoorbeeld, kunt u de Beschrijving van het Product van Real-Time CDP hierbekijken.

De gegevensuitvoerrechten voor verschillende aanvragen zijn niet additief. Dit betekent bijvoorbeeld dat als u Real-Time CDP Ultimate en Adobe Journey Optimizer Ultimate koopt, de uitvoerrechten voor profielen de hoogste van de twee rechten zijn, zoals beschreven in de productbeschrijvingen. Uw volumeregelingen worden berekend door het totale aantal gelicentieerde profielen te nemen en te vermenigvuldigen met 500 kB voor Real-Time CDP Premium of 700 kB voor Real-Time CDP Ultimate om te bepalen hoeveel gegevensvolume u hebt.

Anderzijds, als u toe:voegen-ons zoals Gegevens Distiller kocht, vertegenwoordigt de grens van de gegevensuitvoer die u gerechtigd bent om te zijn de som van de productrij en de toe:voegen-op.

U kunt uw profieluitvoer tegen uw contractuele grenzen in het dashboard van het vergunningsgebruik bekijken en volgen.

Bekende beperkingen known-limitations

Houd in mening de volgende beperkingen voor de algemene beschikbaarheidsversie van de uitvoer van datasets:

  • Momenteel, kunt u stijgende dossiers slechts uitvoeren en een einddatum kan niet voor uw datasetuitvoer worden geselecteerd.
  • Experience Platform kan veelvoudige dossiers zelfs voor kleine datasets uitvoeren. Dataset exporteren is ontworpen voor systeemintegratie en geoptimaliseerd voor prestaties. Het aantal geëxporteerde bestanden kan daarom niet worden aangepast.
  • De geëxporteerde bestandsnamen kunnen momenteel niet worden aangepast.
  • Datasets die via API zijn gemaakt, zijn momenteel niet beschikbaar voor export.
  • UI blokkeert momenteel niet u van het schrappen van een dataset die naar een bestemming wordt uitgevoerd. Verwijder geen datasets die naar bestemmingen worden geëxporteerd. verwijder de datasetuit een bestemmingsdataflow alvorens het te schrappen.
  • De metriek van de controle voor de uitvoer van datasets wordt momenteel gemengd met aantallen voor profieluitvoer zodat weerspiegelen zij niet de ware uitvoeraantallen.
  • Gegevens met een tijdstempel die ouder is dan 365 dagen, worden niet geëxporteerd voor gegevenssets. Voor meer informatie, bekijk de gidsen voor de geplande uitvoer van datasets

Veelgestelde vragen faq

kunnen wij een dossier zonder een omslag produceren als wij enkel bij / als omslagweg bewaren? Ook, als wij geen omslagweg vereisen, hoe dossiers met dubbele namen in een omslag of een plaats worden geproduceerd?

+++
Vanaf de release van september 2024 kunt u de mapnaam aanpassen en zelfs / gebruiken voor het exporteren van bestanden voor alle gegevenssets in dezelfde map. De Adobe adviseert dit niet voor bestemmingen die veelvoudige datasets uitvoeren, aangezien de systeem-geproduceerde filenames die tot verschillende datasets behoren in de zelfde omslag zullen worden gemengd.
+++

kunt u het manifestdossier aan één omslag en gegevensdossiers in een andere omslag leiden?

+++
Nee, het manifestbestand kan niet naar een andere locatie worden gekopieerd.
+++

kunnen wij het rangschikken of timing van dossierlevering controleren?

+++
Er zijn opties voor het plannen van het exporteren. Er zijn geen opties om de kopie van de bestanden te vertragen of in volgorde te zetten. Ze worden naar de opslaglocatie gekopieerd zodra ze worden gegenereerd.
+++

Welke formaten zijn beschikbaar voor het manifestdossier?

+++
Het manifestbestand heeft de indeling .json.
+++

is er API beschikbaarheid voor het duidelijke dossier?

+++
Er is geen API beschikbaar voor het manifestbestand, maar het bevat wel een lijst met bestanden die de export omvatten.
+++

kunnen wij extra details aan het manifestdossier (d.w.z., verslagtelling) toevoegen? Zo ja, hoe?

+++
Er is geen mogelijkheid om aanvullende informatie aan het manifestbestand toe te voegen. Het aantal records is beschikbaar via de entiteit flowRun (kan worden opgevraagd via de API). Lees meer in bestemmingen controle.
+++

Hoe worden de gegevensdossiers verdeeld? Hoeveel verslagen per dossier?

+++
Gegevensbestanden worden gesplitst volgens de standaardpartitionering in het gegevenspeer van het Experience Platform. Grotere datasets hebben een hoger aantal verdelingen. Standaard het verdelen is niet configureerbaar door de gebruiker aangezien het voor lezing wordt geoptimaliseerd.
+++

kunnen wij een drempel (aantal verslagen per dossier) plaatsen?

+++
Nee, dat is niet mogelijk.
+++

hoe wij opnieuw een gegevensreeks in de gebeurtenis sturen dat de aanvankelijke verzendt slecht is?

+++
Voor de meeste typen systeemfouten worden automatisch opnieuw opgestart.
+++

recommendation-more-help
7f4d1967-bf93-4dba-9789-bb6b505339d6