Gegevenssets exporteren naar cloudopslagbestemmingen
- Deze functionaliteit is beschikbaar voor klanten die het Real-Time CDP Premiere of Ultimate-pakket, Adobe Journey Optimizer of Customer Journey Analytics hebben aangeschaft. Neem contact op met uw Adobe voor meer informatie.
Dit artikel verklaart het werkschema dat wordt vereist om datasetsvan Adobe Experience Platform naar uw aangewezen plaats van de wolkenopslag, zoals Amazon S3, plaatsen SFTP, of Google Cloud Storage uit te voeren door het Experience Platform UI te gebruiken.
U kunt de Experience Platform APIs ook gebruiken om datasets uit te voeren. Lees de leerprogramma's van de uitvoerdatasets APIvoor meer informatie.
Beschikbare gegevensbestanden voor exporteren datasets-to-export
De gegevenssets die u kunt exporteren, variëren op basis van de toepassing van het Experience Platform (Real-Time CDP, Adobe Journey Optimizer), de laag (Premier of Ultimate) en alle invoegtoepassingen die u hebt aangeschaft (bijvoorbeeld Data Distiller).
Gebruik de onderstaande tabel om te begrijpen welke gegevenstypen u kunt exporteren, afhankelijk van uw toepassing, productlaag en eventuele aangeschafte invoegtoepassingen:
- De datasets van de Gebeurtenis van het profiel en van de Ervaring die in de Experience Platform UI na het opnemen van of het verzamelen van gegevens door Bronnen, Web SDK, Mobiele SDK, de Schakelaar van Gegevens van de Analyse, en Audience Manager worden gecreeerd.
- systeem-geproduceerde dataset van de Momentopname van het Profiel.
Videotutorial video-tutorial
Bekijk de onderstaande video voor een end-to-end uitleg van de workflow die op deze pagina wordt beschreven, de voordelen van het gebruik van de functie voor het exporteren van gegevenssets en enkele gebruiksscenario's.
Ondersteunde doelen supported-destinations
Momenteel, kunt u datasets naar de bestemmingen van de wolkenopslag uitvoeren die in het schermafbeelding worden benadrukt en hieronder worden vermeld.
Wanneer moet u het publiek activeren of gegevenssets exporteren when-to-activate-audiences-or-activate-datasets
Sommige op dossier-gebaseerde bestemmingen in de catalogus van het Experience Platform steunen zowel publieksactivering als dataset de uitvoer.
- U kunt doelgroepen activeren als u uw gegevens wilt indelen in profielen die zijn gegroepeerd op belangen of kwalificaties van het publiek.
- U kunt ook gegevenssets exporteren overwegen wanneer u onbewerkte gegevenssets wilt exporteren. Deze zijn niet gegroepeerd of gestructureerd op basis van belangen of kwalificaties van het publiek. U kunt deze gegevens gebruiken voor rapportage, workflows voor gegevenswetenschap en vele andere gebruiksgevallen. Bijvoorbeeld, als beheerder, gegevensingenieur, of analist, kunt u gegevens van Experience Platform uitvoeren om met uw gegevenspakhuis te synchroniseren, gebruik in de analysehulpmiddelen van BI, externe wolkenhulpmiddelen van XML, of opslag in uw systeem voor de opslagbehoeften op lange termijn.
Dit document bevat alle informatie die nodig is om gegevenssets te exporteren. Als u publiek aan cloudopslag of e-mail marketing bestemmingen wilt activeren, lees publieksgegevens aan de uitvoerbestemmingen van het partijprofielactiveren.
Vereisten prerequisites
Om datasets naar de bestemmingen van de wolkenopslag uit te voeren, moet u met succes verbonden aan een bestemminghebben. Als u dit niet reeds hebt gedaan, ga naar de bestemmingscatalogus, doorblader de gesteunde bestemmingen, en vorm de bestemming die u wilt gebruiken.
Vereiste machtigingen permissions
Om datasets uit te voeren, hebt u View Destinations, View Datasets, en Manage and Activate Dataset Destinations toegangsbeheertoestemmingennodig. Lees het overzicht van de toegangscontroleof contacteer uw productbeheerder om de vereiste toestemmingen te verkrijgen.
Om ervoor te zorgen dat u de noodzakelijke toestemmingen hebt om datasets uit te voeren en dat de bestemming het uitvoeren van datasets steunt, doorblader de bestemmingscatalogus. Als een doel een Activate - of Export datasets -besturingselement heeft, hebt u de juiste machtigingen.
Kies uw bestemming select-destination
Volg de instructies om een bestemming te selecteren waar u uw datasets kunt uitvoeren:
-
Ga naar Connections > Destinations en selecteer de tab Catalog .
-
Selecteer Activate of Export datasets op de kaart die overeenkomt met het doel waarnaar u gegevenssets wilt exporteren.
-
Selecteer Data type Datasets en selecteer de doelverbinding waarnaar u gegevenssets wilt exporteren, en selecteer vervolgens Next .
- De weergave Select datasets wordt weergegeven. Ga aan de volgende sectie te werk aan selecteer uw datasetsvoor de uitvoer.
Uw gegevenssets selecteren select-datasets
Gebruik de controlevakjes links van de datasetnamen om de datasets te selecteren die u naar de bestemming wilt uitvoeren, dan uitgezocht Next.
Gegevensexport voor schema scheduling
Met de stap Scheduling kunt u:
- Plaats een begindatum en een einddatum, evenals een uitvoerkadentie voor uw datasetuitvoer.
- Vorm als de uitgevoerde datasetdossiers het volledige lidmaatschap van de dataset of enkel stijgende veranderingen in het lidmaatschap op elk uitvoervoorval zouden moeten uitvoeren.
- Pas het mappad aan in uw opslaglocatie waar gegevenssets moeten worden geëxporteerd. Lees meer over hoe te de weg van de uitvoeromslaguitgeven.
Gebruik het besturingselement Edit schedule op de pagina om de exportsnelheid van exportbewerkingen te bewerken en om te bepalen of volledige of incrementele bestanden moeten worden geëxporteerd.
De optie Export incremental files is standaard geselecteerd. Dit brengt de uitvoer van één of veelvoudige dossiers teweeg die een volledige momentopname van de dataset vertegenwoordigen. De volgende dossiers zijn stijgende toevoegingen aan de dataset sinds de vorige uitvoer. U kunt ook Export full files selecteren. Selecteer in dit geval de frequentie Once voor een eenmalige volledige uitvoer van de dataset.
-
Gebruik de kiezer Frequency om de exportfrequentie te selecteren:
- Daily: Plan de incrementele bestandsexport eenmaal per dag, elke dag, op het opgegeven tijdstip.
- Hourly: Plan het incrementele bestand om de 3, 6, 8 of 12 uur.
-
Gebruik de kiezer van Time om in UTC -indeling de tijd van de dag te kiezen waarop het exporteren moet plaatsvinden.
-
Gebruik de kiezer van Date om het interval te kiezen waarin het exporteren moet plaatsvinden.
-
Selecteer Save om het schema op te slaan en door te gaan naar de stap Review .
Mappad bewerken edit-folder-path
Selecteer Edit folder path om de mappenstructuur in uw opslagplaats aan te passen waar de uitgevoerde datasets worden gedeponeerd.
U kunt verschillende beschikbare macro's gebruiken om een gewenste mapnaam aan te passen. Dubbelklik op een macro om deze toe te voegen aan het mappad en gebruik /
tussen de macro's om de mappen te scheiden.
Nadat u de gewenste macro's hebt geselecteerd, ziet u een voorvertoning van de mapstructuur die op uw opslaglocatie wordt gemaakt. Het eerste niveau in de omslagstructuur vertegenwoordigt Folder path dat u wanneer u met de bestemmingverbond om datasets uit te voeren.
Controleren review
Op de pagina Review ziet u een overzicht van uw selectie. Selecteer Cancel om de stroom te verbreken, Back om uw montages te wijzigen, of Finish om uw selectie te bevestigen en datasets aan de bestemming te beginnen uitvoeren.
Controleren of gegevensset is geëxporteerd verify
Bij het exporteren van gegevenssets maakt Experience Platform een of meerdere .json
- of .parquet
-bestanden op de opslaglocatie die u hebt opgegeven. Nieuwe bestanden worden naar verwachting op uw opslaglocatie gedeponeerd volgens het exportschema dat u hebt opgegeven.
Experience Platform leidt tot een omslagstructuur in de opslagplaats u specificeerde, waar het de uitgevoerde datasetdossiers bewaart. Het standaard patroon van de omslaguitvoer wordt hieronder getoond, maar u kunt de omslagstructuur met uw aangewezen macro'saanpassen.
folder-name-you-provided
- vertegenwoordigt Folder path die u wanneer u met de bestemmingverbonden om datasets uit te voeren.folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM
De standaardbestandsnaam wordt willekeurig gegenereerd en zorgt ervoor dat geëxporteerde bestandsnamen uniek zijn.
Voorbeeldgegevenssetbestanden sample-files
De aanwezigheid van deze bestanden op uw opslaglocatie is een bevestiging van een geslaagde export. Om te begrijpen hoe de uitgevoerde dossiers gestructureerd zijn, kunt u een steekproef .parquet dossierof .json dossierdownloaden.
Gecomprimeerde gegevensbestanden compressed-dataset-files
In verbind met bestemmingswerkschema, kunt u de uitgevoerde datasetdossiers selecteren om worden samengeperst, zoals hieronder getoond:
Houd rekening met het verschil in bestandsindeling tussen de twee bestandstypen bij het comprimeren:
- Bij het exporteren van gecomprimeerde JSON-bestanden heeft de geëxporteerde bestandsindeling de waarde
json.gz
. De indeling van de geëxporteerde JSON is NDJSON, de standaardindeling voor gegevensuitwisseling in het ecosysteem big data. Adobe raadt u aan een NDJSON-compatibele client te gebruiken om de geëxporteerde bestanden te lezen. - Bij het exporteren van gecomprimeerde parketbestanden is de geëxporteerde bestandsindeling
gz.parquet
De uitvoer naar JSON- dossiers wordt gesteund op een samengeperste slechts wijze. Exporteren naar Parquet-bestanden wordt ondersteund in een gecomprimeerde en niet-gecomprimeerde modus.
Gegevenssets verwijderen uit doelen remove-dataset
Om datasets uit een bestaande gegevensstroom te verwijderen, volg de stappen hieronder:
-
Login aan het Experience Platform UIen selecteert Destinations van de linkernavigatiebar. Selecteer Browse in de bovenste koptekst om de bestaande doelgegevens weer te geven.
note tip TIP Selecteer het filterpictogram op de bovenkant verlaten om het soortpaneel te lanceren. Het deelvenster Sorteren bevat een lijst met al uw doelen. U kunt meer dan één bestemming van de lijst selecteren om een gefilterde selectie van gegevensstromen te zien verbonden aan de geselecteerde bestemming. -
Van de Activation data kolom, selecteer de datasetcontrole om alle datasets te bekijken die aan dit de uitvoerdataflow in kaart worden gebracht.
-
De pagina Activation data voor het doel wordt weergegeven. Gebruik de selectievakjes aan de linkerkant van de lijst met gegevenssets om de gegevenssets te selecteren die u wilt verwijderen en selecteer vervolgens Remove datasets in de rechterrail om het dialoogvenster voor het bevestigen van gegevenssets te openen.
-
Selecteer in het bevestigingsdialoogvenster Remove om de gegevensset direct te verwijderen uit het exporteren naar het doel.
Uitvoerrechten gegevensset licensing-entitlement
Raadpleeg de productbeschrijvingsdocumenten om te begrijpen hoeveel gegevens u per jaar voor elke Experience Platform-toepassing mag exporteren. Bijvoorbeeld, kunt u de Beschrijving van het Product van Real-Time CDP hierbekijken.
De gegevensuitvoerrechten voor verschillende aanvragen zijn niet additief. Dit betekent bijvoorbeeld dat als u Real-Time CDP Ultimate en Adobe Journey Optimizer Ultimate koopt, de uitvoerrechten voor profielen de hoogste van de twee rechten zijn, zoals beschreven in de productbeschrijvingen. Uw volumeregelingen worden berekend door het totale aantal gelicentieerde profielen te nemen en te vermenigvuldigen met 500 kB voor Real-Time CDP Premium of 700 kB voor Real-Time CDP Ultimate om te bepalen hoeveel gegevensvolume u hebt.
Anderzijds, als u toe:voegen-ons zoals Gegevens Distiller kocht, vertegenwoordigt de grens van de gegevensuitvoer die u gerechtigd bent om te zijn de som van de productrij en de toe:voegen-op.
U kunt uw profieluitvoer tegen uw contractuele grenzen in het dashboard van het vergunningsgebruik bekijken en volgen.
Bekende beperkingen known-limitations
Houd in mening de volgende beperkingen voor de algemene beschikbaarheidsversie van de uitvoer van datasets:
- Momenteel, kunt u stijgende dossiers slechts uitvoeren en een einddatum kan niet voor uw datasetuitvoer worden geselecteerd.
- Experience Platform kan veelvoudige dossiers zelfs voor kleine datasets uitvoeren. Dataset exporteren is ontworpen voor systeemintegratie en geoptimaliseerd voor prestaties. Het aantal geëxporteerde bestanden kan daarom niet worden aangepast.
- De geëxporteerde bestandsnamen kunnen momenteel niet worden aangepast.
- Datasets die via API zijn gemaakt, zijn momenteel niet beschikbaar voor export.
- UI blokkeert momenteel niet u van het schrappen van een dataset die naar een bestemming wordt uitgevoerd. Verwijder geen datasets die naar bestemmingen worden geëxporteerd. verwijder de datasetuit een bestemmingsdataflow alvorens het te schrappen.
- De metriek van de controle voor de uitvoer van datasets wordt momenteel gemengd met aantallen voor profieluitvoer zodat weerspiegelen zij niet de ware uitvoeraantallen.
- Gegevens met een tijdstempel die ouder is dan 365 dagen, worden niet geëxporteerd voor gegevenssets. Voor meer informatie, bekijk de gidsen voor de geplande uitvoer van datasets
Veelgestelde vragen faq
kunnen wij een dossier zonder een omslag produceren als wij enkel bij /
als omslagweg bewaren? Ook, als wij geen omslagweg vereisen, hoe dossiers met dubbele namen in een omslag of een plaats worden geproduceerd?
+++
Vanaf de release van september 2024 kunt u de mapnaam aanpassen en zelfs /
gebruiken voor het exporteren van bestanden voor alle gegevenssets in dezelfde map. De Adobe adviseert dit niet voor bestemmingen die veelvoudige datasets uitvoeren, aangezien de systeem-geproduceerde filenames die tot verschillende datasets behoren in de zelfde omslag zullen worden gemengd.
+++
kunt u het manifestdossier aan één omslag en gegevensdossiers in een andere omslag leiden?
+++
Nee, het manifestbestand kan niet naar een andere locatie worden gekopieerd.
+++
kunnen wij het rangschikken of timing van dossierlevering controleren?
+++
Er zijn opties voor het plannen van het exporteren. Er zijn geen opties om de kopie van de bestanden te vertragen of in volgorde te zetten. Ze worden naar de opslaglocatie gekopieerd zodra ze worden gegenereerd.
+++
Welke formaten zijn beschikbaar voor het manifestdossier?
+++
Het manifestbestand heeft de indeling .json.
+++
is er API beschikbaarheid voor het duidelijke dossier?
+++
Er is geen API beschikbaar voor het manifestbestand, maar het bevat wel een lijst met bestanden die de export omvatten.
+++
kunnen wij extra details aan het manifestdossier (d.w.z., verslagtelling) toevoegen? Zo ja, hoe?
+++
Er is geen mogelijkheid om aanvullende informatie aan het manifestbestand toe te voegen. Het aantal records is beschikbaar via de entiteit flowRun
(kan worden opgevraagd via de API). Lees meer in bestemmingen controle.
+++
Hoe worden de gegevensdossiers verdeeld? Hoeveel verslagen per dossier?
+++
Gegevensbestanden worden gesplitst volgens de standaardpartitionering in het gegevenspeer van het Experience Platform. Grotere datasets hebben een hoger aantal verdelingen. Standaard het verdelen is niet configureerbaar door de gebruiker aangezien het voor lezing wordt geoptimaliseerd.
+++
kunnen wij een drempel (aantal verslagen per dossier) plaatsen?
+++
Nee, dat is niet mogelijk.
+++
hoe wij opnieuw een gegevensreeks in de gebeurtenis sturen dat de aanvankelijke verzendt slecht is?
+++
Voor de meeste typen systeemfouten worden automatisch opnieuw opgestart.
+++