Gegevensbestanden exporteren
Dit artikel schetst hoe Customer Journey Analytics Export datasets kan worden gebruikt om het volgende dossier van het de uitvoergebruik van gegevens uit te voeren :
- Gegevensback-up
Inleiding
Als u gegevens exporteert met Experience Platform Export datasets , kunt u gegevens uit uw Customer Journey Analytics-gegevensweergaven exporteren naar een willekeurige locatie voor cloudopslag.
Meer informatie
U kunt ruwe datasets, van het gegevensmeer in Experience Platform, naar de bestemmingen van de wolkenopslag uitvoeren. Deze uitvoer is in de terminologie van de Doelen van Experience Platform die als de uitvoerbestemmingen van de Dataset wordt bedoeld. Zie datasets van de Uitvoer aan de bestemmingen van de wolkenopslag voor een overzicht.
De volgende bestemmingen voor cloudopslag worden ondersteund:
EXPERIENCE PLATFORM UI
U kunt het exporteren van uw gegevenssets exporteren en plannen via de gebruikersinterface van Experience Platform. In dit gedeelte worden de desbetreffende stappen beschreven.
Doel selecteren
Wanneer u de bestemming van de wolkenopslag aan hebt bepaald waar u de dataset aan wilt uitvoeren, selecteer de bestemming . Wanneer u nog geen bestemming voor uw aangewezen wolkenopslag hebt gevormd, moet u een nieuwe bestemmingsverbinding tot stand brengen.
Als deel van het vormen van een bestemming, kunt u bepalen:
- het bestandstype (JSON of Parquet);
- of het resulterende bestand al dan niet moet worden gecomprimeerd, en
- of een manifestbestand al dan niet moet worden opgenomen.
Gegevensset selecteren
Wanneer u de bestemming hebt geselecteerd, moet u in de volgende Select datasets stap uw dataset van de lijst van datasets selecteren. Als u veelvoudige geplande vragen hebt gecreeerd, en u de datasets naar de zelfde bestemming van de wolkenopslag wilt verzenden, kunt u de overeenkomstige datasets selecteren. Zie selecteren uw datasets voor meer informatie.
Gegevensexport voor schema
Tot slot wilt u de uitvoer van uw dataset plannen als deel van de Scheduling stap. In die stap kunt u het programma bepalen en of de datasetuitvoer al dan niet incrementeel zou moeten zijn. Zie de datasetuitvoer van het Programma voor meer informatie.
Slotstappen
Overzicht uw selectie, en wanneer correct, begin uw dataset naar de bestemming van de wolkenopslag te exporteren.
Eerst, moet u verifiëren een succesvolle gegevensuitvoer. Bij het exporteren van gegevenssets maakt Experience Platform een of meer .json - of .parquet -bestanden op de opslaglocatie die in uw bestemming is gedefinieerd. Nieuwe bestanden worden naar verwachting op uw opslaglocatie gedeponeerd volgens het exportschema dat u instelt. Experience Platform maakt een mapstructuur op de opslaglocatie die u hebt opgegeven als onderdeel van de geselecteerde bestemming, waar de geëxporteerde bestanden worden opgeslagen. Voor elke exporttijd wordt een nieuwe map gemaakt volgens het patroon: folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM. De standaardbestandsnaam wordt willekeurig gegenereerd en zorgt ervoor dat geëxporteerde bestandsnamen uniek zijn.
Flow Service-API
U kunt ook de export van gegevenssets exporteren en plannen met behulp van API’s. De betrokken stappen worden gedocumenteerd in datasets van de Uitvoer door de Dienst API van de Stroom te gebruiken .
Aan de slag
Om datasets uit te voeren, verzeker u de vereiste toestemmingen hebt. Verifieer ook dat de bestemming waarnaar u uw dataset wilt verzenden het uitvoeren van datasets steunt. U moet dan de waarden voor vereiste en facultatieve kopballen verzamelen die u in de API vraag gebruikt. U moet ook de verbindingsspecificatie en stroom specifieke IDs van de bestemming identificeren u van plan bent datasets naar uit te voeren.
In aanmerking komende gegevenssets ophalen
U kunt een lijst van in aanmerking komende datasets voor de uitvoer terugwinnen en verifiëren of uw dataset deel van die lijst gebruikend GET /connectionSpecs/{id}/configs API uitmaakt.
Bronverbinding maken
Daarna, moet u een bronverbinding voor de dataset tot stand brengen, gebruikend zijn unieke identiteitskaart, die u naar de bestemming van de wolkenopslag wilt uitvoeren. U gebruikt POST /sourceConnections API.
Verifiëren voor bestemming (basisverbinding maken)
U moet nu een basisverbinding tot stand brengen om de geloofsbrieven aan uw bestemming van de wolkenopslag voor authentiek te verklaren en veilig op te slaan gebruikend POST /targetConection API.
Exportparameters opgeven
Daarna, moet u een extra doelverbinding tot stand brengen die de uitvoerparameters voor uw dataset opslaat gebruikend, eens meer, POST /targetConection API. Deze exportparameters zijn onder andere locatie, bestandsindeling, compressie en meer.
Gegevensstroom instellen
Tot slot opstelling dataflow om ervoor te zorgen dat uw dataset wordt uitgevoerd naar uw bestemming van de wolkenopslag gebruikend POST /flows API. In deze stap, kunt u het programma voor de uitvoer bepalen, gebruikend de scheduleParams parameter.
Gegevensstroom valideren
Om succesvolle uitvoeringen van uw dataflow te controleren, gebruik GET /runs API, die dataflow identiteitskaart als vraagparameter specificeren. Deze gegevensstroom-id is een id die wordt geretourneerd wanneer u de gegevensstroom instelt.
verifieer een succesvolle gegevensuitvoer. Bij het exporteren van gegevenssets maakt Experience Platform een of meer .json - of .parquet -bestanden op de opslaglocatie die in uw bestemming is gedefinieerd. Nieuwe bestanden worden naar verwachting op uw opslaglocatie gedeponeerd volgens het exportschema dat u instelt. Experience Platform maakt een mapstructuur op de opslaglocatie die u hebt opgegeven als onderdeel van de geselecteerde bestemming, waar de geëxporteerde bestanden worden opgeslagen. Voor elke exporttijd wordt een nieuwe map gemaakt volgens het patroon: folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM. De standaardbestandsnaam wordt willekeurig gegenereerd en zorgt ervoor dat geëxporteerde bestandsnamen uniek zijn.