Exporter les jeux de données
Cet article décrit comment le Customer Journey Analytics Export datasets peut être utilisé pour implémenter le cas d’utilisation d’exportation de données suivant :
- Sauvegarde des données
Introduction
L’exportation de données à l’aide de Experience Platform Export datasets vous permet d’exporter des données de vos vues de données Customer Journey Analytics vers n’importe quelle destination d’espace de stockage.
Extension
Informations supplémentaires
Vous pouvez exporter des jeux de données bruts du lac de données dans Experience Platform vers des destinations d’espace de stockage. Cette exportation figure dans la terminologie des destinations Experience Platform, appelée destinations d’exportation de jeu de données. Consultez Exporter des jeux de données vers des destinations d’espace de stockage pour une présentation.
Les destinations suivantes de stockage dans le cloud sont prises en charge :
Interface utilisateur d’Experience Platform
Vous pouvez exporter et planifier l’exportation de vos jeux de données via l’interface utilisateur d’Experience Platform. Cette section décrit les étapes à suivre.
Sélectionner la destination
Lorsque vous avez déterminé la destination d’espace de stockage vers laquelle vous souhaitez exporter le jeu de données, sélectionnez la destination. Lorsque vous n’avez pas encore configuré de destination pour votre espace de stockage dans le cloud préféré, vous devez créer une connexion de destination.
Dans le cadre de la configuration d’une destination, vous pouvez définir :
- le type de fichier (JSON ou Parquet),
- si le fichier résultant doit être compressé ou non, et
- si un fichier manifeste doit être inclus ou non.
Sélectionner le jeu de données
Lorsque vous avez sélectionné la destination, à l’étape suivante Sélectionner des jeux de données vous devez sélectionner votre jeu de données dans la liste des jeux de données. Si vous avez créé plusieurs requêtes planifiées et que vous souhaitez que les jeux de données soient envoyés à la même destination d’espace de stockage, vous pouvez sélectionner les jeux de données correspondants. Voir Sélectionner vos jeux de données pour plus d’informations.
Planifier l’exportation des jeux de données
Enfin, vous souhaitez planifier l’exportation de votre jeu de données dans le cadre de l’étape Planification. Au cours de cette étape, vous pouvez définir le planning et déterminer si l’exportation du jeu de données doit être incrémentielle ou non. Voir Planifier l’exportation de jeux de données pour plus d’informations.
Dernières étapes
Vérifiez votre sélection et, une fois qu’elle est correcte, commencez à exporter votre jeu de données vers la destination d’espace de stockage.
Tout d’abord, vous devez vérifier une exportation de données réussie. Lors de l’exportation de jeux de données, Experience Platform crée un ou plusieurs fichiers .json ou .parquet à l’emplacement de stockage défini dans la destination. Attendez-vous à ce que de nouveaux fichiers soient déposés dans votre emplacement de stockage en fonction du planning d’exportation que vous avez configuré. Experience Platform crée une structure de dossiers à l’emplacement de stockage que vous avez spécifié dans le cadre de la destination sélectionnée, où il dépose les fichiers exportés. Un nouveau dossier est créé pour chaque heure d’exportation, en suivant le modèle : folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM. Le nom de fichier par défaut est généré de manière aléatoire pour garantir que les noms de fichier exportés soient uniques.
API Flow Service
Vous pouvez également exporter et planifier l’exportation des jeux de données à l’aide d’API. Les étapes impliquées sont documentées dans Exporter des jeux de données à l’aide de l’API Flow Service.
Commencer
Pour exporter des jeux de données, vérifiez que vous disposez des autorisations requises. Vérifiez également que la destination vers laquelle vous souhaitez envoyer votre jeu de données prend en charge l’exportation de jeux de données. Vous devez ensuite rassembler les valeurs des en-têtes obligatoires et facultatifs que vous utilisez dans les appels API. Vous devez également identifier la spécification de connexion et les identifiants de spécification de flux de la destination vers lesquels vous envisagez d’exporter des jeux de données.
Récupérer des jeux de données éligibles
Vous pouvez récupérer une liste de jeux de données éligibles pour l’exportation et vérifier si votre jeu de données fait partie de cette liste à l’aide de l’API GET /connectionSpecs/{id}/configs.
Créer une connexion source
Ensuite, vous devez créer une connexion source pour le jeu de données, à l’aide de son identifiant unique, que vous souhaitez exporter vers la destination d’espace de stockage. Vous utilisez l’API POST /sourceConnections.
S’authentifier auprès de la destination (créer une connexion de base)
Vous devez maintenant créer une connexion de base pour authentifier et stocker en toute sécurité les informations d’identification vers votre destination d’espace de stockage dans le cloud à l’aide de l’API POST /targetConection.
Fournir des paramètres d’exportation
Ensuite, vous devez créer une connexion cible supplémentaire qui stocke les paramètres d’exportation pour votre jeu de données à l’aide, une fois de plus, de l’API POST /targetConection. Ces paramètres d’exportation incluent l’emplacement, le format de fichier, la compression, etc.
Configurer le flux de données
Enfin, vous configurez le flux de données pour vous assurer que votre jeu de données est exporté vers votre destination d’espace de stockage à l’aide de l’API POST /flows. Au cours de cette étape, vous pouvez définir le planning de l’exportation à l’aide du paramètre scheduleParams .
Valider le flux de données
Pour vérifier les exécutions réussies de votre flux de données, utilisez l’API GET /runs en spécifiant l’identifiant du flux de données comme paramètre de requête. Cet identifiant de flux de données est un identifiant renvoyé lorsque vous configurez le flux de données.
Vérifier une exportation de données réussie. Lors de l’exportation de jeux de données, Experience Platform crée un ou plusieurs fichiers .json ou .parquet à l’emplacement de stockage défini dans la destination. Attendez-vous à ce que de nouveaux fichiers soient déposés dans votre emplacement de stockage en fonction du planning d’exportation que vous avez configuré. Experience Platform crée une structure de dossiers à l’emplacement de stockage que vous avez spécifié dans le cadre de la destination sélectionnée, où il dépose les fichiers exportés. Un nouveau dossier est créé pour chaque heure d’exportation, en suivant le modèle : folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM. Le nom de fichier par défaut est généré de manière aléatoire pour garantir que les noms de fichier exportés soient uniques.