Exporter des jeux de données vers des destinations d’espace de stockage
endTime pour l’exportation des flux de données du jeu de données. Adobe a également introduit une date de fin par défaut du 1er septembre 2025 pour tous les flux de données d’exportation de jeux de données créés avant le 1er novembre 2024.Cet article explique le processus requis pour exporter des jeux de données de Adobe Experience Platform vers l’emplacement d’espace de stockage de votre choix, comme des Amazon S3, des emplacements SFTP ou des Google Cloud Storage à l’aide de l’interface utilisateur d’Experience Platform.
Vous pouvez également utiliser les API Experience Platform pour exporter des jeux de données. Pour plus d’informations, consultez le tutoriel API d’exportation de jeux de données .
Jeux de données disponibles pour l’exportation datasets-to-export
Les jeux de données que vous pouvez exporter varient en fonction de l’application Experience Platform (Real-Time CDP, Adobe Journey Optimizer), du niveau (Prime ou Ultimate) et des modules complémentaires que vous avez achetés (par exemple : Data Distiller).
Utilisez le tableau ci-dessous pour comprendre quels types de jeux de données vous pouvez exporter en fonction de votre application, du niveau de produit et des modules complémentaires achetés :
- Jeux de données de profil et d’événement d’expérience créés dans l’interface utilisateur d’Experience Platform après l’ingestion ou la collecte de données par le biais de sources, de Web SDK, de Mobile SDK, du connecteur de données Analytics et d’Audience Manager.
- Jeu de données d’instantanés de profil généré par le système.
Tutoriel vidéo video-tutorial
Regardez la vidéo ci-dessous pour une explication de bout en bout du workflow décrit sur cette page, des avantages de l’utilisation de la fonctionnalité d’exportation du jeu de données et de certains cas d’utilisation suggérés.
Destinations prises en charge supported-destinations
Actuellement, vous pouvez exporter des jeux de données vers les destinations d’espace de stockage mises en surbrillance dans la capture d’écran et répertoriées ci-dessous.
Quand activer des audiences ou exporter des jeux de données when-to-activate-audiences-or-activate-datasets
Certaines destinations basées sur des fichiers du catalogue Experience Platform prennent en charge l’activation des audiences et l’exportation des jeux de données.
- Envisagez l’activation des audiences lorsque vous souhaitez que vos données soient structurées en profils regroupés par intérêt ou qualification d’audience.
- Vous pouvez également envisager des exportations de jeux de données lorsque vous cherchez à exporter des jeux de données bruts, qui ne sont pas groupés ou structurés par intérêt ou qualification d’audience. Vous pouvez utiliser ces données pour la création de rapports, les workflows de science des données et de nombreux autres cas d’utilisation. Par exemple, en tant qu’administrateur, ingénieur de données ou analyste, vous pouvez exporter des données d’Experience Platform pour les synchroniser avec votre entrepôt de données, les utiliser dans des outils d’analyse BI, des outils de ML dans le cloud externe ou les stocker dans votre système pour des besoins de stockage à long terme.
Ce document contient toutes les informations nécessaires à l’exportation de jeux de données. Si vous souhaitez activer des audiences vers des destinations d’espace de stockage ou de marketing par e-mail, lisez Activer les données d’audience vers des destinations d’exportation de profils par lots.
Conditions préalables prerequisites
Notez les conditions préalables suivantes pour exporter des jeux de données :
- Pour exporter des jeux de données vers des destinations d’espace de stockage, vous devez vous être connecté à une destination. Si vous ne l’avez pas déjà fait, accédez au catalogue de destinations, parcourez les destinations prises en charge et configurez la destination que vous souhaitez utiliser.
- Les jeux de données de profil doivent être activés pour être utilisés dans le profil client en temps réel. En savoir plus sur la manière d’activer cette option.
Autorisations nécessaires permissions
Pour exporter des jeux de données, vous avez besoin des View Destinations, View Datasets et Manage and Activate Dataset Destinations autorisations de contrôle d’accès. Lisez la présentation du contrôle d’accès ou contactez votre administrateur de produit pour obtenir les autorisations requises.
Pour vous assurer que vous disposez des autorisations nécessaires pour exporter des jeux de données et que la destination prend en charge l’exportation de jeux de données, parcourez le catalogue des destinations. Si une destination comporte un contrôle Activate ou Export datasets, vous disposez des autorisations appropriées.
Sélectionner votre destination select-destination
Suivez les instructions pour sélectionner une destination vers laquelle vous pouvez exporter vos jeux de données :
-
Accédez à Connections > Destinations, puis sélectionnez l’onglet Catalog .
-
Sélectionnez Activate ou Export datasets sur la carte correspondant à la destination vers laquelle vous souhaitez exporter des jeux de données.
-
Sélectionnez Data type Datasets et sélectionnez la connexion de destination vers laquelle vous souhaitez exporter les jeux de données, puis sélectionnez Next.
- La vue Select datasets s’affiche. Passez à la section suivante pour sélectionner vos jeux de données pour l’exportation.
Sélectionner vos jeux de données select-datasets
Utilisez les cases à cocher situées à gauche des noms de jeux de données pour sélectionner les jeux de données à exporter vers la destination, puis sélectionnez Next.
Planifier l’exportation des jeux de données scheduling
Utilisez l’étape Scheduling pour :
- Définissez une date de début et une date de fin, ainsi qu’une cadence d’exportation pour vos exportations de jeux de données.
- Configurez si les fichiers de jeu de données exportés doivent exporter l’appartenance complète du jeu de données ou simplement des modifications incrémentielles de l’appartenance à chaque occurrence d’exportation.
- Personnalisez le chemin du dossier à l’emplacement de stockage où les jeux de données doivent être exportés. En savoir plus sur la modification du chemin du dossier d’exportation.
Utilisez le contrôle Edit schedule de la page pour modifier le rythme d’exportation des exportations et pour choisir d’exporter des fichiers complets ou incrémentiels.
L’option Export incremental files est sélectionnée par défaut. Cela déclenche l’exportation d’un ou de plusieurs fichiers représentant un instantané complet du jeu de données. Les fichiers suivants sont des ajouts incrémentiels au jeu de données depuis l’exportation précédente. Vous pouvez également sélectionner Export full files. Dans ce cas, sélectionnez la fréquence Once pour une exportation complète unique du jeu de données.
-
Utilisez le sélecteur Frequency pour sélectionner la fréquence d’exportation :
- Daily : planification d’exportations de fichiers incrémentiels une fois par jour, tous les jours, au moment choisi.
- Hourly : planification d’exportations de fichiers incrémentiels toutes les 3, 6, 8 ou 12 heures.
-
Utilisez le sélecteur Time pour choisir l’heure de la journée à laquelle l’exportation doit avoir lieu, au format UTC.
-
Utilisez le sélecteur Date pour choisir l’intervalle à partir duquel l’exportation doit avoir lieu.
-
Sélectionnez Save pour enregistrer le planning et passer à l’étape Review.
Modifier le chemin du dossier edit-folder-path
Sélectionnez Edit folder path pour personnaliser la structure de dossiers de l’emplacement de stockage où les jeux de données exportés sont déposés.
Vous pouvez utiliser plusieurs macros disponibles pour personnaliser le nom de dossier de votre choix. Double-cliquez sur une macro pour l’ajouter au chemin du dossier et utilisez des / entre les macros pour séparer les dossiers.
Après avoir sélectionné les macros souhaitées, vous pouvez voir un aperçu de la structure de dossiers qui sera créée à votre emplacement de stockage. Le premier niveau de la structure de dossiers représente le Folder path que vous avez indiqué lorsque vous êtes connecté à la destination pour exporter des jeux de données.
Bonnes pratiques de gestion de plusieurs jeux de données best-practices-multiple-datasets
Lors de l’exportation de plusieurs jeux de données, tenez compte des bonnes pratiques suivantes :
- Mêmes exigences de planification : regroupez les jeux de données ayant besoin du même planning d’exportation (fréquence, type) dans un seul flux de données pour une gestion plus facile.
- Exigences de planification différentes : créez des flux de données distincts pour les jeux de données qui nécessitent des planifications d’exportation ou des types d’exportation différents (incrémentiel ou complet). Chaque jeu de données est ainsi exporté en fonction de ses besoins spécifiques.
- Vérifier avant de modifier : avant de modifier le planning sur un flux de données existant, vérifiez les jeux de données qui sont déjà exportés par ce flux de données pour éviter toute modification involontaire de leur comportement d’exportation.
- Documentez votre configuration : suivez les jeux de données dans les flux de données, en particulier lors de la gestion de plusieurs plannings d’exportation sur différentes destinations.
Réviser review
Sur la page Review, vous pouvez voir un résumé de votre sélection. Sélectionnez Cancel pour interrompre le flux, Back pour modifier vos paramètres ou Finish pour confirmer votre sélection et commencer à exporter des jeux de données vers la destination.
Vérifier l’exportation réussie d’un jeu de données verify
Lors de l’exportation de jeux de données, Experience Platform crée un ou plusieurs fichiers .json ou .parquet dans l’emplacement de stockage que vous avez fourni. Attendez-vous à ce que de nouveaux fichiers soient déposés dans votre emplacement de stockage en fonction du planning d’exportation que vous avez fourni.
Experience Platform crée une structure de dossiers dans l’emplacement de stockage que vous avez spécifié, où il dépose les fichiers de jeu de données exportés. Le modèle d’exportation de dossier par défaut est illustré ci-dessous, mais vous pouvez personnaliser la structure de dossiers à l’aide de vos macros préférées.
folder-name-you-provided, représente le Folder path que vous avez indiqué lorsque vous connecté à la destination pour exporter des jeux de données.folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM
Le nom de fichier par défaut est généré de manière aléatoire pour garantir que les noms de fichier exportés soient uniques.
Exemples de fichiers de jeu de données sample-files
La présence de ces fichiers dans votre emplacement de stockage confirme que l’export a été réalisé avec succès. Pour comprendre la structure des fichiers exportés, vous pouvez télécharger un exemple de fichier parquet ou de fichier JSON.
Fichiers de jeu de données compressés compressed-dataset-files
Dans le workflow Se connecter à la destination, vous pouvez sélectionner les fichiers de jeu de données exportés à compresser, comme illustré ci-dessous :
Notez la différence de format de fichier entre les deux types de fichiers lorsqu’ils sont compressés :
- Lors de l’exportation de fichiers JSON compressés, le format du fichier exporté est
json.gz. Le format du fichier JSON exporté est NDJSON, qui est le format d’échange standard dans l’écosystème de Big Data. Adobe recommande d’utiliser un client compatible NDJSON pour lire les fichiers exportés. - Lors de l'exportation de fichiers parquet compressés, le format de fichier exporté est
gz.parquet
Les exportations vers des fichiers JSON sont prises en charge en mode compressé uniquement. Les exportations vers les fichiers Parquet sont prises en charge en mode compressé et non compressé.
Supprimer des jeux de données des destinations remove-dataset
Pour supprimer des jeux de données d’un flux de données existant, procédez comme suit :
-
Connectez-vous à l’interface utilisateur d’Experience Platform puis sélectionnez Destinations dans la barre de navigation de gauche. Sélectionnez Browse dans l’en-tête supérieur pour afficher vos flux de données de destination existants.
note tip TIP Sélectionnez l’icône filtre en haut à gauche pour lancer le panneau de tri. Le panneau de tri fournit une liste de toutes vos destinations. Vous pouvez sélectionner plusieurs destinations dans la liste pour afficher une sélection filtrée de flux de données associés à la destination sélectionnée.
-
Dans la colonne Activation data , sélectionnez le contrôle des jeux de données pour afficher tous les jeux de données mappés à ce flux de données d’exportation.
-
La page Activation data de la destination s’affiche. Utilisez les cases à cocher situées sur le côté gauche de la liste des jeux de données pour sélectionner les jeux de données à supprimer, puis sélectionnez Remove datasets dans le rail de droite pour déclencher la boîte de dialogue de confirmation de suppression du jeu de données.
-
Dans la boîte de dialogue de confirmation, sélectionnez Remove pour supprimer immédiatement le jeu de données des exportations vers la destination.
Droits d’exportation de jeux de données licensing-entitlement
Reportez-vous aux documents de description du produit pour connaître la quantité de données que vous êtes autorisé à exporter pour chaque application Experience Platform, par an. Par exemple, vous pouvez afficher la description du produit Real-Time CDP ici.
Notez que les droits d’exportation de données pour différentes applications ne s’additionnent pas. Par exemple, cela signifie que si vous achetez Real-Time CDP Ultimate et Adobe Journey Optimizer Ultimate, le droit d’exportation du profil sera le plus grand des deux droits, conformément aux descriptions des produits. Vos droits de volume sont calculés en multipliant le nombre total de profils sous licence par 500 Ko pour Real-Time CDP Prime ou 700 Ko pour Real-Time CDP Ultimate afin de déterminer le volume de données auquel vous avez droit.
D’un autre côté, si vous avez acheté des modules complémentaires tels que Data Distiller, la limite d’exportation des données à laquelle vous avez droit représente la somme du niveau de produit et du module complémentaire.
Vous pouvez afficher et suivre les exportations de votre profil par rapport à vos limites contractuelles dans le tableau de bord utilisation des licences.
Limites connues known-limitations
Gardez à l’esprit les limites suivantes pour la mise à disposition générale des exportations de jeux de données :
- Experience Platform peut exporter plusieurs fichiers, même pour de petits jeux de données. L’exportation des jeux de données est conçue pour une intégration système à système et optimisée pour les performances. Par conséquent, le nombre de fichiers exportés n’est pas personnalisable.
- Les noms des fichiers exportés ne sont actuellement pas personnalisables.
- Actuellement, l’interface utilisateur ne vous empêche pas de supprimer un jeu de données en cours d’exportation vers une destination. Ne supprimez aucun jeu de données en cours d’exportation vers des destinations. Supprimez le jeu de données d’un flux de données de destination avant de le supprimer.
- Les mesures de surveillance des exportations de jeux de données sont actuellement combinées avec les chiffres des exportations de profils afin qu’elles ne reflètent pas les vrais chiffres d’exportation.
- Les données dont la date et l’heure sont antérieures à 365 jours sont exclues des exportations de jeux de données. Pour plus d’informations, consultez les mécanismes de sécurisation pour les exportations de jeux de données planifiées
Questions fréquentes faq
Pouvons-nous générer un fichier sans dossier si nous enregistrons simplement à / comme chemin d’accès au dossier ? En outre, si nous n’avons pas besoin d’un chemin de dossier, comment les fichiers aux noms en double seront-ils générés dans un dossier ou un emplacement ?
/ pour exporter des fichiers pour tous les jeux de données d’un même dossier. Adobe ne le recommande pas pour les destinations qui exportent plusieurs jeux de données, car les noms de fichiers générés par le système et appartenant à différents jeux de données seront mélangés dans le même dossier.Pouvez-vous acheminer le fichier manifeste vers un dossier et les fichiers de données vers un autre dossier ?
Pouvons-nous contrôler le séquencement ou le timing de la diffusion des fichiers ?
Quels formats sont disponibles pour le fichier manifeste ?
Existe-t-il une disponibilité d’API pour le fichier manifeste ?
Pouvons-nous ajouter des détails supplémentaires au fichier manifeste (c.-à-d. le nombre d’enregistrements) ? Si oui, comment ?
flowRun (interrogeable via l’API). En savoir plus sur la surveillance des destinations.Comment les fichiers de données sont-ils divisés ? Combien d’enregistrements par fichier ?
Peut-on fixer un seuil (nombre d'enregistrements par fichier) ?
Comment renvoyer un jeu de données si l’envoi initial est incorrect ?
Puis-je définir différents plannings d’exportation pour différents jeux de données dans le même flux de données ?