Exportation des jeux de données vers des destinations de stockage dans le cloud

AVAILABILITY
  • Cette fonctionnalité est disponible pour les clients qui ont acheté le package Real-Time CDP Prime ou Ultimate, Adobe Journey Optimizer ou Customer Journey Analytics. Pour plus d’informations, contactez votre représentant d’Adobe.

Cet article explique le processus requis pour exporter des jeux de données de Adobe Experience Platform vers l’emplacement de stockage dans le cloud de votre choix, par exemple Amazon S3, des emplacements SFTP ou Google Cloud Storage à l’aide de l’interface utilisateur Experience Platform.

Vous pouvez également utiliser les API Experience Platform pour exporter des jeux de données. Pour plus d’informations, consultez le tutoriel sur l’API d’exportation de jeux de données .

Jeux de données disponibles pour l’exportation datasets-to-export

Les jeux de données que vous pouvez exporter dépendent de l’application Experience Platform (Real-Time CDP, Adobe Journey Optimizer), du niveau (Prime ou Ultimate) et des modules complémentaires achetés (par exemple : Data Distiller).

Utilisez le tableau ci-dessous pour déterminer les types de jeux de données que vous pouvez exporter en fonction de votre application, du niveau du produit et des modules complémentaires achetés :

Application/module complémentaire
Niveau
Jeux de données disponibles pour l’exportation
Real-Time CDP
Prime
Jeux de données Profile et Experience Event créés dans l’interface utilisateur de l’Experience Platform après ingestion ou collecte de données par le biais de sources, SDK web, SDK mobile, Analytics Data Connector et Audience Manager.
Ultimate
Adobe Journey Optimizer
Prime
Reportez-vous à la documentation Adobe Journey Optimizer .
Ultimate
Reportez-vous à la documentation Adobe Journey Optimizer .
Customer Journey Analytics
Toutes
Jeux de données Profile et Experience Event créés dans l’interface utilisateur de l’Experience Platform après ingestion ou collecte de données par le biais de sources, SDK web, SDK mobile, Analytics Data Connector et Audience Manager.
Data Distiller
Distiller de données (module complémentaire)
Jeux de données dérivés créés via Query Service.

Tutoriel vidéo video-tutorial

Regardez la vidéo ci-dessous pour obtenir une explication de bout en bout du workflow décrit sur cette page, les avantages de l’utilisation de la fonctionnalité d’exportation de jeux de données et quelques cas d’utilisation suggérés.

Destinations prises en charge supported-destinations

Actuellement, vous pouvez exporter des jeux de données vers les destinations de stockage dans le cloud mises en évidence dans la capture d’écran et répertoriées ci-dessous.

Page du catalogue des destinations montrant les destinations qui prennent en charge les exportations de jeux de données.

Quand activer des audiences ou exporter des jeux de données when-to-activate-audiences-or-activate-datasets

Certaines destinations basées sur des fichiers du catalogue de l’Experience Platform prennent en charge l’activation de l’audience et l’exportation de jeux de données.

  • Envisagez d’activer des audiences lorsque vous souhaitez que vos données soient structurées en profils regroupés par intérêt ou qualification d’audience.
  • Vous pouvez également envisager des exportations de jeux de données lorsque vous cherchez à exporter des jeux de données bruts, qui ne sont pas groupés ou structurés par intérêt ou qualification d’audience. Vous pouvez utiliser ces données pour la création de rapports, des workflows de science des données et de nombreux autres cas d’utilisation. Par exemple, en tant qu’administrateur, ingénieur de données ou analyste, vous pouvez exporter des données d’Experience Platform pour les synchroniser avec votre entrepôt de données, les utiliser dans des outils d’analyse de BI, des outils ML externes dans le cloud ou les stocker dans votre système pour des besoins de stockage à long terme.

Ce document contient toutes les informations nécessaires à l’exportation de jeux de données. Si vous souhaitez activer audiences vers des destinations de stockage dans le cloud ou de marketing par e-mail, lisez Activer les données d’audience vers des destinations d’exportation de profil de lot.

Conditions préalables prerequisites

Pour exporter des jeux de données vers des destinations d’espace de stockage, vous devez vous être connecté à une destination. Si vous ne l’avez pas déjà fait, accédez au catalogue de destinations, parcourez les destinations prises en charge et configurez la destination que vous souhaitez utiliser.

Autorisations nécessaires permissions

Pour exporter des jeux de données, vous avez besoin des , d’afficher les jeux de données et de 🔗 autorisations de contrôle d’accès pour gérer et activer les destinations de jeu de données. Lisez la présentation du contrôle d’accès ou contactez votre administrateur de produit pour obtenir les autorisations requises.

Pour vous assurer que vous disposez des autorisations nécessaires pour exporter des jeux de données et que la destination prend en charge l’exportation de jeux de données, parcourez le catalogue des destinations. Si une destination comporte un contrôle Activer ou Exporter des jeux de données, vous disposez des autorisations appropriées.

Sélectionner votre destination select-destination

Suivez les instructions pour sélectionner une destination vers laquelle vous pouvez exporter vos jeux de données :

  1. Accédez à Connexions > Destinations, puis sélectionnez l’onglet Catalogue.

    Onglet Catalogue de destination avec le contrôle Catalogue mise en surbrillance.

  2. Sélectionnez Activer ou Exporter des jeux de données sur la vignette correspondant à la destination vers laquelle vous souhaitez exporter des jeux de données.

    Onglet Catalogue de destinations avec le contrôle Activer mis en surbrillance.

  3. Sélectionnez Type de données des jeux de données et sélectionnez la connexion de destination vers laquelle vous souhaitez exporter les jeux de données, puis sélectionnez Suivant.

TIP
Si vous souhaitez configurer une nouvelle destination pour exporter des jeux de données, sélectionnez Configurer une nouvelle destination pour déclencher le workflow Se connecter à la destination.

Workflow d’activation de destination avec le contrôle Jeux de données mis en surbrillance.

  1. La vue Sélectionner des jeux de données apparaît. Passez à la section suivante pour sélectionner vos jeux de données pour l’exportation.

Sélectionner vos jeux de données select-datasets

Utilisez les cases à cocher situées à gauche des jeux de données pour sélectionner les jeux de données que vous souhaitez exporter vers la destination, puis sélectionnez Suivant.

Workflow d’exportation des jeux de données présentant l’étape de sélection des jeux de données permettant de sélectionner les jeux de données à exporter.

Planifier l’exportation des jeux de données scheduling

Utilisez l’étape Planification pour :

  • Définissez une date de début et une date de fin, ainsi qu’une cadence d’exportation pour vos exportations de jeux de données.
  • Configurez si les fichiers de jeu de données exportés doivent exporter l’appartenance complète du jeu de données ou uniquement les modifications incrémentielles de l’appartenance à chaque occurrence d’exportation.
  • Personnalisez le chemin du dossier dans l’emplacement de stockage où les jeux de données doivent être exportés. Découvrez comment modifier le chemin d’accès au dossier d’exportation.

Utilisez le contrôle Modifier la planification de la page pour modifier la cadence d’exportation des exportations et pour choisir d’exporter des fichiers complets ou incrémentiels.

Modifier le contrôle de planification en surbrillance dans l’étape de planification.

L’option Exporter les fichiers incrémentiels est sélectionnée par défaut. Cela déclenche l’exportation d’un ou de plusieurs fichiers représentant un instantané complet du jeu de données. Les fichiers suivants sont des ajouts incrémentiels au jeu de données depuis l’exportation précédente. Vous pouvez également sélectionner Exporter des fichiers complets. Dans ce cas, sélectionnez la fréquence Once pour une exportation complète unique du jeu de données.

IMPORTANT
La première exportation de fichier incrémentiel inclut toutes les données existantes dans le jeu de données, en tant que renvoi. L’exportation peut contenir un ou plusieurs fichiers.

Workflow d’exportation de jeu de données présentant l’étape de planification.

  1. Utilisez le sélecteur Fréquence pour sélectionner la fréquence d’exportation :

    • Tous les jours  : planification d’exportations de fichiers incrémentiels une fois par jour, tous les jours, au moment choisi.
    • Par heure  : planification d’exportations de fichiers incrémentiels toutes les 3, 6, 8 ou 12 heures.
  2. Utilisez le sélecteur Heure pour choisir l’heure de la journée, au format UTC, à laquelle l’exportation doit avoir lieu.

  3. Utilisez le sélecteur Date pour choisir l’intervalle auquel l’exportation doit avoir lieu.

  4. Sélectionnez Enregistrer pour enregistrer la planification et passer à l’étape Réviser.

NOTE
Pour les exportations de jeu de données, les noms de fichiers ont un paramètre prédéfini, format par défaut, qui ne peut être modifié. Voir la section Vérification de l’exportation réussie d’un jeu de données pour plus d’informations et d’exemples de fichiers exportés.

Modifier le chemin du dossier edit-folder-path

Sélectionnez Modifier le chemin du dossier pour personnaliser la structure du dossier dans l’emplacement de stockage où les jeux de données exportés sont déposés.

Modifier le contrôle de chemin de dossier mis en surbrillance dans l’étape de planification.

Vous pouvez utiliser plusieurs macros disponibles pour personnaliser un nom de dossier. Double-cliquez sur une macro pour l’ajouter au chemin du dossier et utilisez / entre les macros pour séparer les dossiers.

Sélection de macros mise en surbrillance dans la fenêtre modale du dossier personnalisé.

Après avoir sélectionné les macros souhaitées, vous pouvez voir un aperçu de la structure de dossiers qui sera créée à l’emplacement de stockage. Le premier niveau de la structure de dossiers représente le chemin d’accès au dossier que vous avez indiqué lorsque vous êtes connecté à la destination pour exporter des jeux de données.

Aperçu du chemin du dossier surligné dans la fenêtre modale du dossier personnalisé.

Révision review

Sur la page Vérifier, vous pouvez voir un résumé de votre sélection. Sélectionnez Annuler pour interrompre le flux, Précédent pour modifier vos paramètres ou Terminer pour confirmer votre sélection et commencer à envoyer les jeux de données à la destination.

Workflow d’exportation des jeux de données présentant l’étape de révision.

Vérifier l’exportation réussie d’un jeu de données verify

Lors de l’exportation de jeux de données, Experience Platform crée un ou plusieurs fichiers .json ou .parquet dans l’emplacement de stockage que vous avez fourni. Attendez-vous à ce que les nouveaux fichiers soient déposés dans votre emplacement de stockage en fonction du planning d’exportation que vous avez fourni.

Experience Platform crée une structure de dossiers dans l’emplacement de stockage que vous avez spécifié, où il dépose les fichiers de jeu de données exportés. Le modèle d’exportation de dossiers par défaut est illustré ci-dessous, mais vous pouvez personnaliser la structure de dossiers avec vos macros préférées.

TIP
Le premier niveau de cette structure de dossiers - folder-name-you-provided - représente le chemin de dossier que vous avez indiqué lorsque vous êtes 🔗 connecté à la destination pour exporter des jeux de données.

folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM

Le nom de fichier par défaut est généré de manière aléatoire pour garantir que les noms de fichier exportés soient uniques.

Exemples de fichiers de jeu de données sample-files

La présence de ces fichiers dans votre emplacement de stockage confirme que l’activation a été réalisée avec succès. Pour comprendre la structure des fichiers exportés, vous pouvez télécharger un exemple de fichier parquet ou de fichier JSON.

Fichiers de jeux de données compressés compressed-dataset-files

Dans le workflow de connexion à la destination, vous pouvez sélectionner les fichiers de jeu de données exportés à compresser, comme illustré ci-dessous :

Sélection du type de fichier et de la compression lors de la connexion à une destination pour exporter des jeux de données.

Notez la différence de format de fichier entre les deux types de fichiers, lorsqu’ils sont compressés :

  • Lors de l’exportation de fichiers JSON compressés, le format du fichier exporté est json.gz. Le format du fichier JSON exporté est NDJSON, qui est le format d’échange standard dans l’écosystème de données massives. Adobe recommande d’utiliser un client compatible NDJSON pour lire les fichiers exportés.
  • Lors de l’exportation de fichiers parquet compressés, le format de fichier exporté est gz.parquet

Les exportations vers les fichiers JSON sont prises en charge en mode compressé uniquement. Les exportations vers les fichiers Parquet sont prises en charge en mode compressé et non compressé.

Suppression des jeux de données des destinations remove-dataset

Pour supprimer des jeux de données d’un flux de données existant, procédez comme suit :

  1. Connectez-vous à l’interface utilisateur Experience Platform et sélectionnez Destinations dans la barre de navigation de gauche. Sélectionnez Parcourir dans l’en-tête supérieur pour afficher vos flux de données de destination existants.

    La vue de navigation de destination avec une connexion de destination affichée et le reste s’est estompée.

    note tip
    TIP
    Sélectionnez l’icône filtre Icône Filtre en haut à gauche pour lancer le panneau de tri. Le panneau de tri fournit une liste de toutes vos destinations. Vous pouvez sélectionner plusieurs destinations dans la liste pour afficher une sélection filtrée de flux de données associés à la destination sélectionnée.
  2. Dans la colonne Données d’activation, sélectionnez le contrôle des jeux de données pour afficher tous les jeux de données mappés à ce flux de données d’exportation.

    L’option de navigation des jeux de données disponibles est affichée en surbrillance dans la colonne Données d’activation.

  3. La page Données d’activation pour la destination s’affiche. Utilisez les cases à cocher situées à gauche de la liste des jeux de données pour sélectionner les jeux de données à supprimer, puis sélectionnez Supprimer les jeux de données dans le rail de droite pour déclencher la boîte de dialogue de confirmation de suppression des jeux de données.

    Boîte de dialogue Supprimer le jeu de données présentant la commande Supprimer le jeu de données dans le rail de droite.

  4. Dans la boîte de dialogue de confirmation, sélectionnez Supprimer pour supprimer immédiatement le jeu de données des exportations vers la destination.

    Boîte de dialogue présentant l’option Confirmer la suppression du jeu de données du flux de données.

Droits d’exportation des jeux de données licensing-entitlement

Consultez les documents de description du produit pour comprendre la quantité de données que vous êtes autorisé à exporter pour chaque application Experience Platform, par an. Par exemple, vous pouvez afficher la description du produit Real-Time CDP ici.

Notez que les droits à l’exportation des données pour différentes applications ne sont pas additifs. Par exemple, cela signifie que si vous achetez Real-Time CDP Ultimate et Adobe Journey Optimizer Ultimate, les droits d’exportation de profil seront les plus grands des deux droits, selon les descriptions de produit. Vos droits sur le volume sont calculés en prenant le nombre total de profils sous licence et en multipliant par 500 Ko pour Real-Time CDP Prime ou 700 Ko pour Real-Time CDP Ultimate afin de déterminer le volume de données auquel vous avez droit.

D’un autre côté, si vous avez acheté des modules complémentaires tels que Data Distiller, la limite d’exportation des données à laquelle vous avez droit représente la somme du niveau produit et du module complémentaire.

Vous pouvez consulter et suivre les exportations de vos profils par rapport à vos limites contractuelles dans le tableau de bord de l’utilisation des licences.

Limites connues known-limitations

Gardez à l’esprit les limites suivantes relatives à la disponibilité générale des exportations de jeux de données :

  • Actuellement, vous ne pouvez exporter que des fichiers incrémentiels et il est impossible de sélectionner une date de fin pour vos exportations de jeux de données.
  • Experience Platform peut exporter plusieurs fichiers, même pour de petits jeux de données. L’exportation des jeux de données est conçue pour l’intégration système à système et optimisée pour les performances. Par conséquent, le nombre de fichiers exportés n’est pas personnalisable.
  • Les noms de fichiers exportés ne sont actuellement pas personnalisables.
  • Les jeux de données créés via l’API ne sont actuellement pas disponibles pour l’exportation.
  • Actuellement, l’interface utilisateur ne vous empêche pas de supprimer un jeu de données en cours d’exportation vers une destination. Ne supprimez aucun jeu de données en cours d’exportation vers des destinations. Supprimez le jeu de données d’un flux de données de destination avant de le supprimer.
  • Les mesures de surveillance des exportations de jeux de données sont actuellement combinées avec les chiffres des exportations de profils afin qu’elles ne reflètent pas les vrais chiffres d’exportation.
  • Les données dont l’horodatage est antérieur à 365 jours sont exclues des exportations de jeux de données. Pour plus d’informations, consultez les barrières de sécurité pour les exportations de jeux de données planifiées

Questions fréquentes faq

Peut-on générer un fichier sans dossier si nous enregistrons uniquement à l’emplacement / comme chemin d’accès au dossier ? En outre, si nous n’avons pas besoin d’un chemin d’accès au dossier, comment les fichiers portant des noms en double seront-ils générés dans un dossier ou un emplacement ?

+++
À compter de la version de septembre 2024, il est possible de personnaliser le nom du dossier et même d’utiliser / pour exporter des fichiers pour tous les jeux de données du même dossier. Adobe ne le recommande pas pour les destinations qui exportent plusieurs jeux de données, car les noms de fichier générés par le système et appartenant à différents jeux de données seront mélangés dans le même dossier.
+++

Pouvez-vous acheminer le fichier manifeste vers un dossier et les fichiers de données vers un autre dossier ?

+++
Non, il n’est pas possible de copier le fichier manifeste vers un autre emplacement.
+++

Peut-on contrôler le séquencement ou le timing de la livraison du fichier ?

+++
Il existe des options pour planifier l’exportation. Il n’existe aucune option pour retarder ou séquencer la copie des fichiers. Ils sont copiés dans votre emplacement de stockage dès qu’ils sont générés.
+++

Quels formats sont disponibles pour le fichier manifeste ?

+++
Le fichier de manifeste est au format .json.
+++

Existe-t-il une disponibilité de l’API pour le fichier manifeste ?

+++
Aucune API n’est disponible pour le fichier de manifeste, mais elle inclut une liste de fichiers comprenant l’exportation.
+++

Pouvons-nous ajouter des détails supplémentaires au fichier de manifeste (c’est-à-dire, le nombre d’enregistrements) ? Si oui, comment ?

+++
Il n’est pas possible d’ajouter des informations supplémentaires au fichier de manifeste. Le nombre d’enregistrements est disponible via l’entité flowRun (interrogable via l’API). En savoir plus sur la surveillance des destinations.
+++

Comment les fichiers de données sont-ils fractionnés ? Combien d'enregistrements par fichier ?

+++
Les fichiers de données sont fractionnés par partitionnement par défaut dans le lac de données Experience Platform. Les jeux de données plus volumineux comportent un nombre plus élevé de partitions. Le partitionnement par défaut n’est pas configurable par l’utilisateur, car il est optimisé pour la lecture.
+++

Pouvons-nous définir un seuil (nombre d'enregistrements par fichier) ?

+++
Non, ce n'est pas possible.
+++

Comment renvoyer un jeu de données en cas de mauvais envoi initial ?

+++
Les reprises sont automatiquement en place pour la plupart des types d’erreurs système.
+++

recommendation-more-help
7f4d1967-bf93-4dba-9789-bb6b505339d6