Customer Data Feeds customer-data-feeds

Informations de base sur les fichiers Customer Data Feed (CDF) et instructions pour démarrer. Commencez ici si vous souhaitez recevoir des fichiers CDF ou simplement obtenir plus d'informations.

Contenu et objectif du fichier file-contents-purpose

Un fichier CDF contient les mêmes données qu’un appel d’événement Audience Manager (/event) envoie à nos serveurs. Cela inclut les données telles que les identifiants d’utilisateur, les trait IDs, les segment IDs et tous les autres paramètres capturés par un appel d’événement. Les systèmes de Audience Manager internes traitent les données d’événement dans un fichier CDF avec le contenu organisé en champs qui apparaissent dans un ordre défini. Audience Manager tente de générer des fichiers CDF toutes les heures et les stocke dans un compartiment sécurisé et spécifique au client sur un serveur Amazon S3. Nous fournissons ces fichiers afin que vous puissiez travailler avec des données Audience Manager en dehors des limites imposées par notre interface utilisateur.

IMPORTANT
Notez les restrictions suivantes lorsque vous utilisez des fichiers CDF :
  • Avant de configurer la diffusion des fichiers CDF, vérifiez que vous disposez des autorisations appropriées de fournisseurs de données tiers pour l’exportation de caractéristiques tierces. Audience Manager ne prend actuellement pas en charge la fonctionnalité dans l’interface utilisateur pour demander l’autorisation d’exportation de diffusion de fichiers CDF à des fournisseurs de données tiers. Veuillez donc les contacter indépendamment.
  • Vous ne devez pas utiliser les fichiers CDF comme proxy pour surveiller le trafic de pages, réconcilier les incohérences de rapports, ou pour la facturation, etc.

Prise en main getting-started

Il n’existe aucun processus en libre-service pour démarrer CDF diffusion de fichiers. Contactez votre consultant Audience Manager ou l’assistance clientèle pour commencer. Pendant la mise en œuvre, votre représentant Audience Manager :

  • Configurez votre compartiment de stockage Amazon S3.
  • Fournissez des informations d’authentification S3 en lecture seule à votre compartiment de stockage de fichiers. Vous ne pourrez pas voir ni accéder aux répertoires et fichiers appartenant à d'autres clients.

Les notifications de fichiers et les fichiers CDF apparaîtront dans votre compartiment S3 lorsqu’ils seront prêts à être téléchargés. Vous êtes responsable de la surveillance et du téléchargement des fichiers à partir du répertoire S3 qui vous a été attribué. Voir Notifications de traitement des fichiers de flux de données client.

Étapes suivantes next-steps

Les sections ci-dessous et la FAQ sur les flux de données client peuvent vous aider à vous familiariser avec ce service.

Contenu Customer Data Feed défini cdf-defined

Répertorie et définit les éléments de données et les tableaux d’un fichier CDF, par ordre d’apparition. Les définitions incluent les types de données, mais ces informations ne font pas partie d’un fichier CDF.

IMPORTANT
Les pixels d’événement sont exclus par défaut dans les configurations CDF. Veillez à spécifier dans votre demande à l’assistance clientèle si vous souhaitez que les pixels d’événement soient inclus dans vos fichiers CDF. Chaque pixel d’événement est renseigné sous la forme d’une ligne unique dans vos fichiers CDF.

Définitions definitions

Un fichier CDF comprend certains ou tous les champs définis ci-dessous. Pour plus d’informations sur l’organisation interne des fichiers, voir Structure de fichier du flux de données client.

Champ
Type de données
Description
Event Time
Date et heure

Heure à laquelle un fichier CDF a été traité par les serveurs de collecte de données (DCS. La date et l’heure utilisent le format aaaa-mm-jj hhss et sont définies dans le fuseau horaire UTC.

Remarque : l’heure de l’événement n’est pas :

Device
Chaîne
Il s’agit de l’identifiant utilisateur unique (UUID) qui est un identifiant d’appareil de 38 chiffres pour le visiteur de votre site. Voir aussi Index des identifiants dans Audience Manager.
Container ID
Numérique
L’identifiant du conteneur qui déclenche les synchronisations d’identifiant. Ce champ n’est renseigné que si vous définissez l’ID de conteneur dans le champ d_nsid au sein de votre implémentation de site. Sinon, la valeur par défaut de 0 ne sera pas incluse dans les fichiers CDF.
Realized Traits
Tableau numérique

Tableau d’identifiants de caractéristiques qui contient toutes les caractéristiques qu’un visiteur a réalisées (pour lesquelles il a rempli les critères) dans l’appel d’événement.

Notez que le tableau peut contenir des caractéristiques pour lesquelles le visiteur s’est qualifié auparavant et pour lesquelles il se qualifie à nouveau par le biais de cet appel d’événement.

Realized Segments
Tableau numérique
Tableau d’identifiants de segment qui contient tous les segments qu’un visiteur a réalisés (pour lesquels il a rempli les critères) dans l’appel d’événement.
Request Parameters
Chaîne

Chaîne qui capture tous les paramètres (variables, identifiants, paires clé-valeur, identifiants publicitaires d’appareil, etc.) transmis lors de l’appel d’événement.

Exemple raccourci :

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type
Chaîne
URL non codée de la page de référence (le cas échéant).
IP Data Type
Chaîne
L’adresse IP du visiteur capturée dans l’appel d’événement.
MCDevice
Chaîne
Identifiant Experience Cloud (MID) attribué au visiteur du site. Voir aussi Cookies et Adobe Experience Platform Identity Service.
All Segments
Tableau numérique
Tableau d’identifiants de segment qui contient les segments précédemment réalisés et les nouveaux segments pour lesquels le visiteur est qualifié.
All Traits
Tableau numérique
Tableau d’ID de caractéristiques propriétaires et tiers qui contient les caractéristiques précédemment créées et les nouvelles caractéristiques pour lesquelles le visiteur s’est qualifié depuis le dernier flux de données généré.

Structure de fichier Customer Data Feed cdf-file-structure

Répertorie et définit la structure des données d’un fichier CDF. Cela inclut la séquence de données, les délimiteurs et séparateurs de champ, un mappage de fichier de données et un exemple de fichier.

Identifiants et séquence des champs de données identifiers-and-sequence

Les fichiers CDF ne contiennent pas de colonnes ou d’en-têtes de champ libellés. À la place, un fichier CDF définit des champs et des tableaux avec des caractères ASCII non imprimables. En outre, le fichier CDF répertorie chaque champ et tableau dans un ordre spécifique. Comprendre l’ordre et les identifiants des champs vous aidera à analyser correctement le fichier.

Élément de fichier CDF
Description
Séparateurs et délimiteurs de champ

Ces caractères non imprimables définissent les éléments et la structure de votre fichier CDF :

  • Ctrl + a ( 001 ASCII ou ^A) sépare les données de champs individuels avec un indicateur d’espace non imprimable.
  • Ctrl + b ( 002 ASCII ou ^B) sépare les données d’un tableau et les paramètres de requête.
  • Ctrl + c ( 003 ASCII ou ^C) définit les paires clé-valeur.
Séquence de champs

Important : Audience Manager se réserve le droit d’ajouter de nouveaux champs à la fin du fichier CDF dans les prochaines versions. Cela signifie que la conception technique de votre système d'analyse de fichiers ne doit pas supposer un nombre fixe de colonnes (bien qu'elle puisse supposer un ordre fixe pour les colonnes existantes).

Les données de votre fichier CDF s’affichent dans l’ordre indiqué ci-dessous. /N peut apparaître à la place de l’un de ces champs, indiquant une valeur nulle.

  1. Heure de l’événement
  2. Device
  3. ID de conteneur
  4. Caractéristiques réalisées
  5. Segments Réalisés
  6. Paramètres de requête
  7. Référent
  8. Adresse IP
  9. Identifiant de l’appareil Experience Cloud (ou MID). Voir aussi Cookies et service d’identités Adobe Experience Platform
  10. Tous les segments
  11. Toutes les caractéristiques

Pour obtenir la description des champs, voir du contenu du flux de données client défini.

Mappage de fichier CDF cdf-file-map

CDF données du fichier s’affichent dans l’ordre indiqué ci-dessous.

Identification de tableaux

Les tableaux d’un fichier CDF commencent et se terminent par le séparateur de champs Ctrl + a. Ainsi, le premier élément d’un tableau ressemble à un champ de données autonome. Par exemple, le tableau de traits réalisé commence par ^A1234. Le délimiteur de tableau et l’ID ^B5678 suivent cette entrée. Par conséquent, vous pouvez être tenté de penser que le premier élément du tableau de traits réalisé est l’ID 5678 (car il commence par ^B). Ce n’est pas le cas, c’est pourquoi vous devez connaître la séquence et la structure d’un fichier de données. Même si le premier élément du tableau de trait réalisé (ou de tout autre tableau d’un fichier CDF) commence par ^A, l’ordre d’aspect ou de position dans le fichier définit le début d’un tableau. De plus, le premier élément d’un tableau est toujours séparé de l’entrée précédente par des ^A.

Exemple de fichier CDF sample-file

Un exemple de fichier CDF pourrait ressembler à ce qui suit. Nous avons inséré des sauts de ligne dans cet exemple pour l’adapter à la page.

Conventions de dénomination des fichiers Customer Data Feed cdf-naming-conventions

Les sections ci-dessous répertorient et définissent les éléments dans votre nom de fichier CDF.

Nom de fichier CDF : syntaxe et exemple cdf-file-name

Un nom de fichier CDF type contient les éléments répertoriés ci-dessous. Remarque : l’italique indique un espace réservé de variable :

Syntaxe

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz

Exemple

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz

Dans votre compartiment de stockage S3, les fichiers sont triés par ordre croissant par identifiant de partenaire (PID), jour et heure.

Éléments De Nom De Fichier CDF Définis cdf-file-name-elements

Le tableau suivant répertorie et définit les éléments d’un nom de fichier CDF.

Élément de nom de fichier
Description
s3://aam-cdf/
Il s’agit du compartiment de stockage racine par défaut pour votre fichier CDF sur un serveur Amazon S3.
your S3 bucket name
Nom du compartiment S3 en lecture seule qui contient vos fichiers CDF.
day=yyyy-mm-dd
Date de traitement de votre fichier.
hour=hh
Valeur horaire exprimée dans la notation sur 24 heures et définie dans le fuseau horaire UTC. Voir aussi les heures du nom de fichier du flux de données client et les heures du contenu du fichier.
partner ID
Identifiant de votre partenaire.
File Sequence_0
Valeurs qui identifient la séquence de fichiers. La séquence s’incrémente comme suit : 0_0_0 , 0_1_0, 0_2_0....1_0_0
.gz
Extension de fichier gzip. Les fichiers CDF sont compressés au format GZIP.

Notifications de traitement de fichier Customer Data Feed cdf-file-processing-notifications

Audience Manager écrit un fichier .info dans votre répertoire S3 pour vous informer lorsque votre Customer Data File (CDF) est prêt à être téléchargé. Le fichier .info comprend également JSON métadonnées formatées sur le contenu de vos fichiers CDF. Consultez cette section pour plus d’informations sur la syntaxe et les champs utilisés par ce fichier de notification.

Exemple de fichier d’informations sample-info-file

Chaque fichier .info contient une section Files et Totals. La section Files contient un tableau qui contient des mesures spécifiques pour chaque fichier horaire. La section Totals contient des mesures agrégées dans tous vos fichiers CDF pour un jour spécifique. Le contenu de votre fichier .info peut ressembler à l’exemple suivant.

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Champs de fichier d’informations définis info-file-fields-defined

Les tableaux suivants répertorient et définissent les éléments d’un fichier CDF .info.

File, objet

Champ
Description
Files
Démarre le tableau qui contient les métadonnées de vos fichiers CDF.
FileByteSize
Taille du fichier en octets.
FileChecksumMD5
ETag Amazon S3. Le nombre qui suit le trait d’union indique le nombre de parties utilisées pour créer le fichier lors du chargement en plusieurs parties. Le ETag n’est pas identique à la somme de contrôle MD5 du fichier .
FileName
Nom du fichier. Voir des conventions de dénomination des fichiers de flux de données client.
FileSequenceNumber
Numéro d’index pour chaque fichier.

Totaux, objet

Champ
Description
Totals
Démarre l’objet qui contient des données agrégées sur tous vos fichiers CDF.
Day
Jour de disponibilité des données. Utilise le format aaaa-mm-jj.
Hour
Heure à laquelle les données sont disponibles. Utilise le format 24 heures défini dans le fuseau horaire UTC.
TotalByteSize
Taille totale de tous vos fichiers CDF pour cette date en octets.
TotalNumberFiles
Nombre total de fichiers chargés dans votre répertoire S3.

Les heures de nom de fichier Customer Data Feed et de contenu de fichier sont différentes different-processing-times

Votre fichier CDF contient des horodatages dans le nom et le contenu du fichier. Ces horodatages enregistrent différents processus d’événement pour le même fichier CDF. Il n’est pas rare de voir des horodatages différents dans le nom et le contenu d’un même fichier. Comprendre chaque horodatage peut vous aider à éviter les erreurs courantes lors de l’utilisation de ces données ou d’essayer de les trier par heure.

Localisation des horodatages de fichier CDF locating-timestamps

CDF fichiers enregistrent le temps différemment dans 2 emplacements distincts.

Comprendre la différence entre les horodatages understanding-timestamps

Le tableau suivant fournit des détails supplémentaires sur les horodatages de vos fichiers CDF ainsi que des informations sur leur utilisation correcte.

Emplacement de l’horodatage
Description
Nom de fichier

La date et l’heure indiquées dans le nom de fichier de votre CDF correspondent à l’heure à laquelle Audience Manager avez commencé à préparer votre fichier pour la diffusion. Cet horodatage est défini dans le fuseau horaire UTC. Elle utilise le paramètre hour= , avec une heure formatée en tant qu’heure à 2 chiffres dans la notation de 24 heures. Cette heure peut être différente de l’heure de l’événement enregistrée dans le contenu du fichier. Lorsque vous travaillez avec des fichiers CDF, vous remarquerez parfois que votre compartiment S3 est vide pendant une heure particulière. Un compartiment vide signifie que peut signifier l’un des éléments suivants :

  • Il n'y a pas de données pour cette heure-là.
  • Nos serveurs sont soumis à de lourdes charges et ne peuvent traiter les fichiers pendant une heure particulière. Lorsque le serveur effectue un rattrapage, il place les fichiers qui auraient dû se trouver dans un fichier de regroupement temporel antérieur dans un regroupement avec une valeur temporelle ultérieure. Par exemple, vous verrez ceci lorsqu’un fichier qui aurait dû se trouver dans le compartiment de l’heure 17 apparaît dans le compartiment de l’heure 18 (avec hour=18 dans le nom du fichier). Dans ce cas, le serveur a probablement commencé à traiter votre fichier au cours de l’heure 17, mais n’a pas pu le terminer dans cet intervalle de temps. Au lieu de cela, le fichier est envoyé à l’intervalle horaire suivant.

Important : n’utilisez pas la date et l’heure du nom du fichier pour regrouper les événements par heure. Si vous devez effectuer un regroupement par heure, utilisez la date et l’heure EventTime dans le contenu du fichier.

Contenu du fichier
L’horodatage dans le contenu de votre fichier CDF indique l’heure à laquelle le Data Collection Servers a commencé à traiter le fichier. Cet horodatage est défini dans le fuseau horaire UTC. Il utilise le champ EventTime, avec l’heure au format yyyy-mm-dd hh:mm:ss. Cette heure est proche de l’heure réelle de l’événement sur la page, mais elle peut être différente de l’indicateur d’heure dans le nom de fichier.
Conseil : contrairement à l’horodatage hour= dans le nom de fichier, vous pouvez utiliser EventTime pour regrouper les données par heure.
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695