Customer Data Feeds

Informations de base sur les fichiers Customer Data Feed (CDF) et instructions pour commencer. Commencez ici si vous souhaitez recevoir des CDF fichiers ou simplement plus d’informations.

Contenu et objectif du fichier

Un fichier CDF contient les mêmes données que celles envoyées à nos serveurs par un appel d’événement Audience Manager (/event). Cela inclut des données telles que les ID utilisateur, trait IDs, segment IDs, ainsi que tous les autres paramètres capturés par un appel d’événement. Les systèmes Audience Manager internes traitent les données d’événement dans un fichier CDF dont le contenu est organisé en champs qui s’affichent dans un ordre défini. Audience Manager tente de générer CDF les fichiers toutes les heures et les stocke dans un compartiment sécurisé spécifique au client sur un Amazon S3 serveur. Nous fournissons ces fichiers afin que vous puissiez utiliser des données Audience Manager en dehors des limites imposées par notre interface utilisateur.

IMPORTANT

Notez les restrictions suivantes lorsque vous utilisez des fichiers CDF :

  • Avant de configurer la diffusion de fichiers CDF, assurez-vous de disposer des autorisations appropriées de fournisseurs de données tiers pour l’exportation de caractéristiques tierces. Actuellement, l’Audience Manager ne prend pas en charge la fonctionnalité de l’interface utilisateur de demande d’autorisation d’exportation de fichiers CDF auprès de fournisseurs de données tiers. Contactez-les indépendamment.
  • Vous ne devez pas utiliser de fichiers CDF comme proxy pour surveiller le trafic des pages, réconcilier les incohérences des rapports, ou pour la facturation, etc.

Prise en main

Il n’existe aucun processus en libre-service pour démarrer la diffusion de fichiers CDF. Contactez votre Audience Manager consultant ou l’assistance clientèle pour commencer. Pendant la mise en oeuvre, votre représentant Audience Manager :

  • Configurez votre compartiment de stockage Amazon S3.
  • Indiquez des informations d’authentification S3 en lecture seule à votre compartiment de stockage de fichiers. Vous ne pourrez pas voir ni accéder aux répertoires et fichiers appartenant à d’autres clients.

Les notifications de fichier et les fichiers CDF s’affichent dans votre compartiment S3 lorsqu’ils sont prêts à être téléchargés. Vous êtes responsable de la surveillance et du téléchargement des fichiers à partir du répertoire S3 qui vous est assigné. Voir Notifications de traitement des fichiers de flux de données client.

Étapes suivantes

Les sections ci-dessous et la FAQ sur le flux de données client peuvent vous aider à vous familiariser avec ce service.

Customer Data Feed Contenu défini

Répertorie et définit les éléments de données et les tableaux dans un fichier CDF, par ordre d’apparition. Les définitions incluent les types de données, mais ces informations ne font pas partie d’un fichier CDF.

Définitions

Un fichier CDF contient certains ou tous les champs définis ci-dessous. Pour plus d’informations sur l’organisation interne des fichiers, voir Structure de fichier de flux de données client.

Champ Type de données Description

Event Time

Horodatage

Heure à laquelle un fichier CDF a été traité par les serveurs de collecte de données (DCS). L’horodatage utilise le format aaaa-mm-jj hh:mm:ss et est défini dans le fuseau horaire UTC.

Remarque : L’ heure de l’événement n’est pas :

Device

Chaîne

Il s’agit de l’ identifiant utilisateur unique (UUID), qui est un identifiant d’appareil à 38 chiffres pour le visiteur de votre site. Voir également Index des ID dans Audience Manager.

Container ID

Numérique

L’identifiant du conteneur qui déclenche les synchronisations des identifiants.

Realized Traits

Tableau numérique

Tableau d’identifiants de caractéristiques qui contient toutes les caractéristiques qu’un visiteur a réalisées (pour lesquelles il est qualifié) dans l’appel d’événement.

Notez que le tableau peut contenir des caractéristiques pour lesquelles le visiteur s’était qualifié avant et pour lesquelles il se qualifie à nouveau via cet appel d’événement.

Realized Segments

Tableau numérique

Tableau d’identifiants de segment qui contient tous les segments qu’un visiteur a réalisés (pour lesquels il est qualifié) dans l’appel d’événement.

Request Parameters

Chaîne

Chaîne qui capture tous les paramètres (variables, identifiants, paires clé-valeur, identifiants publicitaires d’appareils, etc.) transmis lors de l’appel d’événement.

Exemple raccourci :

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type

Chaîne

URL non codée de la page de référence (le cas échéant).

IP Data Type

Chaîne

Adresse IP du visiteur capturé dans l’appel d’événement.

MCDevice

Chaîne

ID Experience Cloud (MID) attribué au visiteur du site. Voir aussi Cookies et service Adobe Experience Platform Identity.

All Segments

Tableau numérique

Tableau d’identifiants de segment contenant les segments précédemment réalisés et les nouveaux segments pour lesquels le visiteur est qualifié.

All Traits

Tableau numérique

Tableau d’identifiants de caractéristiques propriétaires et tiers contenant les caractéristiques précédemment réalisées et les nouvelles caractéristiques pour lesquelles le visiteur s’est qualifié depuis le dernier flux de données généré.

Customer Data Feed Structure de fichier

Répertorie et définit la structure de données d’un fichier CDF. Cela inclut la séquence de données, les délimiteurs et les séparateurs de champ, un mappage de fichier de données et un fichier d’exemple.

Identifiants de champ de données et séquence

CDF Les fichiers ne contiennent pas de colonnes ou d’en-têtes de champ étiquetés. À la place, un fichier CDF définit des champs et des tableaux avec des caractères ASCII non imprimables. En outre, le fichier CDF répertorie chaque champ et tableau dans un ordre spécifique. La compréhension des identifiants de champ et de l’ordre vous aidera à analyser correctement le fichier.

Elément de fichier CDF Description

Séparateurs de champs et délimiteurs

Ces caractères non imprimables définissent les éléments et la structure de votre fichier CDF :

  • Ctrl + a (ASCII 001 ou ^A) sépare les données de champs individuels par un indicateur d’espace non imprimable.
  • Ctrl + b (ASCII 002 ou ^B) sépare les données d’un tableau et les paramètres de requête.
  • Ctrl + c (ASCII 003 ou ^C) définit les paires clé-valeur.

Séquence de champ

Important : Audience Manager se réserve le droit d’ajouter de nouveaux champs à la fin du fichier CDF dans les prochaines versions. Cela signifie que la conception technique de votre système d’analyse de fichiers ne doit pas supposer un nombre fixe de colonnes (bien qu’elle puisse supposer un ordre fixe pour les colonnes existantes).

Les données de votre fichier CDF apparaissent dans l’ordre indiqué ci-dessous.

  1. Heure de l’événement
  2. Device
  3. ID de conteneur
  4. Caractéristiques réalisées
  5. Segments réalisés
  6. Paramètres de requête
  7. Referer
  8. Adresse IP
  9. ID de périphérique Experience Cloud (ou MID). Voir aussi Cookies et service Adobe Experience Platform Identity
  10. Tous les segments
  11. Toutes les caractéristiques

Pour consulter la description des champs, voir Contenu du flux de données client défini.

CDF Mappage de fichiers

CDF Les données de fichier s’affichent dans l’ordre indiqué ci-dessous.

Identification des tableaux

Les tableaux d’un fichier CDF commencent et se terminent par le séparateur de champ Ctrl + a . Cela fait apparaître le premier élément d’un tableau comme un champ de données autonome. Par exemple, le tableau traits réalisé commence par ^A1234. Le délimiteur de tableau et l’identifiant ^B5678 suivent cette entrée. Par conséquent, vous pouvez être tenté de penser que le premier élément du tableau traits réalisé est ID 5678 (car il commence par ^B). Ce n’est pas le cas, c’est pourquoi vous devez connaître la séquence et la structure d’un fichier de données. Même si le premier élément du tableau trait réalisé (ou de l’un des autres tableaux d’un fichier CDF) commence par ^A, l’ordre d’apparition ou de position dans le fichier définit le début d’un tableau. De plus, le premier élément d’un tableau est toujours séparé de l’entrée précédente par ^A.

Exemple de fichier CDF

Un exemple de fichier CDF peut ressembler à ce qui suit. Nous avons inséré des sauts de ligne dans cet exemple pour l’aider à s’adapter à la page.

Customer Data Feed Conventions de dénomination des fichiers

Les sections ci-dessous répertorient et définissent les éléments de votre nom de fichier CDF.

CDF Nom du fichier : Syntaxe et exemple

Un nom de fichier CDF type contient les éléments répertoriés ci-dessous. Remarque : italics indique un espace réservé variable :

Syntaxe

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF-PARTNER-ID-AAM PROCESS-ID_0.gz

Exemple

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_000058_0.gz

Dans votre compartiment de stockage S3, les fichiers sont triés par ordre croissant par identifiant de partenaire (PID), jour et heure.

CDF Définition des éléments du nom de fichier

Le tableau suivant répertorie et définit les éléments d’un nom de fichier CDF.

Elément Nom du fichier Description

s3://aam-cdf/

Il s’agit du compartiment de stockage racine par défaut de votre fichier CDF sur un serveur Amazon S3.

your S3 bucket name

Nom du compartiment S3 en lecture seule qui contient vos fichiers CDF.

day=yyyy-mm-dd

Date à laquelle votre fichier a été traité.

hour=hh

Valeur horaire exprimée en notation de 24 heures et définie dans le fuseau horaire UTC. Voir aussi Customer Data Feed File Name Times et File Content Times...

partner ID

Votre identifiant de partenaire.

AAM process ID_0

Identifiant de processus Audience Manager interne.

.gz

Extension de fichier gzip. Les fichiers CDF sont compressés par gzip.

Customer Data Feed Notifications de traitement de fichier

Audience Manager écrit un .info fichier dans votre S3 répertoire pour vous informer du moment où votre Customer Data File (CDF) est prêt pour le téléchargement. Le fichier .info comprend également des métadonnées formatées JSON sur le contenu de vos fichiers CDF. Consultez cette section pour plus d’informations sur la syntaxe et les champs utilisés par ce fichier de notification.

Exemple de fichier d’informations

Chaque fichier .info contient une section Files et Totals. La section Files contient un tableau contenant des mesures spécifiques pour chaque fichier horaire. La section Totals contient des mesures agrégées dans tous vos fichiers CDF pour un jour particulier. Le contenu de votre fichier .info peut ressembler à l’exemple suivant.

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Champs du fichier d’informations définis

Les tableaux suivants répertorient et définissent les éléments dans un fichier CDF .info.

Objet Fichiers

Champ Description

Files

Commence le tableau contenant des métadonnées sur vos fichiers CDF.

FileByteSize

Taille de fichier en octets.

FileChecksumMD5

L’ETag Amazon S3. Le nombre suivant le trait d’union indique le nombre de parties utilisées pour créer le fichier lors du chargement en plusieurs parties. ETag n’est pas identique à la somme de contrôle MD5 du fichier.

FileName

Nom du fichier. Voir Conventions de dénomination des fichiers de flux de données client.

FileSequenceNumber

Un numéro d’index pour chaque fichier.

Objet Totaux

Champ Description

Totals

Commence l’objet qui contient des données agrégées sur tous vos fichiers CDF.

Day

Jour pour lequel les données sont disponibles. Utilise le format aaaa-mm-jj.

Hour

Heure pour laquelle les données sont disponibles. Utilise le format 24 heures défini dans le fuseau horaire UTC.

TotalByteSize

Taille totale de tous les fichiers CDF pour cette date, en octets.

TotalNumberFiles

Nombre total de fichiers chargés dans votre répertoire S3.

Customer Data Feed Les heures des noms de fichier et les heures du contenu du fichier diffèrent

Votre fichier CDF contient des horodatages dans le nom de fichier et le contenu du fichier. Ces horodatages enregistrent différents processus d’événement pour le même fichier CDF. Il n’est pas rare de voir des horodatages différents dans le nom et le contenu d’un même fichier. La compréhension de chaque horodatage peut vous aider à éviter les erreurs courantes lorsque vous utilisez ces données ou essayez de les trier par heure.

Localisation des CDF horodatages du fichier

CDF Les fichiers enregistrent le temps différemment dans 2 emplacements distincts.

Présentation de la différence entre les horodatages

Le tableau suivant fournit des détails supplémentaires sur les horodatages de vos fichiers CDF, ainsi que des informations sur la manière de les utiliser correctement.

Emplacement de l’horodatage Description
Nom de fichier L’horodatage de votre nom de fichier CDF indique l’heure à laquelle Audience Manager a commencé à préparer votre fichier pour la diffusion. Cet horodatage est défini dans le fuseau horaire UTC. Il utilise le paramètre hour=, avec une heure formatée en tant qu’heure à 2 chiffres en notation à 24 heures. Cette heure peut être différente de l’heure de l’événement enregistrée dans le contenu du fichier. Lorsque vous travaillez avec des fichiers CDF, vous remarquerez parfois que votre compartiment S3 est vide pendant une heure donnée. Un compartiment vide signifie l’une des significations suivantes :
  • Il n'y a pas de données pour cette heure particulière.
  • Nos serveurs sont soumis à de lourdes charges et ne peuvent pas traiter les fichiers pendant une heure donnée. Lorsque le serveur récupère, il place les fichiers qui auraient dû être placés dans un intervalle de temps antérieur dans un compartiment avec une valeur d’heure ultérieure. Par exemple, vous verrez ceci lorsqu’un fichier qui aurait dû se trouver dans le compartiment 17 de l’heure apparaîtra dans le compartiment 18 de l’heure (avec hour=18 dans le nom de fichier). Dans ce cas, le serveur a probablement commencé à traiter votre fichier dans l’heure 17, mais il n’a pas pu le terminer dans cet intervalle. Au lieu de cela, le fichier est envoyé vers l’intervalle horaire suivant.

Important : N’utilisez pas l’horodatage du nom de fichier pour regrouper les événements par heure. Si vous devez effectuer un groupement par heure, utilisez l’horodatage EventTime dans le contenu du fichier.
Contenu du fichier L’horodatage du contenu de votre fichier CDF marque l’heure à laquelle Data Collection Servers a commencé à traiter le fichier. Cet horodatage est défini dans le fuseau horaire UTC. Il utilise le champ EventTime, avec l’heure au format yyyy-mm-dd hh:mm:ss. Cette heure est proche de l’heure réelle de l’événement sur la page, mais elle peut être différente de l’indicateur d’heure dans le nom du fichier.
Conseil : Contrairement à l’ hour= horodatage du nom de fichier, vous pouvez utiliser EventTime pour regrouper les données par heure.

Sur cette page