Informations de base sur Customer Data Feed (CDF) et des instructions pour commencer. Commencez ici si vous souhaitez recevoir des CDF ou simplement pour obtenir plus d’informations.
Un fichier CDF contient les mêmes données que celles envoyées à nos serveurs par un appel d’événement Audience Manager (/event
). Cela inclut les données telles que les identifiants utilisateur, trait IDs, segment IDset tous les autres paramètres capturés par un appel d’événement. Interne Audience Manager système traite les données d’événement dans une CDF avec du contenu organisé en champs qui s’affichent dans un ordre défini. Audience Manager tente de générer CDF toutes les heures et les stocke dans un compartiment sécurisé spécifique au client sur une Amazon S3 serveur. Nous fournissons ces fichiers afin que vous puissiez travailler avec Audience Manager données en dehors des limites imposées par notre interface utilisateur.
Notez les restrictions suivantes lorsque vous utilisez des fichiers CDF :
Il n’existe aucun processus en libre-service à démarrer. CDF diffusion des fichiers. Contactez votre Audience Manager consultant ou assistance clientèle pour commencer. Lors de la mise en oeuvre, votre Audience Manager Le représentant :
Notifications de fichiers et CDF Les fichiers apparaîtront dans vos S3 lorsqu’ils sont prêts à être téléchargés. Vous êtes responsable de la surveillance et du téléchargement des fichiers à partir des S3 répertoire . Voir Notifications de traitement des fichiers de flux de données client.
Les sections ci-dessous et le FAQ sur le flux de données client peut vous aider à vous familiariser avec ce service.
Répertorie et définit les éléments de données et les tableaux dans une CDF par ordre d’apparition. Les définitions incluent les types de données, mais ces informations ne font pas partie d’une CDF fichier .
A CDF comprend certains ou tous les champs définis ci-dessous. Pour plus d’informations sur l’organisation interne des fichiers, voir Structure de fichier de flux de données client.
Champ | Type de données | Description |
---|---|---|
|
Horodatage |
Heure à laquelle un fichier CDF a été traité par Serveurs de collecte de données (DCS). L’horodatage utilise la variable aaaa-mm-jj hh:mm:ss et est défini dans le fuseau horaire UTC.
Remarque : Heure de l’événement n’est pas:
|
|
Chaîne |
Il s’agit de la variable Identifiant utilisateur unique (UUID), qui est un identifiant d’appareil à 38 chiffres pour le visiteur de votre site. Voir également Index des ID dans Audience Manager. |
|
Numérique |
L’identifiant du conteneur qui déclenche les synchronisations des identifiants. |
|
Tableau numérique |
Tableau d’identifiants de caractéristiques qui contient toutes les caractéristiques qu’un visiteur a réalisées (pour lesquelles il est qualifié) dans l’appel d’événement. Notez que le tableau peut contenir des caractéristiques pour lesquelles le visiteur s’était qualifié avant et pour lesquelles il se qualifie à nouveau via cet appel d’événement. |
|
Tableau numérique |
Tableau d’identifiants de segment qui contient tous les segments qu’un visiteur a réalisés (pour lesquels il est qualifié) dans l’appel d’événement. |
|
Chaîne |
Chaîne qui capture tous les paramètres (variables, identifiants, paires clé-valeur, identifiants publicitaires d’appareils, etc.) transmis lors de l’appel d’événement. Exemple raccourci : |
|
Chaîne |
URL non codée de la page de référence (le cas échéant). |
|
Chaîne |
Adresse IP du visiteur capturé dans l’appel d’événement. |
|
Chaîne |
Le Experience Cloud ID (MID) attribué au visiteur du site. Voir aussi Cookies et service Adobe Experience Platform Identity. |
|
Tableau numérique |
Tableau d’identifiants de segment contenant les segments précédemment réalisés et les nouveaux segments pour lesquels le visiteur est qualifié. |
|
Tableau numérique |
Tableau d’identifiants de caractéristiques propriétaires et tiers contenant les caractéristiques précédemment réalisées et les nouvelles caractéristiques pour lesquelles le visiteur s’est qualifié depuis le dernier flux de données généré. |
Répertorie et définit la structure de données d’une CDF fichier . Cela inclut la séquence de données, les délimiteurs et les séparateurs de champ, un mappage de fichier de données et un fichier d’exemple.
CDF Les fichiers ne contiennent pas de colonnes ou d’en-têtes de champ étiquetés. Au lieu de cela, une CDF définit des champs et des tableaux sans impression ; ASCII caractères. En outre, la variable CDF répertorie chaque champ et tableau dans un ordre spécifique. La compréhension des identifiants de champ et de l’ordre vous aidera à analyser correctement le fichier.
Elément de fichier CDF | Description |
---|---|
Séparateurs de champs et délimiteurs |
Ces caractères non imprimables définissent les éléments et la structure de votre fichier CDF :
|
Séquence de champ |
Important : Audience Manager se réserve le droit d’ajouter de nouveaux champs à la fin du fichier CDF dans les prochaines versions. Cela signifie que la conception technique de votre système d’analyse de fichiers ne doit pas supposer un nombre fixe de colonnes (bien qu’elle puisse supposer un ordre fixe pour les colonnes existantes). Les données de votre fichier CDF apparaissent dans l’ordre indiqué ci-dessous. /N peut apparaître à la place de l’un de ces champs, indiquant une valeur nulle.
Pour consulter la description des champs, voir Contenu du flux de données client défini. |
CDF Les données de fichier s’affichent dans l’ordre indiqué ci-dessous.
Tableaux dans une CDF Le fichier commence et se termine par Ctrl + a
séparateur de champ. Cela fait apparaître le premier élément d’un tableau comme un champ de données autonome. Par exemple, la variable traits Le tableau commence par ^A1234
. Délimiteur et identifiant de tableau ^B5678
suit cette entrée. Par conséquent, vous pourriez être tenté de penser que le premier élément de la traits est l’ID 5678 (car il commence par ^B
). Ce n’est pas le cas, c’est pourquoi vous devez connaître la séquence et la structure d’un fichier de données. Même si le premier élément dans la trait tableau (ou l’un des autres tableaux d’un CDF ) commence par ^A
, l’ordre d’apparition ou de position dans le fichier définit le début d’un tableau. De plus, le premier élément d’un tableau est toujours séparé de l’entrée précédente par ^A
.
Un exemple CDF peut ressembler à ce qui suit. Nous avons inséré des sauts de ligne dans cet exemple pour l’aider à s’adapter à la page.
Les sections ci-dessous répertorient et définissent les éléments de votre CDF nom du fichier.
Un CDF Le nom de fichier contient les éléments répertoriés ci-dessous. Remarque : italique indique un espace réservé de variable :
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz
Dans votre S3 compartiment de stockage, les fichiers sont triés dans l’ordre croissant par identifiant de partenaire (PID), jour et heure.
Le tableau suivant répertorie et définit les éléments d’une CDF nom du fichier.
Elément Nom du fichier | Description |
---|---|
|
Il s’agit du compartiment de stockage racine par défaut de votre fichier CDF sur un serveur Amazon S3. |
|
Nom du compartiment S3 en lecture seule qui contient vos fichiers CDF. |
|
Date à laquelle votre fichier a été traité. |
|
Valeur horaire exprimée en notation de 24 heures et définie dans le fuseau horaire UTC. Voir aussi Nom de fichier du flux de données client Heures et Temps de contenu du fichier.... |
|
Votre identifiant de partenaire. |
|
Valeurs qui identifient la séquence de fichiers. La séquence s’incrémente comme suit : 0_0_0 , 0_1_0, 0_2_0....1_0_0 |
|
Extension de fichier gzip. Les fichiers CDF sont compressés par gzip. |
Audience Manager écrit une .info
dans votre fichier S3 pour vous informer lorsque votre Customer Data File (CDF) est prête à être téléchargée. Le .info
inclut également JSON métadonnées formatées sur le contenu de votre CDF fichiers . Consultez cette section pour plus d’informations sur la syntaxe et les champs utilisés par ce fichier de notification.
Chaque .info
contient un fichier Files
et Totals
. Le Files
contient un tableau contenant des mesures spécifiques pour chaque fichier horaire. Le Totals
contient des mesures agrégées dans toutes vos CDF fichiers pour un jour spécifique. Le contenu de votre .info
peut ressembler à l’exemple suivant.
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
Les tableaux suivants répertorient et définissent les éléments d’une CDF .info
fichier .
Champ | Description |
---|---|
|
Commence le tableau contenant des métadonnées sur vos fichiers CDF. |
|
Taille de fichier en octets. |
|
L’ETag Amazon S3. Le nombre suivant le trait d’union indique le nombre de parties utilisées pour créer le fichier lors du chargement en plusieurs parties. Le |
|
Nom du fichier. Voir Conventions de dénomination des fichiers de flux de données client. |
|
Un numéro d’index pour chaque fichier. |
Champ | Description |
---|---|
|
Commence l’objet qui contient des données agrégées sur tous vos fichiers CDF. |
|
Jour pour lequel les données sont disponibles. Utilisations aaaa-mm-jj format. |
|
Heure pour laquelle les données sont disponibles. Utilise le format 24 heures défini dans le fuseau horaire UTC. |
|
Taille totale de tous les fichiers CDF pour cette date, en octets. |
|
Nombre total de fichiers chargés dans votre répertoire S3. |
Votre CDF contient des horodatages dans le nom de fichier et le contenu du fichier. Ces horodatages enregistrent différents processus d’événement pour le même CDF fichier . Il n’est pas rare de voir des horodatages différents dans le nom et le contenu d’un même fichier. La compréhension de chaque horodatage peut vous aider à éviter les erreurs courantes lorsque vous utilisez ces données ou essayez de les trier par heure.
CDF Les fichiers enregistrent le temps différemment dans 2 emplacements distincts.
Le tableau suivant fournit des détails supplémentaires sur votre CDF horodatages du fichier, ainsi que des informations sur la manière de les utiliser correctement.
Emplacement de l’horodatage | Description |
---|---|
Nom de fichier | L’horodatage dans votre CDF Le nom de fichier marque l’heure à laquelle Audience Manager a commencé à préparer votre fichier pour la diffusion. Cet horodatage est défini dans la variable UTC fuseau horaire. Elle utilise la variable hour= avec l’heure formatée sous la forme d’une heure à 2 chiffres en notation de 24 heures. Cette heure peut être différente de l’heure de l’événement enregistrée dans le contenu du fichier. Lorsque vous utilisez CDF fichiers, vous remarquerez parfois que votre S3 le compartiment est vide pendant une heure donnée. Un compartiment vide signifie l’une des significations suivantes :
Important: N’utilisez pas l’horodatage du nom de fichier pour regrouper les événements par heure. Si vous devez effectuer un regroupement par heure, utilisez la variable EventTime horodatage dans le contenu du fichier. |
Contenu du fichier | L’horodatage dans votre CDF le contenu du fichier marque l’heure à laquelle la variable Data Collection Servers a commencé à traiter le fichier. Cet horodatage est défini dans la variable UTC fuseau horaire. Elle utilise la variable EventTime avec l’heure formatée en tant que yyyy-mm-dd hh:mm:ss . Cette heure est proche de l’heure réelle de l’événement sur la page, mais elle peut être différente de l’indicateur d’heure dans le nom du fichier. Conseil: Contrairement au hour= horodatage dans le nom de fichier, vous pouvez utiliser EventTime pour regrouper les données par temps. |