Documentation Analytics Guide d’exportation

FAQ sur les flux de données

Last update: Sat Feb 07 2026 00:00:00 GMT+0000 (Coordinated Universal Time)

Rubriques :
Flux de données

Créé pour :

Utilisateur ou utilisatrice
Administration

Questions fréquentes sur les flux de données.

Les noms de flux doivent-ils être uniques ? unique

Adobe Analytics n’empêche pas le remplacement des fichiers de flux de données.

Pour éviter que les fichiers de flux de données ne soient écrasés, nous vous recommandons d’attribuer des noms de fichiers uniques à tous les fichiers de flux de données envoyés au même emplacement.

Les noms de fichier des flux de données se composent des caractéristiques de flux de données suivantes :

Identifiant de la suite de rapports (RSID)
Date d’export

Deux flux configurés pour le même RSID et les mêmes dates portent le même nom de fichier. Si ces flux sont diffusés au même emplacement, un fichier remplace l’autre.

Pour éviter le remplacement d’un fichier, tenez compte des solutions suivantes :

Modifier le chemin de diffusion
Si possible, modifiez les dates
Si possible, modifiez la suite de rapports

Quand les données sont-elles traitées ? processed

Avant de traiter des données horaires ou quotidiennes, les flux de données attendent que tous les accès concernés par la collecte de données au cours de la période (jour ou heure) aient été écrits dans un entrepôt de données. Ensuite, les flux de données collectent les données avec horodatages compris dans cette tranche horaire, les compressent et les envoient via FTP. Dans le cas des flux horaires, les fichiers sont généralement écrits dans Data Warehouse dans un délai de 15 à 30 minutes, mais aucune période horaire n’est définie. En l’absence de données avec horodatages compris dans cette tranche horaire, le processus fait une nouvelle tentative avec la période suivante. Le processus de flux de données en cours utilise le champ date_time pour déterminer les accès qui appartiennent à la période d’une heure. Ce champ est basé sur le fuseau horaire de la suite de rapports.

Quelle est la différence entre les colonnes comportant un préfixe `post_` et celle ne comportant pas de préfixe `post_` ? post

Les colonnes sans le préfixe post_ contiennent les données telles qu’elles ont été envoyées lors de la collecte de données. Les colonnes comportant le préfixe post_ contiennent la valeur après traitement. La persistance de la variable, les règles de traitement, les règles VISTA, la conversion de la devise ou une autre logique côté serveur sont des exemples pouvant modifier une valeur appliqués par Adobe. Adobe recommande d’utiliser la version post_ d’une colonne dans la mesure du possible.

Si une colonne ne contient pas de version post_ (par exemple, visit_num), alors la colonne peut être considérée comme une colonne « Post ».

Comment les flux de données gèrent-ils le respect de la casse ? case

Dans Adobe Analytics, la plupart des variables sont considérées comme ne respectant pas la casse à des fins de création de rapports. Par exemple, les valeurs « neige », « Neige », « NEIGE » et « nEige » sont toutes considérées comme étant la même valeur. Le respect de la casse est préservé dans les flux de données.

Si vous observez différentes variations de la casse entre des colonnes « Post » et non « Post » (par exemple, « neige » dans la colonne « Pré » et « Neige » dans la colonne « Post »), cela signifie que votre implémentation utilise des valeurs à la fois en majuscules et en minuscules sur votre site. Les différences de casse dans la colonne « Post » étaient précédemment transmises puis stockées dans un cookie virtuel ou étaient traitées à peu près en même temps pour cette suite de rapports.

Les robots sont-ils filtrés par les règles de robots d’Admin Console incluses dans les flux de données ? bots

Les flux de données n’incluent pas les robots filtrés par les règles de robots d’Admin Console.

Pourquoi est-ce que je vois plusieurs valeurs `000` dans la colonne de flux de données `event_list` ou `post_event_list` ? values

Certains éditeurs de feuilles de calcul, en particulier Microsoft Excel, arrondissent automatiquement les grands nombres. La colonne event_list contient de nombreux nombres délimités par des virgules, ce qui peut parfois entraîner Excel à la traiter comme un grand nombre. Il arrondit les derniers chiffres à 000.

Adobe recommande de ne pas ouvrir automatiquement les fichiers hit_data.tsv dans Microsoft Excel. Utilisez plutôt la boîte de dialogue Importer les données dʼExcel et assurez-vous que tous les champs sont traités comme du texte.

Les colonnes telles que `hitid_high`, `hitid_low`, `visid_high` et `visid_low` sont-elles garanties comme étant uniques à lʼaccès ou à la visite ? hitid

Dans la plupart des cas, la concaténation de hitid_high et hitid_low identifie de manière unique un accès. Le même concept sʼapplique à la concaténation de visid_high et visid_low pour les visites. Cependant, les anomalies de traitement peuvent rarement faire en sorte que deux accès partagent le même identifiant dʼaccès. Adobe recommande de ne pas créer de workflows de flux de données qui supposent de manière inflexible que chaque accès soit unique.

Pourquoi des informations manquent-elles dans la colonne domaine pour certains opérateurs ? domain

Certains opérateurs de téléphonie mobile (tels que T-Mobile et O1) ne fournissent plus d’informations de domaine pour les recherches DNS inversées. Par conséquent, ces données ne sont pas disponibles dans les rapports sur les domaines.

Pourquoi ne puis-je pas extraire de manière fiable des fichiers horaires pour les dates plus anciennes ? hourly

Pour optimiser le stockage et le traitement, Adobe consolide régulièrement les exportations horaires dans des fichiers quotidiens. En raison de la manière et du moment où ces consolidations s’exécutent, la sortie horaire pour les dates de plus de 10 jours n’est pas prévisible. Pour une date donnée, il est possible de voir un mélange de fichiers horaires pour certaines heures et un fichier quotidien consolidé pour d’autres. Les données consolidées dans un fichier quotidien sont généralement affectées aux heures 00, ce qui peut laisser d’autres heures vides lorsque ces heures sont demandées directement.

Pour les renvois datant de plus de 10 jours, Adobe recommande vivement d’utiliser la granularité quotidienne pour garantir des résultats complets et prévisibles. Si vous devez demander une granularité horaire pour les jours plus anciens, incluez toujours la 00 horaire dans votre demande pour éviter l’absence de données horaires consolidées.

Quel est l’impact du passage à l’heure d’été sur les flux de données par heure ? dst

Dans certains fuseaux horaires, l’heure change deux fois par an. Les flux de données respectent le fuseau horaire pour lequel la suite de rapports est configurée. Si le fuseau horaire configuré pour la suite de rapports n’applique pas l’heure d’été, la remise des fichiers se poursuit normalement. Si le fuseau horaire de la suite de rapports utilise l’heure d’été, la diffusion des fichiers est modifiée pour l’heure à laquelle le changement d’heure se produit (généralement à 2 :00 du matin).

Lorsque vous effectuez des transitions de temps STD -> DST (printemps vers l'avant), vous recevez 23 fichiers. L’heure qui est « sautée » au cours du changement d’heure est ignorée. Par exemple, si la transition se produit à 2 heures du matin, vous obtenez un fichier pour la :00 heure et un fichier pour la troisième :00. Il n'y a pas de fichier 2:00 car, à 2:00 STD, il devient 3:00 DST.

Lorsque vous effectuez des transitions DST -> STD (secours), vous recevez 24 fichiers. Cependant, l’heure de transition contient l’équivalent de 2 heures de données. Par exemple, si la transition a lieu à 2 heures du matin:00 le fichier correspondant à 1 :00 est retardé d’une heure, mais il contient des données pendant deux heures. Il contient des données allant de 1:00 DST à 2:00 STD (ce qui aurait été 3:00 DST). Le fichier suivant commence à 2:00 STD.

Comment Analytics gère-t-il les erreurs de transfert FTP ? ftp-failure

En cas d’échec d’un transfert FTP (en raison d’un refus de connexion, d’une perte de connexion, d’une erreur de quota ou d’un autre problème), Adobe tente de se connecter automatiquement et d’envoyer les données jusqu’à trois fois. Si le problème persiste, le flux est marqué comme ayant échoué et un message de notification est envoyé.

Si un transfert échoue, vous pouvez réexécuter une tâche jusqu’à ce qu’elle réussisse.

Si vous rencontrez des problèmes lors de l’affichage d’un flux de données sur votre site FTP, voir Résolution des problèmes liés aux flux de données.

Comment puis-je renvoyer une tâche ? resend

Une fois que vous avez vérifié ou corrigé le problème de diffusion, exécutez à nouveau la tâche pour obtenir les fichiers.

Qu’est-ce que le paramètre BucketOwnerFullControl pour les flux de données Amazon S3 ? BucketOwnerFullControl

BucketOwnerFullControl spécifie des droits entre comptes pour créer des objets dans d’autres compartiments.

Cas d’utilisation type d’Amazon S3 : le titulaire du compte AWS (Amazon Web Services) crée un compartiment, puis crée un utilisateur qui est autorisé à créer des objets dans ce compartiment, puis spécifie les informations d’identification pour cet utilisateur. Dans ce cas, les objets de l’utilisateur appartiennent au même compte et le titulaire du compte bénéficie implicitement du contrôle total de l’objet (lecture, suppression, etc). Ce processus fonctionne de la même manière que les remises par FTP.

AWS permet aussi de créer des objets dans un compartiment appartenant à un autre compte d’utilisateur. Par exemple, deux utilisateurs AWS (utilisateurA et utilisateurB) n’appartiennent pas au même compte AWS, mais souhaitent créer des objets dans d’autres compartiments. Si l’utilisateurA crée un compartiment (le compartimentA), il peut créer une politique de compartiment qui autorise explicitement l’utilisateurB à créer des objets dans le compartimentA, même si l’utilisateur n’est pas propriétaire du compartiment. Cette politique peut s’avérer avantageuse, car l’utilisateurA et l’utilisateurB n’ont pas à échanger d’informations d’identification. Au lieu de cela, l’utilisateurB fournit à l’utilisateurA son numéro de compte, puis l’utilisateurA crée une politique de compartiment qui autorise l’utilisateurB à créer des objets dans le compartimentA.

Cependant, les objets n’héritent pas des autorisations du compartiment parent. Si l’utilisateurB charge un objet dans le compartiment de l’utilisateurA, l’utilisateurB « détient » toujours cet objet et, par défaut, l’utilisateurA n’a aucune autorisation quant à cet objet, même si l’utilisateurA possède le compartiment. L’utilisateurB doit explicitement octroyer les droits à l’utilisateurA, car il reste le propriétaire de l’objet. Pour accorder cette autorisation, l’utilisateurB doit charger l’objet avec une liste de contrôle d’accès BucketOwnerFullControl, qui spécifie que le propriétaire du compartiment (utilisateurA) bénéficie de tous les droits sur l’objet (lecture, écriture, suppression, etc.), même si l’objet est « détenu » par l’utilisateurB.

NOTE

Adobe Analytics ne détermine pas si le compartiment a une politique qui oblige à donner au propriétaire du compartiment le contrôle total des nouveaux objets, ou même si le propriétaire se trouve sur un compte différent de celui de l’utilisateur qui écrit les données. Au lieu de cela, Analytics ajoute automatiquement le propriétaire du compartiment à la liste de contrôle d’accès BucketOwnerFullControl avec chaque téléchargement de flux.

recommendation-more-help

6b7d49d5-f5fe-4b7f-91ae-5b0745755ed2