Amazon S3 exigences en termes de nom et de taille de fichier pour les fichiers de données entrants amazon-s-name-and-file-size-requirements-for-inbound-data-files

Décrit les champs, la syntaxe, les conventions d’affectation de noms et les tailles de fichiers requis à respecter lors de l’envoi de données à Audience Manager. Définissez les noms et les tailles de vos fichiers en fonction de ces spécifications lorsque vous envoyez des données vers un répertoire Audience Manager / Amazon S3.

NOTE
Les styles de texte (monospaced text, italiques, crochets [ ] ( ), etc.) dans ce document, indiquez les éléments de code et les options. Pour plus d’informations, voir les conventions de style relatives aux éléments de code et de texte.

Syntaxe du nom de fichier file-name-syntax

Les noms de fichier S3 contiennent les éléments obligatoires et facultatifs suivants :

  • S3préfixe : s3n://AWS_directory/partner_name/date=yyyy-mm-dd/

  • Éléments de nom de fichier : ftp_dpm_DPID[_DPID_TARGET_DATA_OWNER]_TIMESTAMP(.sync|.overwrite)[.SPLIT_NUMBER][.gz]

Pour connaître les autres formats de nom de fichier acceptés, reportez-vous à la section Intégrations personnalisées des partenaires.

NOTE
Audience Manager traite uniquement les fichiers codés ASCII et UTF-8.

Eléments de nom

La table définit les éléments dans un nom de fichier S3.

Elément Nom
Description
AWS_directory
Chemin d’accès et nom de votre compartiment Amazon S3. Contactez votre gestionnaire de compte pour connaître le nom, le chemin et les informations d’identification de votre répertoire S3.
date=yyyy-mm-dd
Horodatage (basé sur l’heure UTC) du moment où vous envoyez les fichiers à votre compartiment S3.
DPID

Identifiant qui indique à l’Audience Manager si un fichier de données contient vos propres identifiants utilisateur, Android ID, iOS ID ou autres identifiants appartenant à des sources de données globales. Accepte les options suivantes :

  • Data Source ID (également appelé identifiant du fournisseur de données) : Il s’agit d’un identifiant unique attribué par l’Audience Manager à une source de données (voir l’index des identifiantsde l’Audience Manager). Utilisez cet identifiant attribué dans un nom de fichier lors de l’envoi de données contenant vos propres identifiants utilisateur. Par exemple, ...ftp_dpm_21_123456789.sync indique à Audience Manager d’intégrer des données aux identifiants appartenant à la source de données 21.
  • Android IDs (GAID) : Utilisez ID 20914 dans un nom de fichier de données s’il contient des Android IDs. Vous devez utiliser le champ _DPID_TARGET_DATA_OWNER lorsque vous utilisez des Android ID. Par exemple, ...ftp_dpm_20914_DPID_TARGET_DATA_OWNER_123456789.sync indique à Audience Manager que le fichier de données contient uniquement des Android ID et que les ID doivent être qualifiés pour les caractéristiques appartenant à la source de données _DPID_TARGET_DATA_OWNER.
  • iOS IDs (IDFA) : Utilisez ID 20915 dans un nom de fichier de données s’il contient des iOS IDs. Vous devez utiliser le champ _DPID_TARGET_DATA_OWNER lorsque vous utilisez des iOS ID. Par exemple, ...ftp_dpm_20915_DPID_TARGET_DATA_OWNER_123456789.sync indique à Audience Manager que le fichier de données contient uniquement des iOS ID et que les ID doivent être qualifiés pour les caractéristiques appartenant à la source de données _DPID_TARGET_DATA_OWNER.
  • ID appartenant à d’autres sources de données globales : vous pouvez intégrer des identifiants Roku pour Advertising (RIDA), Microsoft Advertising IDs (MAID) et d’autres identifiants. Utilisez l’identifiant correspondant à chaque source de données, comme décrit dans l’ article sur les sources de données globales.

Remarque : Ne mélangez pas les types d’ID dans vos fichiers de données. Par exemple, si votre nom de fichier contient l’identifiant Android, ne placez pas les iOS ID ni vos propres ID dans le fichier de données.

_DPID_TARGET_DATA_OWNER

Ce champ indique à l’Audience Manager à quelle source de données intégrer les données. Ce champ est obligatoire si vous définissez le DPID sur un Android ID ou un iOS ID ou un autre ID appartenant à des sources de données globales. Cela permet à l’Audience Manager de lier les données de fichier à votre organisation.
Cette source de données cible doit appartenir à votre entreprise. À des fins de partage de données de deuxième niveau, pour ingérer des données dans une source de données cible appartenant à une autre entreprise, vous devez disposer d’un mappage d’accès entre votre entreprise et la source de données cible. Contactez votre conseiller en Adobe ou le service clientèle pour configurer le mappage.

Remarque importante : Vous n’avez pas besoin de demander un mappage pour les relations de partage de données existantes (pour les sources de données cibles appartenant à d’autres sociétés dans lesquelles vous avez intégré des données avant le 14 mars 2022). Le mappage n’est pas non plus requis lors de l’intégration de données dans des sources de données cibles appartenant à votre PID.

Par exemple :

  • ...ftp_dpm_33_21_1234567890.sync indique à l’Audience Manager que vous qualifiez des ID de client appartenant à la source de données 33 pour les caractéristiques ou les signaux appartenant à la source de données 21.
  • Android IDs (GAID): ...ftp_dpm_20914_21_1234567890.sync indique à Audience Manager que le fichier de données contient uniquement des Android ID et que les ID doivent être qualifiés pour les caractéristiques appartenant à la source de données 21.
  • iOS IDs (IDFA) : ...ftp_dpm_20915_21_1234567890.sync indique à Audience Manager que le fichier de données contient uniquement des iOS ID et que les ID doivent être qualifiés pour les caractéristiques appartenant à la source de données 21.
  • Les identifiants appartenant à d’autres sources de données globales : ...ftp_dpm_121963_21_1234567890.sync indique à l’Audience Manager que le fichier de données contient uniquement les identifiants Roku et que les identifiants doivent être qualifiés pour les caractéristiques appartenant à la source de données 21. Utilisez l’identifiant correspondant à chaque source de données, comme décrit dans l’ article sur les sources de données globales.
partner_name
Nom de l’entreprise ou de l’organisation que vous utilisez dans l’ Audience Manager.
TIMESTAMP
Horodatage UTC UNIX à 10 chiffres en secondes. L’horodatage permet de rendre chaque nom de fichier unique.
(.sync|.overwrite)

Options de synchronisation comprenant :

  • sync : scénario normal lorsque les fournisseurs de données tiers envoient des caractéristiques par utilisateur pour être ajoutés ou supprimés dans le système d’Audience Manager.
  • overwrite : permet aux fournisseurs de données d’envoyer une liste de caractéristiques par utilisateur qui doit remplacer toutes les caractéristiques tierces existantes de cet utilisateur pour ce fournisseur de données dans l’Audience Manager. Vous n’avez pas besoin d’inclure tous vos utilisateurs dans un fichier de remplacement. Incluez uniquement les utilisateurs que vous souhaitez modifier.
[SPLIT_NUMBER]

Entier. Utilisé lorsque vous divisez des fichiers volumineux en plusieurs parties afin d’améliorer les temps de traitement. Le numéro indique la partie du fichier d’origine que vous envoyez.

Pour optimiser le traitement des fichiers, divisez vos fichiers de données comme indiqué :

  • Décompressé : 1 Go
  • Compressé : 200 à 300 Mo

Voir les 2 premiers exemples de noms de fichier ci-dessous.

[.gz]

Lors de l’envoi de fichiers vers Amazon S3, utilisez uniquement la compression gzip. Une fois compressés, ces fichiers obtiennent l’extension .gz. N’utilisez pas la compression .zip.

Les fichiers compressés doivent être de 3 Go ou moins. Si vos fichiers sont plus volumineux, contactez l’assistance clientèle. Bien que l’Audience Manager puisse gérer des fichiers volumineux, nous pouvons vous aider à réduire la taille de vos fichiers et à optimiser les transferts de données. Voir Compression de fichiers pour les fichiers de transfert de données entrants.

Exemples de noms de fichier file-name-examples

Les exemples suivants présentent des noms de fichier correctement formatés. Vos noms de fichier peuvent ressembler à ceux-ci.

  • s3n://<AWS_Bucket>/<partner_name>/date=2016-05-09/ftp_dpm_478_1366545717.sync.1.gz
  • s3n://<AWS_Bucket>/<partner_name>/date=2016-05-09/ftp_dpm_478_1366545717.sync.2.gz
  • s3n://<AWS_Bucket>/<partner_name>/date=2016-05-09/ftp_dpm_478_1366545717.sync
  • s3n://<AWS_Bucket>/<partner_name>/date=2016-05-09/ftp_dpm_478_567_1366545717.sync.gz
  • s3n://<AWS_Bucket>/<partner_name>/date=2016-05-09/ftp_dpm_478_1366545717.overwrite

Vous pouvez télécharger le fichier d’exemple si vous souhaitez des exemples supplémentaires. Ce fichier a été enregistré avec l’extension de fichier .overwrite. Ouvrez-le à l’aide d’un simple éditeur de texte.

Taille de fichier acceptée accepted-file-sizes

Tenez compte des chiffres ci-dessous pour le traitement le plus rapide/le plus ancien de vos fichiers ainsi que pour les limitations de taille de fichier lorsque vous envoyez des données à un répertoire Audience Manager / Amazon S3.

Type de fichier
Taille optimale
Taille maximale
Compressé
200 à 300 Mo
3 Go
Non compressé
1 Go
5 Go
NOTE
Le processus de validation des données entrantes marquera les fichiers vides comme non valides et ne les traitera pas.

Limites de longueur de ligne line-limits

Les fichiers de données entrants ont une longueur de ligne limitée à 102400 octets. Les lignes dépassant cette limite sont exclues du transfert.

recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695