Customer Data Feeds customer-data-feeds

Informações básicas sobre Customer Data Feed (CDF) arquivos e instruções sobre como começar. Comece aqui se estiver interessado em receber CDF ou apenas deseja mais informações.

Conteúdo e finalidade do arquivo file-contents-purpose

Um arquivo CDF contém os mesmos dados que uma chamada de evento Audience Manager (/event) envia para nossos servidores. Isso inclui dados como IDs de usuário, trait IDs, segment IDse todos os outros parâmetros capturados por uma chamada de evento. Interno Audience Manager sistemas processam dados do evento em um CDF arquivo com conteúdo organizado em campos que aparecem em uma ordem definida. Audience Manager tenta gerar CDF de hora em hora e armazena em um bucket seguro e específico do cliente em um Amazon S3 servidor. Fornecemos esses arquivos para que você possa trabalhar com Audience Manager dados fora dos limites impostos pela interface do usuário.

IMPORTANT
Observe as seguintes restrições ao trabalhar com arquivos CDF:
  • Antes de configurar a entrega de arquivos CDF, verifique se você tem as permissões apropriadas de provedores de dados de terceiros para a exportação de características de terceiros. No momento, o Audience Manager não oferece suporte à funcionalidade na interface do usuário para solicitar permissão de exportação de entrega de arquivo CDF de Provedores de dados de terceiros. Portanto, entre em contato com eles independentemente.
  • Você não deve usar CDF arquivos como um proxy para monitorar o tráfego da página, reconciliar discrepâncias de relatório, faturamento etc.

Introdução getting-started

Não há um processo de autoatendimento a ser iniciado CDF entrega de arquivo. Entre em contato com Audience Manager ou Atendimento ao cliente para começar. Durante a implementação, o Audience Manager representante irá:

  • Configure seu Amazon S3 bucket de armazenamento.
  • Fornecer somente leitura S3 credenciais de autenticação para o bucket de armazenamento de arquivos. Você não poderá ver ou acessar diretórios e arquivos que pertencem a outros clientes.

Notificações de arquivo e CDF os arquivos aparecerão no S3 quando estiverem prontos para download. Você é responsável por monitorar e baixar os arquivos dos S3 diretório. Consulte Notificações de processamento de arquivos de feed de dados do cliente.

Próximas etapas next-steps

As seções abaixo e a Perguntas frequentes sobre o feed de dados do cliente O pode ajudá-lo a se familiarizar com esse serviço.

Customer Data Feed Conteúdo definido cdf-defined

Lista e define os elementos de dados e as matrizes em um CDF arquivo, por ordem de aparência. As definições incluem tipos de dados, mas essas informações não fazem parte de um CDF arquivo.

IMPORTANT
Por padrão, os pixels do evento são excluídos nas configurações CDF. Certifique-se de especificar em sua solicitação para o atendimento ao cliente se deseja que os pixels do evento sejam incluídos em seus arquivos CDF. Cada pixel de evento será preenchido como uma linha exclusiva em seus arquivos CDF.

Definições definitions

A CDF O arquivo inclui alguns ou todos os campos definidos abaixo. Para obter informações sobre a organização interna de arquivos, consulte Estrutura do arquivo de feed de dados do cliente.

Campo
Tipo de dados
Descrição
Event Time
Carimbo de data e hora

A hora em que um arquivo CDF foi processado pelo Servidores de coleta de dados (DCS). O carimbo de data e hora usa o aaaa-mm-dd hhss e é definido no fuso horário UTC.

Observação: O tempo do evento não é:

Device
String
Este é o ID de usuário exclusiva (UUID), que é uma ID de dispositivo de 38 dígitos para o visitante do site. Consulte também Índice de IDs no Audience Manager.
Container ID
Numérico
A ID do contêiner que dispara sincronizações de ID. Esse campo só será preenchido se você definir a ID do container no d_nsid campo na implementação do site. Caso contrário, o valor padrão de 0 não será incluído nos arquivos CDF.
Realized Traits
Matriz numérica

Uma matriz de IDs de característica que contém todas as características que um visitante realizou (se qualificou para) na chamada de evento.

Observe que a matriz pode conter características para as quais o visitante se qualificou antes e para as quais se requalificou por meio desta chamada de evento.

Realized Segments
Matriz numérica
Uma matriz de IDs de segmento que contém todos os segmentos que um visitante realizou (se qualificou para) na chamada de evento.
Request Parameters
String

Uma string que captura todos os parâmetros (variáveis, IDs, pares de valores chave, IDs de publicidade do dispositivo etc.) transmitido na chamada de evento.

Exemplo abreviado:

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type
String
O URL não codificado da página de referência (se houver).
IP Data Type
String
O endereço IP do visitante capturado na chamada de evento.
MCDevice
String
A variável Experience Cloud ID (MID) atribuída ao visitante do site. Consulte também, Cookies e o serviço de identidade Experience Platform da Adobe.
All Segments
Matriz numérica
Uma matriz de IDs de segmento que contém segmentos realizados anteriormente e novos segmentos para os quais o visitante está qualificado.
All Traits
Matriz numérica
Uma matriz de IDs de características originais e de terceiros que contém características anteriormente realizadas e novas características para as quais o visitante se qualificou desde o último feed de dados gerado.

Customer Data Feed Estrutura do arquivo cdf-file-structure

Lista e define a estrutura de dados de um CDF arquivo. Isso inclui sequência de dados, delimitadores e separadores de campo, um mapa de arquivo de dados e um arquivo de amostra.

Identificadores e sequência do campo de dados identifiers-and-sequence

CDF os arquivos não contêm colunas rotuladas ou cabeçalhos de campo. Em vez disso, uma CDF O arquivo define campos e matrizes com caracteres não imprimíveis ASCII caracteres. Além disso, a variável CDF file lista cada campo e matriz em uma ordem específica. Entender os identificadores de campo e a ordem ajudará você a analisar o arquivo corretamente.

Elemento do arquivo CDF
Descrição
Separadores de campo e delimitadores

Esses caracteres não imprimíveis definem os elementos e a estrutura do arquivo CDF:

  • Ctrl + a (ASCII) 001 ou ^A) separa os dados em campos individuais com um indicador de espaço não imprimível.
  • Ctrl + b (ASCII) 002 ou ^B) separa dados em uma matriz e parâmetros de solicitação.
  • Ctrl + c (ASCII) 003 ou ^C) define pares de valores chave.
Sequência do campo

Importante: Audience Manager A se reserva o direito de adicionar novos campos ao final do arquivo CDF em versões futuras. Isso significa que o design técnico do sistema de análise de arquivos não deve pressupor um número fixo de colunas (embora possa pressupor uma ordem fixa para colunas existentes).

Os dados no arquivo CDF aparecem na ordem mostrada abaixo. /N pode aparecer no lugar de qualquer um desses campos, indicando um valor nulo.

  1. Hora do Evento
  2. Dispositivo
  3. ID do container
  4. Características Realizadas
  5. Segmentos realizados
  6. Parâmetros da solicitação
  7. Referer
  8. Endereço IP
  9. ID de dispositivo Experience Cloud (ou MID). Consulte também, Cookies e o serviço de identidade da Adobe Experience Platform
  10. Todos os segmentos
  11. Todas as características

Para obter descrições dos campos, consulte Conteúdo do feed de dados do cliente definido.

CDF Mapa de arquivos cdf-file-map

CDF Os dados do arquivo aparecem na ordem mostrada abaixo.

Identificação de storages

Matrizes em uma CDF início e término do arquivo com o Ctrl + a separador de campo. Isso faz com que o primeiro elemento em uma matriz apareça como um campo de dados independente. Por exemplo, o resultado traits matriz inicia com ^A1234. O delimitador de matriz e a ID ^B5678 segue esta entrada. Como resultado, você pode ser tentado a pensar que o primeiro elemento no realizado traits é a ID 5678 (porque começa com ^B). Esse não é o caso, por isso é necessário estar familiarizado com a sequência e a estrutura de um arquivo de dados. Mesmo que o primeiro elemento no trait array (ou qualquer um dos outros arrays em um CDF file) inicia com ^A, a ordem de aparência ou posição no arquivo define o início de uma matriz. E, o primeiro elemento em uma matriz é sempre separado da entrada anterior por ^A.

Amostra CDF Arquivo sample-file

Uma amostra CDF O arquivo pode ser semelhante ao seguinte. Inserimos quebras de linha neste exemplo para ajudá-lo a se ajustar à página.

Customer Data Feed Convenções de nomenclatura de arquivos cdf-naming-conventions

As seções abaixo listam e definem os elementos nas CDF nome do arquivo.

CDF Nome do arquivo: sintaxe e exemplo cdf-file-name

Um típico CDF O nome do arquivo contém os elementos listados abaixo. Observação: itálico indica um espaço reservado para variável:

Sintaxe

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz

Exemplo

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz

No seu S3 armazenamento temporário, os arquivos são classificados em ordem crescente pela ID do parceiro (PID), dia e hora.

CDF Elementos de nome de arquivo definidos cdf-file-name-elements

A tabela a seguir lista e define os elementos de uma CDF nome do arquivo.

Elemento do nome do arquivo
Descrição
s3://aam-cdf/
Esse é o bucket de armazenamento raiz padrão para o arquivo CDF em um servidor Amazon S3.
your S3 bucket name
O nome do bucket do S3 somente leitura que armazena seus arquivos CDF.
day=yyyy-mm-dd
A data em que o arquivo foi processado.
hour=hh
Um valor de hora expresso em notação de 24 horas e definido no fuso horário UTC. Consulte também, Feed de dados do cliente Nome do arquivo Horas e Conteúdo do arquivo Horas....
partner ID
ID do parceiro.
File Sequence_0
Valores que identificam a sequência de arquivos. A sequência é incrementada da seguinte maneira: 0_0_0 , 0_1_0, 0_2_0...1_0_0
.gz
Uma extensão de arquivo gzip. Os arquivos CDF são compactados por gzip.

Customer Data Feed Notificações de processamento de arquivo cdf-file-processing-notifications

Audience Manager grava um .info arquivo para o seu S3 diretório para informar quando o Customer Data File (CDF) está pronto para download. A variável .info o arquivo também inclui JSON metadados formatados sobre o conteúdo do seu CDF arquivos. Consulte esta seção para obter informações sobre a sintaxe e os campos usados por esse arquivo de notificação.

Arquivo de Informações de Exemplo sample-info-file

Each .info o arquivo contém um Files e Totals seção. A variável Files contém uma matriz que contém métricas específicas para cada arquivo por hora. A variável Totals contém métricas agregadas em todas as CDF arquivos de um dia específico. O conteúdo do .info O arquivo pode ser semelhante ao exemplo a seguir.

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Campos do arquivo de informações definidos info-file-fields-defined

As tabelas a seguir listam e definem os elementos em uma CDF .info arquivo.

Objeto Files

Campo
Descrição
Files
Inicia a matriz que contém metadados sobre os arquivos CDF.
FileByteSize
Tamanho do arquivo em bytes.
FileChecksumMD5
O Amazon S3 ETag. O número após o hífen mostra o número de partes usadas para criar o arquivo durante o upload de várias partes. A variável ETag não é idêntica à soma de verificação MD5 do arquivo.
FileName
O nome do arquivo. Consulte Convenções de nomenclatura de arquivos de feed de dados do cliente.
FileSequenceNumber
Um número de índice para cada arquivo.

Objeto Totals

Campo
Descrição
Totals
Inicia o objeto que contém dados agregados sobre todos os arquivos CDF.
Day
O dia para o qual os dados estão disponíveis. Usos aaaa-mm-dd formato.
Hour
A hora para a qual os dados estão disponíveis. Usa o formato de 24 horas definido no fuso horário UTC.
TotalByteSize
Tamanho total de todos os arquivos CDF naquela data, em bytes.
TotalNumberFiles
Número total de arquivos carregados no diretório S3.

Customer Data Feed Os horários do nome do arquivo e do conteúdo do arquivo são diferentes different-processing-times

Seu CDF O arquivo contém carimbos de data e hora no nome do arquivo e conteúdo do arquivo. Esses carimbos de data e hora registram diferentes processos de evento para o mesmo CDF arquivo. Não é incomum ver carimbos de data e hora diferentes no nome e conteúdo do mesmo arquivo. Entender cada carimbo de data e hora pode ajudar você a evitar erros comuns ao trabalhar com esses dados ou tentar classificá-los por tempo.

Localizando CDF Carimbos de data e hora do arquivo locating-timestamps

CDF os arquivos registram o tempo de forma diferente em dois locais separados.

Entender a diferença entre carimbos de data e hora understanding-timestamps

A tabela a seguir fornece detalhes adicionais sobre o CDF carimbos de data e hora do arquivo, juntamente com informações sobre como usá-los corretamente.

Localização do carimbo de data e hora
Descrição
Nome do arquivo

O carimbo de data e hora em seu CDF nome do arquivo marca a hora em que Audience Manager começou a preparar seu arquivo para entrega. Esse carimbo de data e hora é definido na variável UTC fuso horário. Ele usa o hour= parâmetro, com a hora formatada como uma hora de 2 dígitos na notação de 24 horas. Esse horário pode ser diferente do horário do evento registrado no conteúdo do arquivo. Ao trabalhar com CDF arquivos, às vezes você notará que seus S3 O bucket está vazio por uma hora específica. Um bucket vazio significa uma das seguintes opções:

  • Não há dados para aquela hora em particular.
  • Nossos servidores estão sob uma carga pesada e não podem processar arquivos por uma hora específica. Quando o servidor alcança, ele coloca os arquivos que deveriam ter sido enviados em arquivos de um intervalo de tempo anterior em um intervalo com um valor de tempo posterior. Por exemplo, você verá isso quando um arquivo que deveria estar no intervalo de 17 horas aparecer no intervalo de 18 horas (com hour=18 no nome do arquivo). Nesse caso, o servidor provavelmente iniciou o processamento do arquivo na hora 17, mas não pôde concluí-lo nesse intervalo de tempo. Em vez disso, o arquivo é enviado para o próximo intervalo de tempo por hora.

Importante: não use o carimbo de data e hora do nome do arquivo para agrupar eventos por hora. Se precisar agrupar por tempo, use o EventTime carimbo de data e hora no conteúdo do arquivo.

Conteúdo do arquivo
O carimbo de data e hora em seu CDF o conteúdo do arquivo marca a hora em que o Data Collection Servers iniciado o processamento do arquivo. Esse carimbo de data e hora é definido na variável UTC fuso horário. Ele usa o EventTime com a hora formatada como yyyy-mm-dd hh:mm:ss. Essa hora é próxima à hora real do evento na página, mas pode ser diferente do indicador de hora no nome do arquivo.
Dica: Ao contrário da hour= carimbo de data e hora no nome do arquivo, é possível usar EventTime para agrupar dados por tempo.
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695