Customer Data Feeds customer-data-feeds

Informações básicas sobre Customer Data Feed (CDF) arquivos e instruções sobre como começar. Comece aqui se estiver interessado em receber CDF arquivos ou quiser mais informações.

Conteúdo e finalidade do arquivo file-contents-purpose

Um arquivo CDF contém os mesmos dados que uma chamada de evento Audience Manager (/event) envia para nossos servidores. Isso inclui dados como IDs de usuário, trait IDs, segment IDs e todos os outros parâmetros capturados por uma chamada de evento. Sistemas Audience Manager internos processam dados de evento em um arquivo CDF com conteúdo organizado em campos que aparecem em uma ordem definida. O Audience Manager tenta gerar CDF arquivos por hora e os armazena em um compartimento seguro e específico do cliente em um servidor Amazon S3. Fornecemos esses arquivos para que você possa trabalhar com dados do Audience Manager fora dos limites impostos pela interface do usuário.

IMPORTANT
Observe as seguintes restrições ao trabalhar com arquivos CDF:
  • Antes de configurar a entrega de arquivos CDF, verifique se você tem as permissões apropriadas de provedores de dados de terceiros para a exportação de características de terceiros. No momento, o Audience Manager não oferece suporte à funcionalidade na interface do usuário para solicitar permissão de exportação de entrega de arquivo CDF de Provedores de dados de terceiros. Portanto, entre em contato com eles independentemente.
  • Você não deve usar CDF arquivos como proxy para monitorar o tráfego da página, reconciliar discrepâncias de relatório, para cobrança etc.

Introdução getting-started

Não há um processo de autoatendimento para iniciar a entrega do arquivo CDF. Entre em contato com o consultor do Audience Manager ou com o Atendimento ao cliente para começar. Durante a implementação, o representante do Audience Manager irá:

  • Configure seu bucket de armazenamento do Amazon S3.
  • Forneça credenciais de autenticação S3 somente leitura ao seu bucket de armazenamento de arquivos. Você não poderá ver ou acessar diretórios e arquivos que pertencem a outros clientes.

Notificações de arquivo e CDF arquivos aparecerão no bucket S3 quando estiverem prontos para download. Você é responsável por monitorar e baixar arquivos do diretório S3 atribuído. Consulte Notificações de processamento de arquivos de feed de dados do cliente.

Próximas etapas next-steps

As seções abaixo e as Perguntas frequentes sobre o Feed de Dados do Cliente podem ajudar você a se familiarizar com esse serviço.

Customer Data Feed Conteúdo definido cdf-defined

Lista e define os elementos de dados e as matrizes em um arquivo CDF, por ordem de aparência. As definições incluem tipos de dados, mas essas informações não fazem parte de um arquivo CDF.

IMPORTANT
Por padrão, os pixels do evento são excluídos nas configurações CDF. Certifique-se de especificar em sua solicitação para o atendimento ao cliente se deseja que os pixels do evento sejam incluídos em seus arquivos CDF. Cada pixel de evento será preenchido como uma linha exclusiva em seus arquivos CDF.

Definições definitions

Um arquivo CDF inclui alguns ou todos os campos definidos abaixo. Para obter informações sobre a organização interna do arquivo, consulte Estrutura do arquivo de feed de dados do cliente.

Campo
Tipo de dados
Descrição
Event Time
Carimbo de data e hora

A hora em que um arquivo CDF foi processado pelos Servidores de Coleta de Dados (DCS). O carimbo de data/hora usa o formato aaaa-mm-dd hhss e está definido no fuso horário UTC.

Observação: o Tempo de Evento não:

Device
String
Esta é a Identificação de Usuário Exclusiva (UUID), que é uma Identificação de dispositivo de 38 dígitos para o visitante do site. Consulte também, Índice de IDs em Audience Manager.
Container ID
Numérico
A ID do contêiner que dispara sincronizações de ID. Este campo só será preenchido se você definir a ID do contêiner no campo d_nsid na implementação do site. Caso contrário, o valor padrão de 0 não será incluído nos arquivos CDF.
Realized Traits
Matriz numérica

Uma matriz de IDs de característica que contém todas as características que um visitante realizou (se qualificou para) na chamada de evento.

Observe que a matriz pode conter características para as quais o visitante se qualificou antes e para as quais se requalificou por meio desta chamada de evento.

Realized Segments
Matriz numérica
Uma matriz de IDs de segmento que contém todos os segmentos que um visitante realizou (se qualificou para) na chamada de evento.
Request Parameters
String

Uma string que captura todos os parâmetros (variáveis, IDs, pares de valores chave, IDs de publicidade do dispositivo etc.) transmitido na chamada de evento.

Exemplo abreviado:

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type
String
O URL não codificado da página de referência (se houver).
IP Data Type
String
O endereço IP do visitante capturado na chamada de evento.
MCDevice
String
A Experience Cloud ID (MID) atribuída ao visitante do site. Consulte também Cookies do e o Serviço de Identidade do Adobe Experience Platform.
All Segments
Matriz numérica
Uma matriz de IDs de segmento que contém segmentos realizados anteriormente e novos segmentos para os quais o visitante está qualificado.
All Traits
Matriz numérica
Uma matriz de IDs de características originais e de terceiros que contém características anteriormente realizadas e novas características para as quais o visitante se qualificou desde o último feed de dados gerado.

Estrutura de arquivos Customer Data Feed cdf-file-structure

Lista e define a estrutura de dados de um arquivo CDF. Isso inclui sequência de dados, delimitadores e separadores de campo, um mapa de arquivo de dados e um arquivo de amostra.

Identificadores e sequência do campo de dados identifiers-and-sequence

CDF arquivos não contêm colunas rotuladas ou cabeçalhos de campos. Em vez disso, um arquivo CDF define campos e matrizes com ASCII caracteres não imprimíveis. Além disso, o arquivo CDF lista cada campo e matriz em uma ordem específica. Entender os identificadores de campo e a ordem ajudará você a analisar o arquivo corretamente.

Elemento do arquivo CDF
Descrição
Separadores de campo e delimitadores

Esses caracteres não imprimíveis definem os elementos e a estrutura do arquivo CDF:

  • Ctrl + a (ASCII 001 ou ^A) separa dados em campos individuais com um indicador de espaço não imprimível.
  • Ctrl + b (ASCII 002 ou ^B) separa dados em uma matriz e solicita parâmetros.
  • Ctrl + c (ASCII 003 ou ^C) define pares de valores chave.
Sequência do campo

Importante: Audience Manager reserva o direito de adicionar novos campos ao final do arquivo CDF em versões futuras. Isso significa que o design técnico do sistema de análise de arquivos não deve pressupor um número fixo de colunas (embora possa pressupor uma ordem fixa para colunas existentes).

Os dados no arquivo CDF aparecem na ordem mostrada abaixo. /N pode aparecer no lugar de qualquer um desses campos, indicando um valor nulo.

  1. Hora do Evento
  2. Dispositivo
  3. ID do container
  4. Características Realizadas
  5. Segmentos realizados
  6. Parâmetros da solicitação
  7. Referenciador
  8. Endereço IP
  9. ID de dispositivo Experience Cloud (ou MID). Consulte também Cookies do e o Serviço de identidade da Adobe Experience Platform
  10. Todos os segmentos
  11. Todas as características

Para obter descrições dos campos, consulte Conteúdo do feed de dados do cliente definido.

Mapa de arquivos de CDF cdf-file-map

Os dados do arquivo CDF aparecem na ordem mostrada abaixo.

Identificação de storages

Matrizes em um arquivo CDF começam e terminam com o separador de campo Ctrl + a. Isso faz com que o primeiro elemento em uma matriz apareça como um campo de dados independente. Por exemplo, a matriz traits realizada começa com ^A1234. O delimitador de matriz e a ID ^B5678 seguem esta entrada. Como resultado, você pode ser tentado a pensar que o primeiro elemento na matriz traits realizada é a ID 5678 (porque começa com ^B). Esse não é o caso, por isso é necessário estar familiarizado com a sequência e a estrutura de um arquivo de dados. Mesmo que o primeiro elemento na matriz trait realizada (ou em qualquer outra matriz em um arquivo CDF) comece com ^A, a ordem de aparência ou posição no arquivo define o início de uma matriz. E, o primeiro elemento em uma matriz é sempre separado da entrada anterior por ^A.

Arquivo de amostra CDF sample-file

Um arquivo de amostra CDF pode ser semelhante ao seguinte. Inserimos quebras de linha neste exemplo para ajudá-lo a se ajustar à página.

Customer Data Feed Convenções de nomenclatura de arquivos cdf-naming-conventions

As seções abaixo listam e definem os elementos no nome do arquivo CDF.

CDF Nome do Arquivo: Sintaxe e Exemplo cdf-file-name

Um nome de arquivo CDF típico contém os elementos listados abaixo. Observe que itálico indica um espaço reservado para variável:

Sintaxe

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz

Exemplo

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz

No bucket de armazenamento do S3, os arquivos são classificados em ordem crescente pela ID do Parceiro (PID), dia e hora.

CDF Elementos de nome de arquivo definidos cdf-file-name-elements

A tabela a seguir lista e define os elementos em um nome de arquivo CDF.

Elemento do nome do arquivo
Descrição
s3://aam-cdf/
Esse é o bucket de armazenamento raiz padrão para o arquivo CDF em um servidor Amazon S3.
your S3 bucket name
O nome do bucket do S3 somente leitura que armazena seus arquivos CDF.
day=yyyy-mm-dd
A data em que o arquivo foi processado.
hour=hh
Um valor de hora expresso em notação de 24 horas e definido no fuso horário UTC. Consulte também Horários do nome do arquivo do feed de dados do cliente e Horários do conteúdo do arquivo....
partner ID
ID do parceiro.
File Sequence_0
Valores que identificam a sequência de arquivos. A sequência é incrementada da seguinte maneira: 0_0_0 , 0_1_0, 0_2_0...1_0_0
.gz
Uma extensão de arquivo gzip. Os arquivos CDF são compactados por gzip.

Customer Data Feed Notificações de Processamento de Arquivos cdf-file-processing-notifications

Audience Manager grava um arquivo .info no diretório S3 para informar quando o Customer Data File (CDF) está pronto para download. O arquivo .info também inclui JSON metadados formatados sobre o conteúdo dos arquivos CDF. Consulte esta seção para obter informações sobre a sintaxe e os campos usados por esse arquivo de notificação.

Arquivo de Informações de Exemplo sample-info-file

Cada arquivo .info contém uma seção Files e Totals. A seção Files contém uma matriz que contém métricas específicas para cada arquivo por hora. A seção Totals contém métricas agregadas em todos os arquivos CDF para um dia específico. O conteúdo do arquivo .info pode ser semelhante ao exemplo a seguir.

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Campos do arquivo de informações definidos info-file-fields-defined

As tabelas a seguir listam e definem os elementos em um arquivo CDF .info.

Objeto Files

Campo
Descrição
Files
Inicia a matriz que contém metadados sobre os arquivos CDF.
FileByteSize
Tamanho do arquivo em bytes.
FileChecksumMD5
O Amazon S3 ETag. O número após o hífen mostra o número de partes usadas para criar o arquivo durante o upload de várias partes. O ETag não é idêntico à soma de verificação MD5 do arquivo.
FileName
O nome do arquivo. Consulte Convenções de nomenclatura de arquivos de feed de dados do cliente.
FileSequenceNumber
Um número de índice para cada arquivo.

Objeto Totals

Campo
Descrição
Totals
Inicia o objeto que contém dados agregados sobre todos os arquivos CDF.
Day
O dia para o qual os dados estão disponíveis. Usa o formato aaaa-mm-dd.
Hour
A hora para a qual os dados estão disponíveis. Usa o formato de 24 horas definido no fuso horário UTC.
TotalByteSize
Tamanho total de todos os arquivos CDF naquela data, em bytes.
TotalNumberFiles
Número total de arquivos carregados no diretório S3.

Customer Data Feed Os horários do nome e do conteúdo do arquivo são diferentes different-processing-times

Seu arquivo CDF contém carimbos de data/hora no nome do arquivo e conteúdo do arquivo. Esses carimbos de data/hora registram processos de evento diferentes para o mesmo arquivo CDF. Não é incomum ver carimbos de data e hora diferentes no nome e conteúdo do mesmo arquivo. Entender cada carimbo de data e hora pode ajudar você a evitar erros comuns ao trabalhar com esses dados ou tentar classificá-los por tempo.

Localizando Carimbos de Data/Hora do Arquivo CDF locating-timestamps

CDF arquivos registram o tempo de forma diferente em 2 locais separados.

Entender a diferença entre carimbos de data e hora understanding-timestamps

A tabela a seguir fornece detalhes adicionais sobre os carimbos de data e hora do arquivo CDF, juntamente com informações sobre como usá-los corretamente.

Localização do carimbo de data e hora
Descrição
Nome do arquivo

O carimbo de data/hora no nome do arquivo CDF marca a hora em que o Audience Manager começou a preparar seu arquivo para entrega. Este carimbo de data/hora está definido no fuso horário UTC. Ele usa o parâmetro hour=, com a hora formatada como uma hora de 2 dígitos na notação de 24 horas. Esse horário pode ser diferente do horário do evento registrado no conteúdo do arquivo. Ao trabalhar com CDF arquivos, às vezes você perceberá que o seu bucket de S3 fica vazio por uma hora específica. Um bucket vazio significa uma das seguintes opções:

  • Não há dados para aquela hora em particular.
  • Nossos servidores estão sob uma carga pesada e não podem processar arquivos por uma hora específica. Quando o servidor alcança, ele coloca os arquivos que deveriam ter sido enviados em arquivos de um intervalo de tempo anterior em um intervalo com um valor de tempo posterior. Por exemplo, você verá isso quando um arquivo que deveria estar no intervalo de 17 horas aparecer no intervalo de 18 horas (com hour=18 no nome do arquivo). Nesse caso, o servidor provavelmente iniciou o processamento do arquivo na hora 17, mas não pôde concluí-lo nesse intervalo de tempo. Em vez disso, o arquivo é enviado para o próximo intervalo de tempo por hora.

Importante: não use o carimbo de data/hora do nome do arquivo para agrupar eventos por hora. Se você precisar agrupar por tempo, use o carimbo de data/hora EventTime no conteúdo do arquivo.

Conteúdo do arquivo
O carimbo de data/hora no conteúdo do arquivo CDF marca a hora em que o Data Collection Servers iniciou o processamento do arquivo. Este carimbo de data/hora está definido no fuso horário UTC. Ele usa o campo EventTime, com a hora formatada como yyyy-mm-dd hh:mm:ss. Essa hora é próxima à hora real do evento na página, mas pode ser diferente do indicador de hora no nome do arquivo.
Dica: ao contrário do carimbo de data/hora hour= no nome do arquivo, você pode usar EventTime para agrupar dados por hora.
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695