Customer Data Feeds

Informações básicas sobre os arquivos Customer Data Feed (CDF) e instruções sobre como começar. Comece aqui se estiver interessado em receber arquivos CDF ou só quiser mais informações.

Conteúdo e finalidade do arquivo

Um arquivo CDF contém os mesmos dados que uma chamada de evento Audience Manager (/event) envia para nossos servidores. Isso inclui dados como IDs de usuário, trait IDs, segment IDs e todos os outros parâmetros capturados por uma chamada de evento. Os sistemas Audience Manager internos processam os dados do evento em um arquivo CDF com o conteúdo organizado em campos que aparecem em uma ordem definida. Audience Manager O tenta gerar CDF arquivos por hora e os armazena em um bucket seguro e específico do cliente em um Amazon S3 servidor. Fornecemos esses arquivos para que você possa trabalhar com dados Audience Manager fora dos limites impostos pela interface do usuário.

IMPORTANTE

Observe as seguintes restrições ao trabalhar com arquivos CDF:

  • Antes de configurar a entrega de arquivos CDF, verifique se você tem as permissões apropriadas de provedores de dados de terceiros para a exportação de características de terceiros. No momento, o Audience Manager não oferece suporte à funcionalidade na interface do usuário para solicitar permissão de exportação de entrega de arquivos CDF de provedores de dados de terceiros, portanto, entre em contato com eles de maneira independente.
  • Você não deve usar os arquivos CDF como proxy para monitorar o tráfego da página, reconciliar discrepâncias de relatório ou para faturamento etc.

Introdução

Não há processo de autoatendimento para iniciar a entrega de arquivos CDF. Entre em contato com seu consultor Audience Manager ou com o Atendimento ao cliente para começar. Durante a implementação, o representante Audience Manager fará o seguinte:

  • Configure seu bucket de armazenamento Amazon S3.
  • Forneça credenciais de autenticação S3 somente leitura para o seu bucket de armazenamento de arquivos. Você não poderá ver ou acessar diretórios e arquivos que pertencem a outros clientes.

As notificações de arquivo e os arquivos CDF aparecerão em seu bucket S3 quando estiverem prontos para download. Você é responsável por monitorar e baixar arquivos do diretório atribuído S3. Consulte Notificações de processamento de arquivos de feed de dados do cliente.

Próximas etapas

As seções abaixo e as Perguntas frequentes sobre o Feed de dados do cliente podem ajudá-lo a se familiarizar mais com esse serviço.

Customer Data Feed Conteúdo definido

Lista e define os elementos de dados e as matrizes em um arquivo CDF, por ordem de aparência. As definições incluem tipos de dados, mas essas informações não fazem parte de um arquivo CDF.

Definições

Um arquivo CDF inclui alguns ou todos os campos definidos abaixo. Para obter informações sobre a organização interna do arquivo, consulte Estrutura do arquivo de feed de dados do cliente.

Campo Tipo de dados Descrição

Event Time

Carimbo de data e hora

A hora em que um arquivo CDF foi processado pelos Servidores de coleta de dados (DCS). O carimbo de data e hora usa o formato aaaa-mm-dd hh:mm:ss e é definido no fuso horário UTC.

Observação: O Tempo do Evento não é:

Device

String

Esta é a ID de usuário exclusiva (UUID), que é uma ID de dispositivo de 38 dígitos para o visitante do site. Consulte também Índice de IDs no Audience Manager.

Container ID

Numérico

A ID do contêiner que aciona sincronizações de ID.

Realized Traits

Matriz numérica

Uma matriz de IDs de característica que contém todas as características que um visitante realizou (qualificado para) na chamada de evento.

Observe que a matriz pode conter características para as quais o visitante se qualificou antes e para as quais se requaliu por meio dessa chamada de evento.

Realized Segments

Matriz numérica

Uma matriz de IDs de segmento que contém todos os segmentos que um visitante realizou (qualificado para) na chamada de evento.

Request Parameters

String

Uma string que captura todos os parâmetros (variáveis, IDs, pares de valores chave, IDs de publicidade de dispositivos etc.) passado na chamada de evento.

Exemplo reduzido:

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type

String

O URL não codificado da página de referência (se houver).

IP Data Type

String

O endereço IP do visitante capturado na chamada de evento.

MCDevice

String

A ID Experience Cloud (MID) atribuída ao visitante do site. Consulte também, Cookies e o serviço de identidade do Adobe Experience Platform.

All Segments

Matriz numérica

Uma matriz de IDs de segmento que contém segmentos realizados anteriormente e novos segmentos para os quais o visitante está qualificado.

All Traits

Matriz numérica

Uma matriz de IDs de características originais e de terceiros que contém características e novas características realizadas anteriormente pelas quais o visitante se qualificou desde o último feed de dados gerado.

Customer Data Feed Estrutura do arquivo

Lista e define a estrutura de dados de um arquivo CDF. Isso inclui sequência de dados, delimitadores e separadores de campo, um mapa de arquivo de dados e arquivo de amostra.

Identificadores e sequência do campo de dados

CDF os arquivos não contêm colunas rotuladas ou cabeçalhos de campo. Em vez disso, um arquivo CDF define campos e matrizes com caracteres ASCII não imprimíveis. Além disso, o arquivo CDF lista cada campo e matriz em uma ordem específica. Entender os identificadores de campo e a ordem ajudará a analisar o arquivo corretamente.

Elemento de arquivo CDF Descrição

Separadores e delimitadores de campo

Esses caracteres não imprimíveis definem os elementos e a estrutura do arquivo CDF:

  • Ctrl + a (ASCII 001 ou ^A) separa dados em campos individuais com um indicador de espaço não imprimível.
  • Ctrl + b (ASCII 002 ou ^B) separa dados em uma matriz e solicita parâmetros.
  • Ctrl + c (ASCII 003 ou ^C) define pares de valores chave.

Sequência do campo

Importante: Audience Manager reserva o direito de adicionar novos campos ao final do arquivo CDF em versões futuras. Isso significa que o design técnico do seu sistema de análise de arquivos não deve assumir um número fixo de colunas (embora possa assumir uma ordem fixa para as colunas existentes).

Os dados no arquivo CDF são exibidos na ordem mostrada abaixo.

  1. Hora do evento
  2. Dispositivo
  3. ID do container
  4. Características Realizadas
  5. Segmentos realizados
  6. Parâmetros da solicitação
  7. Referer
  8. Endereço IP
  9. Experience Cloud Device ID (ou MID). Consulte também, Cookies e o serviço de identidade da Adobe Experience Platform
  10. Todos os segmentos
  11. Todas as características

Para obter descrições de campos, consulte Conteúdo do feed de dados do cliente definido.

CDF Mapa de arquivos

CDF os dados do arquivo são exibidos na ordem mostrada abaixo.

Identificação de matrizes

Matrizes em um arquivo CDF iniciam e terminam com o separador de campo Ctrl + a. Isso faz com que o primeiro elemento em uma matriz pareça um campo de dados independente. Por exemplo, a matriz traits realizada começa com ^A1234. O delimitador de matriz e a ID ^B5678 seguem essa entrada. Como resultado, você pode ficar tentado a pensar que o primeiro elemento na matriz traits realizada é ID 5678 (porque começa com ^B). Esse não é o caso, por isso você precisa estar familiarizado com a sequência e a estrutura de um arquivo de dados. Mesmo que o primeiro elemento na matriz trait realizada (ou qualquer uma das outras matrizes em um arquivo CDF) comece com ^A, a ordem de aparência ou posição no arquivo define o início de uma matriz. E o primeiro elemento em uma matriz é sempre separado da entrada anterior por ^A.

Arquivo CDF de exemplo

Um arquivo de amostra CDF pode ser semelhante ao seguinte. Inserimos quebras de linha neste exemplo para ajudar a ajustar a página.

Customer Data Feed Convenções de nomenclatura de arquivos

As seções abaixo listam e definem os elementos no nome do arquivo CDF.

CDF Nome do arquivo: Sintaxe e exemplo

Um nome de arquivo típico CDF contém os elementos listados abaixo. Observação: itálico indica um espaço reservado de variável:

Sintaxe

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF-PARTNER-ID-AAM PROCESS-ID_0.gz

Exemplo

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_000058_0.gz

No seu bucket de armazenamento S3, os arquivos são classificados em ordem crescente pela ID do parceiro (PID), dia e hora.

CDF Elementos de nome de arquivo definidos

A tabela a seguir lista e define os elementos em um nome de arquivo CDF.

Elemento do nome do arquivo Descrição

s3://aam-cdf/

Esse é o bucket de armazenamento raiz padrão para seu arquivo CDF em um servidor Amazon S3.

your S3 bucket name

O nome do bucket S3 somente leitura que armazena seus arquivos CDF.

day=yyyy-mm-dd

A data em que o arquivo foi processado.

hour=hh

Um valor de hora expresso em notação de 24 horas e definido no fuso horário UTC. Consulte também, Tempo do nome do arquivo do feed de dados do cliente e Tempo do conteúdo do arquivo....

partner ID

Sua ID de parceiro.

AAM process ID_0

Uma ID de processo Audience Manager interna.

.gz

Uma extensão de arquivo gzip. Os arquivos CDF são compactados por gzip.

Customer Data Feed Notificações de processamento de arquivos

Audience Manager grava um .info arquivo no seu S3 diretório para informá-lo quando o Customer Data File (CDF) estiver pronto para download. O arquivo .info também inclui JSON metadados formatados sobre o conteúdo dos arquivos CDF. Consulte esta seção para obter informações sobre a sintaxe e os campos usados por este arquivo de notificação.

Arquivo de Informações de Exemplo

Cada arquivo .info contém uma seção Files e Totals. A seção Files contém uma matriz que contém métricas específicas para cada arquivo por hora. A seção Totals contém métricas agregadas em todos os arquivos CDF de um dia específico. O conteúdo do arquivo .info pode ser semelhante ao seguinte exemplo.

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Campos do arquivo de informações definidos

As tabelas a seguir listam e definem os elementos em um arquivo CDF .info.

Objeto de Arquivos

Campo Descrição

Files

Inicia a matriz que contém metadados sobre seus arquivos CDF.

FileByteSize

Tamanho do arquivo em bytes.

FileChecksumMD5

O Amazon S3 ETag. O número após o hífen mostra o número de partes usadas para criar o arquivo durante o upload de várias partes. O ETag não é idêntico à soma de verificação MD5 do arquivo.

FileName

O nome do arquivo. Consulte Convenções de nomenclatura de arquivos de feed de dados do cliente.

FileSequenceNumber

Um número de índice para cada arquivo.

Objeto Totais

Campo Descrição

Totals

Inicia o objeto que contém dados agregados sobre todos os arquivos CDF.

Day

O dia para o qual os dados estão disponíveis. Usa o formato aaaa-mm-dd.

Hour

A hora para a qual os dados estão disponíveis. Usa o formato de 24 horas definido no fuso horário UTC.

TotalByteSize

Tamanho total de todos os arquivos CDF dessa data em bytes.

TotalNumberFiles

Número total de arquivos carregados no diretório S3.

Customer Data Feed O tempo de nome do arquivo e o tempo de conteúdo do arquivo são diferentes

Seu arquivo CDF contém carimbos de data e hora no nome do arquivo e no conteúdo do arquivo. Esses carimbos de data e hora registram processos de evento diferentes para o mesmo arquivo CDF . Não é incomum ver carimbos de data e hora diferentes no nome e no conteúdo do mesmo arquivo. Entender cada carimbo de data e hora pode ajudar a evitar erros comuns ao trabalhar com esses dados ou tentar classificá-los por tempo.

Localizando CDF Carimbos de data e hora do arquivo

CDF os arquivos registram o tempo de forma diferente em 2 locais separados.

Como entender a diferença entre carimbos de data e hora

A tabela a seguir fornece detalhes adicionais sobre os carimbos de data e hora do arquivo CDF, juntamente com informações sobre como usá-los corretamente.

Localização do carimbo de data e hora Descrição
Nome do arquivo O carimbo de data e hora no nome do arquivo CDF marca o horário em que Audience Manager começou a preparar o arquivo para entrega. Esse carimbo de data e hora é definido no fuso horário UTC. Ele usa o parâmetro hour= , com o tempo formatado como uma hora de 2 dígitos em uma notação de 24 horas. Essa hora pode ser diferente da hora do evento registrada no conteúdo do arquivo. Ao trabalhar com arquivos CDF, às vezes você perceberá que o bucket S3 está vazio por uma hora específica. Um bucket vazio significa que:
  • Não há dados para aquela hora em particular.
  • Nossos servidores estão sob cargas pesadas e não podem processar arquivos por uma hora específica. Quando o servidor captura, ele coloca os arquivos que devem ter entrado em um arquivo de bucket de tempo anterior em um bucket com um valor de tempo posterior. Por exemplo, você verá isso quando um arquivo que deveria estar no período de 17 horas aparecer no período de 18 horas (com hour=18 no nome do arquivo). Nesse caso, o servidor provavelmente começou a processar seu arquivo na hora 17, mas não pôde concluí-lo dentro desse intervalo de tempo. Em vez disso, o arquivo é enviado para o próximo período de hora.

Importante: Não use o carimbo de data e hora do nome do arquivo para agrupar eventos por tempo. Se precisar agrupar por tempo, use o carimbo de data e hora EventTime no conteúdo do arquivo.
Conteúdo do arquivo O carimbo de data e hora no conteúdo do arquivo CDF marca o horário em que o Data Collection Servers começou a processar o arquivo. Esse carimbo de data e hora é definido no fuso horário UTC. Ele usa o campo EventTime, com o tempo formatado como yyyy-mm-dd hh:mm:ss. Essa hora está próxima da hora real do evento na página, mas pode ser diferente do indicador de hora no nome do arquivo.
Dica: Diferente do hour= carimbo de data e hora no nome do arquivo, é possível usar EventTime para agrupar dados por tempo.

Nesta página