Customer Data Feeds customer-data-feeds
Informações básicas sobre Customer Data Feed (CDF) arquivos e instruções sobre como começar. Comece aqui se estiver interessado em receber CDF arquivos ou quiser mais informações.
Conteúdo e finalidade do arquivo file-contents-purpose
Um arquivo CDF contém os mesmos dados que uma chamada de evento Audience Manager (/event
) envia para nossos servidores. Isso inclui dados como IDs de usuário, trait IDs, segment IDs e todos os outros parâmetros capturados por uma chamada de evento. Sistemas Audience Manager internos processam dados de evento em um arquivo CDF com conteúdo organizado em campos que aparecem em uma ordem definida. O Audience Manager tenta gerar CDF arquivos por hora e os armazena em um compartimento seguro e específico do cliente em um servidor Amazon S3. Fornecemos esses arquivos para que você possa trabalhar com dados do Audience Manager fora dos limites impostos pela interface do usuário.
- Antes de configurar a entrega de arquivos CDF, verifique se você tem as permissões apropriadas de provedores de dados de terceiros para a exportação de características de terceiros. No momento, o Audience Manager não oferece suporte à funcionalidade na interface do usuário para solicitar permissão de exportação de entrega de arquivo CDF de Provedores de dados de terceiros. Portanto, entre em contato com eles independentemente.
- Você não deve usar CDF arquivos como proxy para monitorar o tráfego da página, reconciliar discrepâncias de relatório, para cobrança etc.
Introdução getting-started
Não há um processo de autoatendimento para iniciar a entrega do arquivo CDF. Entre em contato com o consultor do Audience Manager ou com o Atendimento ao cliente para começar. Durante a implementação, o representante do Audience Manager irá:
- Configure seu bucket de armazenamento do Amazon S3.
- Forneça credenciais de autenticação S3 somente leitura ao seu bucket de armazenamento de arquivos. Você não poderá ver ou acessar diretórios e arquivos que pertencem a outros clientes.
Notificações de arquivo e CDF arquivos aparecerão no bucket S3 quando estiverem prontos para download. Você é responsável por monitorar e baixar arquivos do diretório S3 atribuído. Consulte Notificações de processamento de arquivos de feed de dados do cliente.
Próximas etapas next-steps
As seções abaixo e as Perguntas frequentes sobre o Feed de Dados do Cliente podem ajudar você a se familiarizar com esse serviço.
Customer Data Feed Conteúdo definido cdf-defined
Lista e define os elementos de dados e as matrizes em um arquivo CDF, por ordem de aparência. As definições incluem tipos de dados, mas essas informações não fazem parte de um arquivo CDF.
Definições definitions
Um arquivo CDF inclui alguns ou todos os campos definidos abaixo. Para obter informações sobre a organização interna do arquivo, consulte Estrutura do arquivo de feed de dados do cliente.
Event Time
A hora em que um arquivo CDF foi processado pelos Servidores de Coleta de Dados (DCS). O carimbo de data/hora usa o formato aaaa-mm-dd hhss e está definido no fuso horário UTC.
Observação: o Tempo de Evento não:
- A hora do evento da página ou a chamada do evento propriamente dito, embora possa ser próxima a esses horários.
- Relacionado à hora DCS no nome do arquivo. Consulte também Horários do nome do arquivo do feed de dados do cliente e Horários do conteúdo do arquivo....
Device
Container ID
Realized Traits
Uma matriz de IDs de característica que contém todas as características que um visitante realizou (se qualificou para) na chamada de evento.
Observe que a matriz pode conter características para as quais o visitante se qualificou antes e para as quais se requalificou por meio desta chamada de evento.
Realized Segments
Request Parameters
Uma string que captura todos os parâmetros (variáveis, IDs, pares de valores chave, IDs de publicidade do dispositivo etc.) transmitido na chamada de evento.
Exemplo abreviado:
d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583
Referer Data Type
IP Data Type
MCDevice
All Segments
All Traits
Estrutura de arquivos Customer Data Feed cdf-file-structure
Lista e define a estrutura de dados de um arquivo CDF. Isso inclui sequência de dados, delimitadores e separadores de campo, um mapa de arquivo de dados e um arquivo de amostra.
Identificadores e sequência do campo de dados identifiers-and-sequence
CDF arquivos não contêm colunas rotuladas ou cabeçalhos de campos. Em vez disso, um arquivo CDF define campos e matrizes com ASCII caracteres não imprimíveis. Além disso, o arquivo CDF lista cada campo e matriz em uma ordem específica. Entender os identificadores de campo e a ordem ajudará você a analisar o arquivo corretamente.
Esses caracteres não imprimíveis definem os elementos e a estrutura do arquivo CDF:
- Ctrl + a (ASCII
001
ou^A
) separa dados em campos individuais com um indicador de espaço não imprimível. - Ctrl + b (ASCII
002
ou^B
) separa dados em uma matriz e solicita parâmetros. - Ctrl + c (ASCII
003
ou^C
) define pares de valores chave.
Importante: Audience Manager reserva o direito de adicionar novos campos ao final do arquivo CDF em versões futuras. Isso significa que o design técnico do sistema de análise de arquivos não deve pressupor um número fixo de colunas (embora possa pressupor uma ordem fixa para colunas existentes).
Os dados no arquivo CDF aparecem na ordem mostrada abaixo. /N pode aparecer no lugar de qualquer um desses campos, indicando um valor nulo.
- Hora do Evento
- Dispositivo
- ID do container
- Características Realizadas
- Segmentos realizados
- Parâmetros da solicitação
- Referenciador
- Endereço IP
- ID de dispositivo Experience Cloud (ou MID). Consulte também Cookies do e o Serviço de identidade da Adobe Experience Platform
- Todos os segmentos
- Todas as características
Para obter descrições dos campos, consulte Conteúdo do feed de dados do cliente definido.
Mapa de arquivos de CDF cdf-file-map
Os dados do arquivo CDF aparecem na ordem mostrada abaixo.
Identificação de storages
Matrizes em um arquivo CDF começam e terminam com o separador de campo Ctrl + a
. Isso faz com que o primeiro elemento em uma matriz apareça como um campo de dados independente. Por exemplo, a matriz traits realizada começa com ^A1234
. O delimitador de matriz e a ID ^B5678
seguem esta entrada. Como resultado, você pode ser tentado a pensar que o primeiro elemento na matriz traits realizada é a ID 5678 (porque começa com ^B
). Esse não é o caso, por isso é necessário estar familiarizado com a sequência e a estrutura de um arquivo de dados. Mesmo que o primeiro elemento na matriz trait realizada (ou em qualquer outra matriz em um arquivo CDF) comece com ^A
, a ordem de aparência ou posição no arquivo define o início de uma matriz. E, o primeiro elemento em uma matriz é sempre separado da entrada anterior por ^A
.
Arquivo de amostra CDF sample-file
Um arquivo de amostra CDF pode ser semelhante ao seguinte. Inserimos quebras de linha neste exemplo para ajudá-lo a se ajustar à página.
Customer Data Feed Convenções de nomenclatura de arquivos cdf-naming-conventions
As seções abaixo listam e definem os elementos no nome do arquivo CDF.
CDF Nome do Arquivo: Sintaxe e Exemplo cdf-file-name
Um nome de arquivo CDF típico contém os elementos listados abaixo. Observe que itálico indica um espaço reservado para variável:
Sintaxe
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz
Exemplo
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz
No bucket de armazenamento do S3, os arquivos são classificados em ordem crescente pela ID do Parceiro (PID), dia e hora.
CDF Elementos de nome de arquivo definidos cdf-file-name-elements
A tabela a seguir lista e define os elementos em um nome de arquivo CDF.
s3://aam-cdf/
your S3 bucket name
day=yyyy-mm-dd
hour=hh
partner ID
File Sequence_0
.gz
Customer Data Feed Notificações de Processamento de Arquivos cdf-file-processing-notifications
Audience Manager grava um arquivo .info
no diretório S3 para informar quando o Customer Data File (CDF) está pronto para download. O arquivo .info
também inclui JSON metadados formatados sobre o conteúdo dos arquivos CDF. Consulte esta seção para obter informações sobre a sintaxe e os campos usados por esse arquivo de notificação.
Arquivo de Informações de Exemplo sample-info-file
Cada arquivo .info
contém uma seção Files
e Totals
. A seção Files
contém uma matriz que contém métricas específicas para cada arquivo por hora. A seção Totals
contém métricas agregadas em todos os arquivos CDF para um dia específico. O conteúdo do arquivo .info
pode ser semelhante ao exemplo a seguir.
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
Campos do arquivo de informações definidos info-file-fields-defined
As tabelas a seguir listam e definem os elementos em um arquivo CDF .info
.
Objeto Files
Files
FileByteSize
FileChecksumMD5
ETag
não é idêntico à soma de verificação MD5 do arquivo.FileName
FileSequenceNumber
Objeto Totals
Totals
Day
Hour
TotalByteSize
TotalNumberFiles
Customer Data Feed Os horários do nome e do conteúdo do arquivo são diferentes different-processing-times
Seu arquivo CDF contém carimbos de data/hora no nome do arquivo e conteúdo do arquivo. Esses carimbos de data/hora registram processos de evento diferentes para o mesmo arquivo CDF. Não é incomum ver carimbos de data e hora diferentes no nome e conteúdo do mesmo arquivo. Entender cada carimbo de data e hora pode ajudar você a evitar erros comuns ao trabalhar com esses dados ou tentar classificá-los por tempo.
Localizando Carimbos de Data/Hora do Arquivo CDF locating-timestamps
CDF arquivos registram o tempo de forma diferente em 2 locais separados.
Entender a diferença entre carimbos de data e hora understanding-timestamps
A tabela a seguir fornece detalhes adicionais sobre os carimbos de data e hora do arquivo CDF, juntamente com informações sobre como usá-los corretamente.
O carimbo de data/hora no nome do arquivo CDF marca a hora em que o Audience Manager começou a preparar seu arquivo para entrega. Este carimbo de data/hora está definido no fuso horário UTC. Ele usa o parâmetro hour=
, com a hora formatada como uma hora de 2 dígitos na notação de 24 horas. Esse horário pode ser diferente do horário do evento registrado no conteúdo do arquivo. Ao trabalhar com CDF arquivos, às vezes você perceberá que o seu bucket de S3 fica vazio por uma hora específica. Um bucket vazio significa uma das seguintes opções:
- Não há dados para aquela hora em particular.
- Nossos servidores estão sob uma carga pesada e não podem processar arquivos por uma hora específica. Quando o servidor alcança, ele coloca os arquivos que deveriam ter sido enviados em arquivos de um intervalo de tempo anterior em um intervalo com um valor de tempo posterior. Por exemplo, você verá isso quando um arquivo que deveria estar no intervalo de 17 horas aparecer no intervalo de 18 horas (com
hour=18
no nome do arquivo). Nesse caso, o servidor provavelmente iniciou o processamento do arquivo na hora 17, mas não pôde concluí-lo nesse intervalo de tempo. Em vez disso, o arquivo é enviado para o próximo intervalo de tempo por hora.
Importante: não use o carimbo de data/hora do nome do arquivo para agrupar eventos por hora. Se você precisar agrupar por tempo, use o carimbo de data/hora EventTime
no conteúdo do arquivo.
EventTime
, com a hora formatada como yyyy-mm-dd hh:mm:ss
. Essa hora é próxima à hora real do evento na página, mas pode ser diferente do indicador de hora no nome do arquivo.Dica: ao contrário do carimbo de data/hora
hour=
no nome do arquivo, você pode usar EventTime
para agrupar dados por hora.