Customer Data Feeds customer-data-feeds
Informações básicas sobre Customer Data Feed (CDF) arquivos e instruções sobre como começar. Comece aqui se estiver interessado em receber CDF ou apenas deseja mais informações.
Conteúdo e finalidade do arquivo file-contents-purpose
Um arquivo CDF contém os mesmos dados que uma chamada de evento Audience Manager (/event
) envia para nossos servidores. Isso inclui dados como IDs de usuário, trait IDs, segment IDse todos os outros parâmetros capturados por uma chamada de evento. Interno Audience Manager sistemas processam dados do evento em um CDF arquivo com conteúdo organizado em campos que aparecem em uma ordem definida. Audience Manager tenta gerar CDF de hora em hora e armazena em um bucket seguro e específico do cliente em um Amazon S3 servidor. Fornecemos esses arquivos para que você possa trabalhar com Audience Manager dados fora dos limites impostos pela interface do usuário.
- Antes de configurar a entrega de arquivos CDF, verifique se você tem as permissões apropriadas de provedores de dados de terceiros para a exportação de características de terceiros. No momento, o Audience Manager não oferece suporte à funcionalidade na interface do usuário para solicitar permissão de exportação de entrega de arquivo CDF de Provedores de dados de terceiros. Portanto, entre em contato com eles independentemente.
- Você não deve usar CDF arquivos como um proxy para monitorar o tráfego da página, reconciliar discrepâncias de relatório, faturamento etc.
Introdução getting-started
Não há um processo de autoatendimento a ser iniciado CDF entrega de arquivo. Entre em contato com Audience Manager ou Atendimento ao cliente para começar. Durante a implementação, o Audience Manager representante irá:
- Configure seu Amazon S3 bucket de armazenamento.
- Fornecer somente leitura S3 credenciais de autenticação para o bucket de armazenamento de arquivos. Você não poderá ver ou acessar diretórios e arquivos que pertencem a outros clientes.
Notificações de arquivo e CDF os arquivos aparecerão no S3 quando estiverem prontos para download. Você é responsável por monitorar e baixar os arquivos dos S3 diretório. Consulte Notificações de processamento de arquivos de feed de dados do cliente.
Próximas etapas next-steps
As seções abaixo e a Perguntas frequentes sobre o feed de dados do cliente O pode ajudá-lo a se familiarizar com esse serviço.
Customer Data Feed Conteúdo definido cdf-defined
Lista e define os elementos de dados e as matrizes em um CDF arquivo, por ordem de aparência. As definições incluem tipos de dados, mas essas informações não fazem parte de um CDF arquivo.
Definições definitions
A CDF O arquivo inclui alguns ou todos os campos definidos abaixo. Para obter informações sobre a organização interna de arquivos, consulte Estrutura do arquivo de feed de dados do cliente.
Event Time
A hora em que um arquivo CDF foi processado pelo Servidores de coleta de dados (DCS). O carimbo de data e hora usa o aaaa-mm-dd hhss e é definido no fuso horário UTC.
Observação: O tempo do evento não é:
- A hora do evento da página ou a chamada do evento propriamente dito, embora possa ser próxima a esses horários.
- Relacionado à hora DCS no nome do arquivo. Consulte também, Feed de dados do cliente Nome do arquivo Horas e Conteúdo do arquivo Horas....
Device
Container ID
Realized Traits
Uma matriz de IDs de característica que contém todas as características que um visitante realizou (se qualificou para) na chamada de evento.
Observe que a matriz pode conter características para as quais o visitante se qualificou antes e para as quais se requalificou por meio desta chamada de evento.
Realized Segments
Request Parameters
Uma string que captura todos os parâmetros (variáveis, IDs, pares de valores chave, IDs de publicidade do dispositivo etc.) transmitido na chamada de evento.
Exemplo abreviado:
d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583
Referer Data Type
IP Data Type
MCDevice
All Segments
All Traits
Customer Data Feed Estrutura do arquivo cdf-file-structure
Lista e define a estrutura de dados de um CDF arquivo. Isso inclui sequência de dados, delimitadores e separadores de campo, um mapa de arquivo de dados e um arquivo de amostra.
Identificadores e sequência do campo de dados identifiers-and-sequence
CDF os arquivos não contêm colunas rotuladas ou cabeçalhos de campo. Em vez disso, uma CDF O arquivo define campos e matrizes com caracteres não imprimíveis ASCII caracteres. Além disso, a variável CDF file lista cada campo e matriz em uma ordem específica. Entender os identificadores de campo e a ordem ajudará você a analisar o arquivo corretamente.
Esses caracteres não imprimíveis definem os elementos e a estrutura do arquivo CDF:
- Ctrl + a (ASCII)
001
ou^A
) separa os dados em campos individuais com um indicador de espaço não imprimível. - Ctrl + b (ASCII)
002
ou^B
) separa dados em uma matriz e parâmetros de solicitação. - Ctrl + c (ASCII)
003
ou^C
) define pares de valores chave.
Importante: Audience Manager A se reserva o direito de adicionar novos campos ao final do arquivo CDF em versões futuras. Isso significa que o design técnico do sistema de análise de arquivos não deve pressupor um número fixo de colunas (embora possa pressupor uma ordem fixa para colunas existentes).
Os dados no arquivo CDF aparecem na ordem mostrada abaixo. /N pode aparecer no lugar de qualquer um desses campos, indicando um valor nulo.
- Hora do Evento
- Dispositivo
- ID do container
- Características Realizadas
- Segmentos realizados
- Parâmetros da solicitação
- Referer
- Endereço IP
- ID de dispositivo Experience Cloud (ou MID). Consulte também, Cookies e o serviço de identidade da Adobe Experience Platform
- Todos os segmentos
- Todas as características
Para obter descrições dos campos, consulte Conteúdo do feed de dados do cliente definido.
CDF Mapa de arquivos cdf-file-map
CDF Os dados do arquivo aparecem na ordem mostrada abaixo.
Identificação de storages
Matrizes em uma CDF início e término do arquivo com o Ctrl + a
separador de campo. Isso faz com que o primeiro elemento em uma matriz apareça como um campo de dados independente. Por exemplo, o resultado traits matriz inicia com ^A1234
. O delimitador de matriz e a ID ^B5678
segue esta entrada. Como resultado, você pode ser tentado a pensar que o primeiro elemento no realizado traits é a ID 5678 (porque começa com ^B
). Esse não é o caso, por isso é necessário estar familiarizado com a sequência e a estrutura de um arquivo de dados. Mesmo que o primeiro elemento no trait array (ou qualquer um dos outros arrays em um CDF file) inicia com ^A
, a ordem de aparência ou posição no arquivo define o início de uma matriz. E, o primeiro elemento em uma matriz é sempre separado da entrada anterior por ^A
.
Amostra CDF Arquivo sample-file
Uma amostra CDF O arquivo pode ser semelhante ao seguinte. Inserimos quebras de linha neste exemplo para ajudá-lo a se ajustar à página.
Customer Data Feed Convenções de nomenclatura de arquivos cdf-naming-conventions
As seções abaixo listam e definem os elementos nas CDF nome do arquivo.
CDF Nome do arquivo: sintaxe e exemplo cdf-file-name
Um típico CDF O nome do arquivo contém os elementos listados abaixo. Observação: itálico indica um espaço reservado para variável:
Sintaxe
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz
Exemplo
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz
No seu S3 armazenamento temporário, os arquivos são classificados em ordem crescente pela ID do parceiro (PID), dia e hora.
CDF Elementos de nome de arquivo definidos cdf-file-name-elements
A tabela a seguir lista e define os elementos de uma CDF nome do arquivo.
s3://aam-cdf/
your S3 bucket name
day=yyyy-mm-dd
hour=hh
partner ID
File Sequence_0
.gz
Customer Data Feed Notificações de processamento de arquivo cdf-file-processing-notifications
Audience Manager grava um .info
arquivo para o seu S3 diretório para informar quando o Customer Data File (CDF) está pronto para download. A variável .info
o arquivo também inclui JSON metadados formatados sobre o conteúdo do seu CDF arquivos. Consulte esta seção para obter informações sobre a sintaxe e os campos usados por esse arquivo de notificação.
Arquivo de Informações de Exemplo sample-info-file
Each .info
o arquivo contém um Files
e Totals
seção. A variável Files
contém uma matriz que contém métricas específicas para cada arquivo por hora. A variável Totals
contém métricas agregadas em todas as CDF arquivos de um dia específico. O conteúdo do .info
O arquivo pode ser semelhante ao exemplo a seguir.
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
Campos do arquivo de informações definidos info-file-fields-defined
As tabelas a seguir listam e definem os elementos em uma CDF .info
arquivo.
Objeto Files
Files
FileByteSize
FileChecksumMD5
ETag
não é idêntica à soma de verificação MD5 do arquivo.FileName
FileSequenceNumber
Objeto Totals
Totals
Day
Hour
TotalByteSize
TotalNumberFiles
Customer Data Feed Os horários do nome do arquivo e do conteúdo do arquivo são diferentes different-processing-times
Seu CDF O arquivo contém carimbos de data e hora no nome do arquivo e conteúdo do arquivo. Esses carimbos de data e hora registram diferentes processos de evento para o mesmo CDF arquivo. Não é incomum ver carimbos de data e hora diferentes no nome e conteúdo do mesmo arquivo. Entender cada carimbo de data e hora pode ajudar você a evitar erros comuns ao trabalhar com esses dados ou tentar classificá-los por tempo.
Localizando CDF Carimbos de data e hora do arquivo locating-timestamps
CDF os arquivos registram o tempo de forma diferente em dois locais separados.
Entender a diferença entre carimbos de data e hora understanding-timestamps
A tabela a seguir fornece detalhes adicionais sobre o CDF carimbos de data e hora do arquivo, juntamente com informações sobre como usá-los corretamente.
O carimbo de data e hora em seu CDF nome do arquivo marca a hora em que Audience Manager começou a preparar seu arquivo para entrega. Esse carimbo de data e hora é definido na variável UTC fuso horário. Ele usa o hour=
parâmetro, com a hora formatada como uma hora de 2 dígitos na notação de 24 horas. Esse horário pode ser diferente do horário do evento registrado no conteúdo do arquivo. Ao trabalhar com CDF arquivos, às vezes você notará que seus S3 O bucket está vazio por uma hora específica. Um bucket vazio significa uma das seguintes opções:
- Não há dados para aquela hora em particular.
- Nossos servidores estão sob uma carga pesada e não podem processar arquivos por uma hora específica. Quando o servidor alcança, ele coloca os arquivos que deveriam ter sido enviados em arquivos de um intervalo de tempo anterior em um intervalo com um valor de tempo posterior. Por exemplo, você verá isso quando um arquivo que deveria estar no intervalo de 17 horas aparecer no intervalo de 18 horas (com
hour=18
no nome do arquivo). Nesse caso, o servidor provavelmente iniciou o processamento do arquivo na hora 17, mas não pôde concluí-lo nesse intervalo de tempo. Em vez disso, o arquivo é enviado para o próximo intervalo de tempo por hora.
Importante: não use o carimbo de data e hora do nome do arquivo para agrupar eventos por hora. Se precisar agrupar por tempo, use o EventTime
carimbo de data e hora no conteúdo do arquivo.
EventTime
com a hora formatada como yyyy-mm-dd hh:mm:ss
. Essa hora é próxima à hora real do evento na página, mas pode ser diferente do indicador de hora no nome do arquivo.Dica: Ao contrário da
hour=
carimbo de data e hora no nome do arquivo, é possível usar EventTime
para agrupar dados por tempo.