Exportar conjuntos de dados
Este artigo descreve como o Customer Journey Analytics Export datasets pode ser usado para implementar o seguinte caso de uso de exportação de dados:
- Backup de dados
Introdução
A exportação de dados usando o Experience Platform Export datasets permite exportar dados das visualizações de dados de Customer Journey Analytics para qualquer destino de armazenamento na nuvem.
Mais informações
Você pode exportar conjuntos de dados brutos do data lake no Experience Platform para destinos de armazenamento na nuvem. Essa exportação está na terminologia Destinos do Experience Platform, conhecida como Destinos de exportação do conjunto de dados. Consulte Exportar conjuntos de dados para destinos de armazenamento na nuvem para obter uma visão geral.
Os seguintes destinos de armazenamento em nuvem são compatíveis:
IU DO EXPERIENCE PLATFORM
Você pode exportar e agendar a exportação de seus conjuntos de dados por meio da interface do usuário do Experience Platform. Esta seção descreve as etapas envolvidas.
Selecionar destino
Depois de determinar o destino do armazenamento na nuvem para onde deseja exportar o conjunto de dados, selecione o destino. Quando ainda não tiver configurado um destino para o armazenamento na nuvem de sua preferência, você deve criar uma nova conexão de destino.
Como parte da configuração de um destino, você pode definir:
- o tipo de arquivo (JSON ou Parquet),
- se o arquivo resultante deve ser compactado ou não, e
- se um arquivo de manifesto deve ser incluído ou não.
Selecionar conjunto de dados
Ao selecionar o destino, na próxima etapa Selecionar conjuntos de dados, é necessário selecionar seu conjunto de dados na lista de conjuntos de dados. Se você tiver criado várias consultas programadas e quiser que os conjuntos de dados enviem para o mesmo destino de armazenamento na nuvem, é possível selecionar os conjuntos de dados correspondentes. Consulte Selecionar seus conjuntos de dados para obter mais informações.
Programar exportação do conjunto de dados
Por fim, você deseja agendar a exportação do seu conjunto de dados como parte da etapa Agendamento. Nessa etapa, é possível definir o agendamento e se a exportação do conjunto de dados deve ser incremental ou não. Consulte Agendar exportação do conjunto de dados para obter mais informações.
Etapas finais
Revise sua seleção e, quando estiver correto, comece a exportar seu conjunto de dados para o destino de armazenamento na nuvem.
Primeiro, você deve verificar uma exportação de dados bem-sucedida. Ao exportar conjuntos de dados, o Experience Platform cria um ou vários arquivos .json
ou .parquet
no local de armazenamento definido no seu destino. Espere que os novos arquivos sejam depositados no local de armazenamento de acordo com o agendamento de exportação configurado. O Experience Platform cria uma estrutura de pastas no local de armazenamento especificado como parte do destino selecionado, onde deposita os arquivos exportados. Uma nova pasta é criada para cada exportação, seguindo o padrão: folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM
. O nome de arquivo padrão é gerado aleatoriamente e garante que os nomes de arquivo exportados sejam exclusivos.
API do serviço de fluxo
Como alternativa, você pode exportar e agendar a exportação de conjuntos de dados usando APIs. As etapas envolvidas estão documentadas em Exportar conjuntos de dados usando a API de Serviço de Fluxo.
Introdução
Para exportar conjuntos de dados, verifique se você tem as permissões necessárias. Verifique também se o destino para onde deseja enviar o conjunto de dados oferece suporte à exportação de conjuntos de dados. Em seguida, você deve coletar os valores dos cabeçalhos obrigatórios e opcionais que você usa nas chamadas de API. Você também precisa identificar a especificação da conexão e as IDs da especificação do fluxo do destino para o qual você pretende exportar conjuntos de dados.
Recuperar conjuntos de dados qualificados
Você pode recuperar uma lista de conjuntos de dados qualificados para exportação e verificar se o seu conjunto de dados faz parte dessa lista usando a API GET /connectionSpecs/{id}/configs
.
Criar conexão de origem
Em seguida, você deve criar uma conexão de origem para o conjunto de dados, usando sua ID exclusiva, que você deseja exportar para o destino de armazenamento na nuvem. Você usa a API POST /sourceConnections
.
Autenticar para destino (criar conexão base)
Agora você deve criar uma conexão base para autenticar e armazenar com segurança as credenciais no destino de armazenamento na nuvem usando a API POST /targetConection
.
Fornecer parâmetros de exportação
Em seguida, você deve criar uma conexão de destino adicional que armazene os parâmetros de exportação para seu conjunto de dados usando, mais uma vez, a API POST /targetConection
. Esses parâmetros de exportação incluem local, formato de arquivo, compactação e muito mais.
Configurar fluxo de dados
Finalmente, você configurou o fluxo de dados para garantir que seu conjunto de dados seja exportado para seu destino de armazenamento na nuvem usando a API POST /flows
. Nesta etapa, você pode definir o agendamento da exportação, usando o parâmetro scheduleParams
.
Validar fluxo de dados
Para verificar execuções bem-sucedidas do fluxo de dados, use a API GET /runs
, especificando a ID do fluxo de dados como parâmetro de consulta. Essa ID de fluxo de dados é um identificador retornado ao configurar o fluxo de dados.
Verificar uma exportação de dados bem-sucedida. Ao exportar conjuntos de dados, o Experience Platform cria um ou vários arquivos .json
ou .parquet
no local de armazenamento definido no seu destino. Espere que os novos arquivos sejam depositados no local de armazenamento de acordo com o agendamento de exportação configurado. O Experience Platform cria uma estrutura de pastas no local de armazenamento especificado como parte do destino selecionado, onde deposita os arquivos exportados. Uma nova pasta é criada para cada exportação, seguindo o padrão: folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM
. O nome de arquivo padrão é gerado aleatoriamente e garante que os nomes de arquivo exportados sejam exclusivos.