Exportar conjuntos de dados para destinos de armazenamento na nuvem
- Essa funcionalidade está disponível para clientes que compraram o pacote Real-Time CDP Prime ou Ultimate, Adobe Journey Optimizer ou Customer Journey Analytics. Entre em contato com o representante da Adobe para obter mais informações.
Este artigo explica o fluxo de trabalho necessário para exportar conjuntos de dados da Adobe Experience Platform para o local de armazenamento na nuvem preferido, como Amazon S3, locais SFTP ou Google Cloud Storage usando a interface do usuário do Experience Platform.
Você também pode usar as APIs de Experience Platform para exportar conjuntos de dados. Leia o tutorial da API de conjuntos de dados de exportação para obter mais informações.
Conjuntos de dados disponíveis para exportação datasets-to-export
Os conjuntos de dados que você pode exportar variam com base no aplicativo Experience Platform (Real-Time CDP, Adobe Journey Optimizer), no nível (Prime ou Ultimate) e em qualquer complemento que você tenha adquirido (por exemplo: Data Distiller).
Entenda, na tabela abaixo, quais tipos de conjunto de dados você pode exportar dependendo do aplicativo, da camada do produto e de qualquer complemento adquirido:
- Conjuntos de dados de Perfil e Evento de experiência criados na interface do Experience Platform após assimilar ou coletar dados por meio de Fontes, SDK da Web, SDK móvel, Conector de dados do Analytics e Audience Manager.
- Conjunto de dados de Instantâneo de Perfil gerado pelo sistema.
Conjuntos de dados de Perfil e Evento de experiência criados na interface do Experience Platform após assimilar ou coletar dados por meio de Fontes, SDK da Web, SDK móvel, Conector de dados do Analytics e Audience Manager.
Observação sobre disponibilidade: a capacidade de exportar conjuntos de dados para a nuvem está na fase de Teste limitado da versão e pode não estar disponível ainda no seu ambiente. Essa nota será removida quando a funcionalidade estiver disponível no geral. Para obter informações sobre o processo de lançamento de Customer Journey Analytics, consulte lançamentos de recursos de Customer Journey Analytics.
Tutorial em vídeo video-tutorial
Assista ao vídeo abaixo para obter uma explicação completa do fluxo de trabalho descrito nesta página, os benefícios de usar a funcionalidade de conjunto de dados de exportação e alguns casos de uso sugeridos.
Destinos compatíveis supported-destinations
Atualmente, você pode exportar conjuntos de dados para os destinos de armazenamento na nuvem destacados na captura de tela e listados abaixo.
Quando ativar públicos ou exportar conjuntos de dados when-to-activate-audiences-or-activate-datasets
Alguns destinos baseados em arquivo no catálogo do Experience Platform são compatíveis com a ativação de público-alvo e a exportação de conjunto de dados.
- Considere ativar públicos-alvo quando quiser que seus dados sejam estruturados em perfis agrupados por interesses ou qualificações de público-alvo.
- Como alternativa, considere as exportações de conjunto de dados ao procurar exportar conjuntos de dados brutos, que não são agrupados ou estruturados por interesses ou qualificações de público-alvo. Você pode usar esses dados para relatórios, fluxos de trabalho de ciência de dados e muitos outros casos de uso. Por exemplo, como administrador, engenheiro de dados ou analista, você pode exportar dados do Experience Platform para sincronizar com o data warehouse, usar em ferramentas de análise de BI, ferramentas de aprendizado de máquina na nuvem externas ou armazenar em seu sistema para necessidades de armazenamento de longo prazo.
Este documento contém todas as informações necessárias para exportar conjuntos de dados. Se você quiser ativar públicos-alvo para destinos de marketing por email ou armazenamento na nuvem, leia Ativar dados de público-alvo para destinos de exportação de perfil em lote.
Pré-requisitos prerequisites
Para exportar conjuntos de dados para destinos de armazenamento na nuvem, você deve ter se conectado com êxito a um destino. Se ainda não tiver feito isso, vá para o catálogo de destinos, navegue pelos destinos compatíveis e configure o destino que deseja usar.
Permissões necessárias permissions
Para exportar conjuntos de dados, você precisa de Exibir Destinos, Exibir Conjuntos de Dados e Gerenciar e Ativar Destinos de Conjuntos de Dados permissões de controle de acesso. Leia a visão geral do controle de acesso ou contate o administrador do produto para obter as permissões necessárias.
Para garantir que você tenha as permissões necessárias para exportar conjuntos de dados e que o destino seja compatível com a exportação de conjuntos de dados, navegue pelo catálogo de destinos. Se um destino tiver um controle Ativar ou Exportar conjuntos de dados, você terá as permissões apropriadas.
Selecione seu destino select-destination
Siga as instruções para selecionar um destino em que você possa exportar seus conjuntos de dados:
-
Vá para Conexões > Destinos e selecione a guia Catálogo.
-
Selecione Ativar ou Exportar conjuntos de dados no cartão correspondente ao destino para o qual você deseja exportar conjuntos de dados.
-
Selecione Conjuntos de dados, selecione a conexão de destino para a qual você deseja exportar conjuntos de dados e selecione Avançar.
- A exibição Selecionar conjuntos de dados é exibida. Prossiga para a próxima seção para selecionar seus conjuntos de dados para exportação.
Selecione seus conjuntos de dados select-datasets
Use as caixas de seleção à esquerda dos nomes dos conjuntos de dados para selecionar os conjuntos de dados que você deseja exportar para o destino e selecione Avançar.
Programar exportação do conjunto de dados scheduling
Na etapa Agendamento, é possível definir uma data de início e uma cadência de exportação para as exportações do conjunto de dados.
A opção Exportar arquivos incrementais é selecionada automaticamente. Isso aciona uma exportação de um ou vários arquivos que representam um instantâneo completo do conjunto de dados. Os arquivos subsequentes são adições incrementais ao conjunto de dados desde a exportação anterior.
-
Use o seletor de Frequência para selecionar a frequência de exportação:
- Diariamente: agendar exportações de arquivos incrementais uma vez por dia, todos os dias, no horário especificado.
- Por hora: agende exportações de arquivos incrementais a cada 3, 6, 8 ou 12 horas.
-
Use o seletor Hora para escolher a hora do dia, no formato UTC, em que a exportação deve ocorrer.
-
Use o seletor Data para escolher o intervalo em que a exportação deve ocorrer. No momento, não é possível definir uma data final para as exportações. Para obter mais informações, exiba a seção limitações conhecidas.
-
Selecione Avançar para salvar o agendamento e prosseguir para a etapa Revisão.
Revisar review
Na página Revisão, você pode ver um resumo da sua seleção. Selecione Cancelar para interromper o fluxo, Voltar para modificar suas configurações ou Concluir para confirmar sua seleção e começar a exportar conjuntos de dados para o destino.
Verificar se o conjunto de dados foi exportado com êxito verify
Ao exportar conjuntos de dados, o Experience Platform cria um ou vários arquivos .json
ou .parquet
no local de armazenamento fornecido. Espere que os novos arquivos sejam depositados no local de armazenamento de acordo com o agendamento de exportação fornecido.
O Experience Platform cria uma estrutura de pastas no local de armazenamento especificado, onde deposita os arquivos exportados do conjunto de dados. Uma nova pasta é criada para cada exportação, seguindo o padrão abaixo:
folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM
O nome de arquivo padrão é gerado aleatoriamente e garante que os nomes de arquivo exportados sejam exclusivos.
Arquivos de conjunto de dados de exemplo sample-files
A presença desses arquivos no local de armazenamento é a confirmação de uma exportação bem-sucedida. Para entender como os arquivos exportados são estruturados, você pode baixar um .arquivo parquet ou .arquivo json de amostra.
Arquivos de conjunto de dados compactados compressed-dataset-files
Em conectar ao fluxo de trabalho de destino, você pode selecionar os arquivos do conjunto de dados exportados a serem compactados, conforme mostrado abaixo:
Observe a diferença no formato de arquivo entre os dois tipos de arquivo, quando compactados:
- Ao exportar arquivos JSON compactados, o formato de arquivo exportado é
json.gz
- Ao exportar arquivos parquet compactados, o formato de arquivo exportado é
gz.parquet
Remover conjuntos de dados dos destinos remove-dataset
Para remover conjuntos de dados de um fluxo de dados existente, siga as etapas abaixo:
-
Faça logon na interface do usuário do Experience Platform e selecione Destinos na barra de navegação esquerda. Selecione Procurar no cabeçalho superior para exibir seus fluxos de dados de destino existentes.
note tip TIP Selecione o ícone de filtro na parte superior esquerda para iniciar o painel de classificação. O painel de classificação fornece uma lista de todos os seus destinos. Você pode selecionar mais de um destino na lista para ver uma seleção filtrada de fluxos de dados associados ao destino selecionado. -
Na coluna Dados de ativação, selecione o controle de conjuntos de dados para exibir todos os conjuntos de dados mapeados para esse fluxo de dados de exportação.
-
[Beta]{class="badge informative"} A página Dados de ativação do destino é exibida. Use as caixas de seleção no lado esquerdo da lista de conjuntos de dados para selecionar os conjuntos de dados que você deseja remover e selecione Remover conjuntos de dados no painel direito para acionar a caixa de diálogo de confirmação de remoção do conjunto de dados.
note note NOTE Esse recurso está na versão beta e só está disponível para clientes selecionados. Para solicitar acesso a esse recurso, entre em contato com o representante da Adobe. -
Na caixa de diálogo de confirmação, selecione Remover para remover imediatamente o conjunto de dados das exportações para o destino.
Direitos de exportação do conjunto de dados licensing-entitlement
Consulte os documentos de descrição do produto para entender quantos dados você está autorizado a exportar para cada aplicativo Experience Platform, por ano. Por exemplo, você pode exibir a Descrição do Produto Real-Time CDP aqui.
Observe que os direitos de exportação de dados para diferentes aplicativos não são aditivos. Por exemplo, isso significa que, se você comprar o Real-Time CDP Ultimate e o Adobe Journey Optimizer Ultimate, o direito de exportação do perfil será o maior dos dois direitos, de acordo com as descrições do produto. Os direitos de volume são calculados calculando o número total de perfis licenciados e multiplicando por 500 KB para o Real-Time CDP Prime ou 700 KB para o Real-Time CDP Ultimate para determinar o volume de dados ao qual você tem direito.
Por outro lado, se você adquiriu complementos, como o Data Distiller, o limite de exportação de dados ao qual você tem direito representa a soma da camada do produto e do complemento.
Você pode visualizar e rastrear as exportações de perfil em relação aos limites contratuais no painel de licenciamento.
Limitações conhecidas known-limitations
Lembre-se das seguintes limitações da versão de disponibilidade geral das exportações do conjunto de dados:
- Atualmente, você só pode exportar arquivos incrementais e uma data de término não pode ser selecionada para suas exportações de conjunto de dados.
- Os nomes de arquivos exportados não podem ser personalizados no momento.
- No momento, os conjuntos de dados criados por meio da API não estão disponíveis para exportação.
- No momento, a interface não impede que você exclua um conjunto de dados que está sendo exportado para um destino. Não exclua conjuntos de dados que estejam sendo exportados para destinos. Remova o conjunto de dados de um fluxo de dados de destino antes de excluí-lo.
- Atualmente, as métricas de monitoramento para exportações de conjunto de dados estão misturadas com números para exportações de perfil, de modo que não refletem os números reais exportados.
- Os dados com um carimbo de data e hora com mais de 365 dias são excluídos das exportações do conjunto de dados. Para obter mais informações, exiba as medidas de proteção para exportações agendadas do conjunto de dados