Visão geral dos conjuntos de dados

Todos os dados assimilados com êxito no Adobe Experience Platform são mantidos no Data Lake como conjuntos de dados. Um conjunto de dados é uma construção de armazenamento e gerenciamento para uma coleção de dados, normalmente uma tabela, que contém um esquema (colunas) e campos (linhas). Os conjuntos de dados também contêm metadados que descrevem vários aspectos dos dados armazenados.

Este documento fornece uma visão geral de alto nível dos conjuntos de dados em Experience Platform.

Criar conjuntos de dados e rastrear metadados

Catalog Service é o sistema de registro para localização e linhagem de dados no Experience Platform, e é usado para criar e gerenciar conjuntos de dados. Catalog rastreia os metadados de cada conjunto de dados, o que inclui uma referência ao esquema Experience Data Model (XDM) ao qual o conjunto de dados está em conformidade (explicado na próxima seção) e o número de registros assimilados nesse conjunto de dados.

Consulte a Visão geral do serviço de catálogo para obter mais informações.

Como impor restrições aos dados do conjunto de dados

Experience Data Model (XDM) é a estrutura padronizada pela qual Platform organiza os dados de experiência do cliente. Todos os dados assimilados em Platform devem estar em conformidade com um esquema XDM predefinido antes de serem mantidos em Data Lake como um conjunto de dados.

Todos os conjuntos de dados contêm uma referência ao esquema XDM que restringe o formato e a estrutura dos dados que podem armazenar. Tentar fazer upload de dados para um conjunto de dados que não esteja em conformidade com o esquema XDM do conjunto de dados causará falha na assimilação.

Para obter mais informações sobre XDM, consulte a Visão geral do sistema XDM.

Inserção de dados em conjuntos de dados

A Assimilação de dados do Adobe Experience Platform representa os vários métodos pelos quais Platform assimila dados de várias fontes. Independentemente do método de assimilação, todos os dados assimilados com êxito são convertidos em arquivos em lote. Lotes são unidades de dados que consistem em um ou mais arquivos que serão assimilados como uma única unidade. Esses arquivos em lote são adicionados aos conjuntos de dados dedicados e mantidos dentro do Data Lake.

Consulte a Visão geral da assimilação de dados para obter mais informações.

Aplicar rótulos de uso a conjuntos de dados

O Adobe Experience Platform Data Governance permite gerenciar os dados do cliente para garantir a conformidade com regulamentos, restrições e políticas aplicáveis ao uso de dados. A estrutura Data Governance permite aplicar rótulos de uso para categorizar dados de acordo com as políticas de uso que se aplicam a esses dados.

Os rótulos de uso de dados podem ser aplicados a conjuntos de dados inteiros ou a campos individuais do conjunto de dados. Os rótulos adicionados no nível do conjunto de dados são herdados por todos os campos nesse conjunto de dados.

Consulte a Visão geral da governança de dados para obter mais informações sobre o serviço. Para obter etapas sobre como trabalhar com rótulos de uso em Platform, consulte os seguintes guias:

Conjuntos de dados em serviços downstream Platform

Depois que os conjuntos de dados tiverem sido usados para armazenar dados assimilados, esses conjuntos de dados serão usados pelos serviços downstream Platform para atualizar perfis do cliente, obter insights por meio do aprendizado de máquina e muito mais.

Veja a seguir uma lista de serviços downstream que usam conjuntos de dados para várias operações. Consulte a documentação de cada serviço para obter mais informações.

  • Data Access API: Permite acessar e baixar o conteúdo dos arquivos armazenados em conjuntos de dados.
  • Serviço de identidade da Adobe Experience Platform: Corresponde identidades entre dispositivos e sistemas, vinculando conjuntos de dados com base nos campos de identidade definidos pelos esquemas XDM aos quais eles estão em conformidade.
  • Real-time Customer Profile: Aproveitamento Identity Service para criar perfis detalhados do cliente a partir de seus conjuntos de dados em tempo real. Real-time Customer Profile extrai dados do Data Lake e mantém os perfis do cliente em seu próprio armazenamento de dados separado.
  • Serviço de segmentação do Adobe Experience Platform: Permite criar segmentos e gerar públicos-alvo a partir de seus Real-time Customer Profile dados. Esses públicos podem ser exportados para seus próprios conjuntos de dados no Data Lake.
  • Adobe Experience Platform Data Science Workspace: Usa aprendizado de máquina e inteligência artificial para descobrir insights em grandes conjuntos de dados.
  • Serviço de query do Adobe Experience Platform: Permite usar o SQL padrão para consultar dados no Experience Platform, unindo quaisquer conjuntos de dados no Data Lake e capturando resultados de query como um novo conjunto de dados para uso em relatórios, Data Science Workspaceou Real-time Customer Profile.

Próximas etapas

Ao ler este documento, você foi introduzido nos principais usos dos conjuntos de dados em Experience Platform, bem como nos vários serviços Platform que utilizam conjuntos de dados. Para obter mais detalhes sobre as várias maneiras como os conjuntos de dados são usados em Platform, consulte a documentação do serviço vinculada em toda esta visão geral.

Para obter etapas sobre como interagir com conjuntos de dados na interface do usuário Experience Platform, consulte o guia do usuário dos conjuntos de dados.

Nesta página