Visão geral dos conjuntos de dados

Todos os dados assimilados com êxito no Adobe Experience Platform são mantidos no Data Lake como conjuntos de dados. Um conjunto de dados é uma construção de armazenamento e gerenciamento para uma coleção de dados, normalmente uma tabela, que contém um esquema (colunas) e campos (linhas). Os conjuntos de dados também contêm metadados que descrevem vários aspectos dos dados armazenados.

Este documento fornece uma visão geral de alto nível dos conjuntos de dados na Experience Platform.

Criar conjuntos de dados e rastrear metadados

Catalog Service é o sistema de registro para localização e linhagem de dados no Experience Platforme é usada para criar e gerenciar conjuntos de dados. Catalog rastreia os metadados de cada conjunto de dados, o que inclui uma referência à variável Experience Data Model (XDM) o esquema do conjunto de dados está em conformidade com (explicado na próxima seção) e o número de registros assimilados nesse conjunto de dados.

Consulte a Visão geral do serviço de catálogo para obter mais informações.

Como impor restrições aos dados do conjunto de dados

Experience Data Model (XDM) é o quadro padronizado pelo qual Platform organiza os dados de experiência do cliente. Todos os dados assimilados em Platform deve estar em conformidade com um esquema XDM predefinido antes que possa ser mantido no Data Lake como um conjunto de dados.

Todos os conjuntos de dados contêm uma referência ao esquema XDM que restringe o formato e a estrutura dos dados que podem armazenar. Tentar fazer upload de dados para um conjunto de dados que não esteja em conformidade com o esquema XDM do conjunto de dados causará falha na assimilação.

Para obter mais informações sobre o XDM, consulte o Visão geral do sistema XDM.

Inserção de dados em conjuntos de dados

A Assimilação de dados do Adobe Experience Platform representa os vários métodos pelos quais Platform assimila dados de várias fontes. Independentemente do método de assimilação, todos os dados assimilados com êxito são convertidos em arquivos em lote. Lotes são unidades de dados que consistem em um ou mais arquivos que serão assimilados como uma única unidade. Esses arquivos em lote são então adicionados a conjuntos de dados dedicados e mantidos no Data Lake.

Consulte a Visão geral da assimilação de dados para obter mais informações.

Aplicar rótulos de uso a conjuntos de dados

A Governança de dados do Adobe Experience Platform permite gerenciar os dados do cliente para garantir a conformidade com regulamentos, restrições e políticas aplicáveis ao uso de dados. A estrutura de Governança de dados permite aplicar rótulos de uso para categorizar dados de acordo com as políticas de uso que se aplicam a esses dados.

Os rótulos de uso de dados podem ser aplicados a conjuntos de dados inteiros ou a campos individuais do conjunto de dados. Os rótulos adicionados no nível do conjunto de dados são herdados por todos os campos nesse conjunto de dados.

Consulte a Visão geral da governança de dados para obter mais informações sobre o serviço. Para obter etapas sobre como trabalhar com rótulos de uso em Platform, consulte os seguintes guias:

Conjuntos de dados em downstream Platform serviços

Depois que os conjuntos de dados tiverem sido usados para armazenar dados assimilados, esses conjuntos de dados serão usados pelo downstream Platform serviços para atualizar perfis de clientes, obter insights por meio de aprendizado de máquina e muito mais.

Veja a seguir uma lista de serviços downstream que usam conjuntos de dados para várias operações. Consulte a documentação de cada serviço para obter mais informações.

  • Data Access API: Permite acessar e baixar o conteúdo dos arquivos armazenados em conjuntos de dados.
  • Serviço de identidade da Adobe Experience Platform: Corresponde identidades entre dispositivos e sistemas, vinculando conjuntos de dados com base nos campos de identidade definidos pelos esquemas XDM aos quais eles estão em conformidade.
  • Real-time Customer Profile: Aproveitamento Identity Service para criar perfis detalhados do cliente a partir de seus conjuntos de dados em tempo real. Real-time Customer Profile extrai dados do Data Lake e persiste em perfis de clientes em seu próprio armazenamento de dados separado.
  • Serviço de segmentação do Adobe Experience Platform: Permite criar segmentos e gerar públicos-alvo a partir de Real-time Customer Profile dados. Esses públicos podem ser exportados para seus próprios conjuntos de dados na Data Lake.
  • Adobe Experience Platform Data Science Workspace: Usa aprendizado de máquina e inteligência artificial para descobrir insights em grandes conjuntos de dados.
  • Serviço de query Adobe Experience Platform: Permite que você use o SQL padrão para consultar dados em Experience Platformingressar em qualquer conjunto de dados no Data Lake e capturando resultados de query como um novo conjunto de dados para uso em relatórios, Data Science Workspaceou Real-time Customer Profile.

Próximas etapas

Ao ler este documento, você foi introduzido nos principais usos dos conjuntos de dados no Experience Platform, bem como os vários Platform serviços que utilizam conjuntos de dados. Para obter mais detalhes sobre as várias maneiras como os conjuntos de dados são usados em Platform, revise a documentação de serviço vinculada por esta visão geral.

Para obter etapas sobre como interagir com conjuntos de dados no Experience Platform interface do usuário, consulte a guia do usuário de conjuntos de dados.

Nesta página