Visão geral dos conjuntos de dados

Todos os dados ingeridos com êxito no Adobe Experience Platform são persistentes nos conjuntos de dados Data Lake como. Um conjunto de dados é um armazenamento e uma construção de gerenciamento para uma coleção de dados, geralmente uma tabela, que contém um schema (colunas) e campos (linhas). Os conjuntos de dados também contêm metadados que descrevem vários aspectos dos dados armazenados.

Este documento fornece uma visão geral de alto nível dos conjuntos de dados em Experience Platform.

Criação de conjuntos de dados e rastreamento de metadados

Catalog Service é o sistema de registro para localização de dados e linhagem dentro Experience Platforme é usado para criar e gerenciar conjuntos de dados. Catalog rastreia os metadados de cada conjunto de dados, que inclui uma referência ao schema Experience Data Model (XDM) ao qual o conjunto de dados está em conformidade (explicado na próxima seção) e o número de registros ingeridos nesse conjunto de dados.

Consulte a visão geral do serviço de catálogo para obter mais informações.

Impondo restrições nos dados do conjunto de dados

Experience Data Model (XDM) é a estrutura padronizada pela qual Platform organiza os dados de experiência do cliente. Todos os dados inseridos no Platform devem estar em conformidade com um schema XDM predefinido antes de serem persistentes no conjunto de dados Data Lake .

Todos os conjuntos de dados contêm uma referência ao schema XDM que restringe o formato e a estrutura dos dados que eles podem armazenar. Tentar carregar dados em um conjunto de dados que não esteja em conformidade com o schema XDM do conjunto de dados fará com que a ingestão falhe.

Para obter mais informações sobre o XDM, consulte a visão geral do SistemaXDM.

Como inserir dados em conjuntos de dados

A ingestão de dados da Adobe Experience Platform representa os vários métodos pelos quais Platform os dados são ingeridos de várias fontes. Independentemente do método de ingestão, todos os dados ingeridos com êxito são convertidos em arquivos em lote. Lotes são unidades de dados que consistem em um ou mais arquivos que serão assimilados como uma única unidade. Esses arquivos em lote são então adicionados a conjuntos de dados dedicados e persistem no Data Lake.

Consulte a visão geral da ingestão de dados para obter mais informações.

Aplicar rótulos de uso a conjuntos de dados

A Adobe Experience Platform Data Governance permite que você gerencie dados do cliente para garantir a conformidade com regulamentos, restrições e políticas aplicáveis ao uso de dados. A Data Governance estrutura permite aplicar rótulos de uso para categorizar dados de acordo com as políticas de uso que se aplicam a esses dados.

Os rótulos de uso de dados podem ser aplicados a conjuntos de dados inteiros ou a campos de conjuntos de dados individuais. Os rótulos adicionados no nível do conjunto de dados são herdados por todos os campos dentro desse conjunto de dados.

Consulte a visão geral do Data Governance para obter mais informações sobre o serviço. Para obter as etapas sobre como trabalhar com rótulos de uso em Platform, consulte os seguintes guias:

Conjuntos de dados em Platform serviços a jusante

Depois que os conjuntos de dados tiverem sido usados para armazenar dados ingeridos, esses conjuntos de dados serão usados pelos Platform serviços de downstream para atualizar os perfis do cliente, obter insights por meio do aprendizado da máquina e muito mais.

A seguir está uma lista de serviços downstream que usam conjuntos de dados para várias operações. Consulte a documentação de cada serviço para obter mais informações.

  • Data Access API: Permite acessar e baixar o conteúdo de arquivos armazenados em conjuntos de dados.
  • Serviçode identidade Adobe Experience Platform: Corresponde identidades entre dispositivos e sistemas, vinculando conjuntos de dados com base nos campos de identidade definidos pelos schemas XDM aos quais eles estão em conformidade.
  • Real-time Customer Profile: Aproveita Identity Service para criar perfis detalhados do cliente a partir de seus conjuntos de dados em tempo real. Real-time Customer Profile extrai dados dos perfis do cliente Data Lake e persiste em seu próprio armazenamento de dados separado.
  • Serviçode segmentação do Adobe Experience Platform: Permite que você crie segmentos e gere audiências a partir de seus Real-time Customer Profile dados. Essas audiências podem ser exportadas para seus próprios conjuntos de dados dentro da Data Lake.
  • Adobe Experience Platform Data Science Workspace: Usa aprendizado de máquina e inteligência artificial para descobrir insights em grandes conjuntos de dados.
  • Serviçode Query Adobe Experience Platform: Permite que você use SQL padrão para query de dados no, unindo quaisquer conjuntos de dados no Experience Platforme capturando resultados de query como um novo conjunto de dados para uso em relatórios, Data Lake ou Data Science WorkspaceReal-time Customer Profile.

Próximas etapas

Ao ler esse documento, você foi apresentado aos principais usos dos conjuntos de dados no Experience Platform, bem como aos vários Platform serviços que utilizam conjuntos de dados. Para obter mais detalhes sobre as várias maneiras em que os conjuntos de dados são usados, consulte a documentação do serviço vinculada em toda esta visão geral. Platform

Para obter etapas sobre como interagir com conjuntos de dados na Experience Platform interface do usuário, consulte o guia do usuário dosconjuntos de dados.

Nesta página