Información general sobre conjuntos de datos
Todos los datos que se han ingerido correctamente en Adobe Experience Platform se conservan dentro de Data Lake como conjuntos de datos. Un conjunto de datos es una construcción de almacenamiento y administración para una colección de datos, normalmente una tabla, que contiene un esquema (columnas) y campos (filas). Los conjuntos de datos también contienen metadatos que describen varios aspectos de los datos que almacenan.
Este documento proporciona información general de alto nivel sobre los conjuntos de datos de Experience Platform.
Creación de conjuntos de datos y metadatos de seguimiento
Catalog Service es el sistema de registro para la ubicación y el linaje de datos dentro de Experience Platform, y se usa para crear y administrar conjuntos de datos. Catalog rastrea los metadatos de cada conjunto de datos, lo que incluye una referencia al esquema Experience Data Model (XDM) al que se ajusta el conjunto de datos (explicado en la siguiente sección) y el número de registros ingeridos en ese conjunto de datos.
Consulte la descripción general del servicio de catálogo para obtener más información.
Aplicar restricciones a datos de conjuntos de datos
Experience Data Model (XDM) es el marco estandarizado mediante el cual Platform organiza los datos de experiencia del cliente. Todos los datos que se incorporan a Platform deben ajustarse a un esquema XDM predefinido para poder persistir en Data Lake como un conjunto de datos.
Todos los conjuntos de datos contienen una referencia al esquema XDM que restringe el formato y la estructura de los datos que pueden almacenar. Si se intentan cargar datos en un conjunto de datos que no se ajusta al esquema XDM del conjunto de datos, la ingesta fallará.
Para obtener más información sobre XDM, consulte la descripción general del sistema XDM.
Ingesta de datos en conjuntos de datos
La ingesta de datos de Adobe Experience Platform representa los múltiples métodos mediante los cuales Platform ingiere datos de varias fuentes. Independientemente del método de ingesta, todos los datos introducidos correctamente se convierten en archivos por lotes. Los lotes son unidades de datos compuestas por uno o más archivos que se van a introducir como una sola unidad. Estos archivos por lotes se agregarán a los conjuntos de datos dedicados y persistirán dentro de Data Lake.
Consulte la Información general sobre la ingesta de datos para obtener más información.
Etiquetas aplicadas a conjuntos de datos de esquemas
Administración de datos de Adobe Experience Platform le permite administrar los datos de los clientes para garantizar el cumplimiento de las regulaciones, restricciones y políticas aplicables al uso de los datos. El marco de trabajo de control de datos le permite aplicar etiquetas de uso para categorizar los datos según las políticas de uso que se apliquen a esos datos. Las etiquetas se pueden aplicar a esquemas individuales, campos dentro de esos esquemas y conjuntos de datos individuales completos. Cuando las etiquetas se aplican directamente a un esquema, esas etiquetas se propagan a todos los conjuntos de datos existentes y futuros basados en ese esquema.
Consulte la descripción general de control de datos para obtener más información sobre el servicio. Para ver los pasos para trabajar con etiquetas de uso en Platform, consulte las siguientes guías:
Conjuntos de datos en servicios Platform descendentes
Una vez que se han utilizado conjuntos de datos para almacenar datos ingeridos, los servicios de Platform descendentes los utilizan para actualizar perfiles de clientes, obtener perspectivas a través del aprendizaje automático, etc.
A continuación se muestra una lista de servicios descendentes que utilizan conjuntos de datos para diversas operaciones. Consulte la documentación de cada servicio para obtener más información.
- Data Access API: permite acceder y descargar el contenido de los archivos almacenados en los conjuntos de datos.
- Servicio de identidad de Adobe Experience Platform: vincula identidades entre dispositivos y sistemas y vincula conjuntos de datos en función de los campos de identidad definidos por los esquemas XDM a los que se ajustan.
- Real-Time Customer Profile: aprovecha Identity Service para crear perfiles detallados de clientes a partir de sus conjuntos de datos en tiempo real. Real-Time Customer Profile extrae datos de Data Lake y conserva los perfiles de los clientes en su propio almacén de datos independiente.
- Servicio de segmentación de Adobe Experience Platform: le permite generar segmentos y audiencias a partir de los datos de Real-Time Customer Profile. Estas audiencias se pueden exportar a sus propios conjuntos de datos dentro de Data Lake.
- Adobe Experience Platform Data Science Workspace: Utiliza aprendizaje automático e inteligencia artificial para descubrir información en conjuntos de datos grandes.
- Adobe Experience Platform Query Service: permite usar SQL estándar para consultar datos en Experience Platform, unir conjuntos de datos dentro de Data Lake y capturar resultados de consultas como un nuevo conjunto de datos para usar en informes, Data Science Workspace o Real-Time Customer Profile.
- Servicio Adobe Experience Platform Destinations: permite exportar conjuntos de datos al almacenamiento en la nube o a los destinos de marketing por correo electrónico deseados para realizar actividades de informes o ciencia de datos.
Pasos siguientes
Al leer este documento, se le ha informado sobre los usos principales de los conjuntos de datos en Experience Platform, así como sobre los distintos servicios de Platform que utilizan conjuntos de datos. Para obtener más información sobre las muchas formas en que se usan los conjuntos de datos en Platform, consulte la documentación del servicio vinculada a lo largo de esta descripción general.
Para ver los pasos sobre cómo interactuar con conjuntos de datos en la interfaz de usuario de Experience Platform, consulte la guía del usuario de conjuntos de datos.