Ingesta de datos ingest-data

IMPORTANT
Para cambiar el origen de datos de un conjunto de datos, primero debe eliminar el flujo de datos existente antes de crear uno nuevo que haga referencia al mismo conjunto de datos y al nuevo origen.
Adobe Experience Platform aplica una estricta relación uno a uno entre flujos y conjuntos de datos. Esto le permite mantener la sincronización entre el origen y el conjunto de datos para una ingesta incremental precisa.

Adobe Experience Platform permite la ingesta de datos desde fuentes externas, al tiempo que ofrece la posibilidad de estructurar, etiquetar y mejorar los datos entrantes mediante los servicios de Experience Platform. Puede ingerir datos de una variedad de fuentes, como aplicaciones de Adobe, almacenamiento basado en la nube, bases de datos y muchas otras.

Un conjunto de datos es una construcción de almacenamiento y administración para una colección de datos, normalmente una tabla, que contiene un esquema (columnas) y campos (filas). Los datos que se incorporan correctamente a Experience Platform se almacenan dentro del lago de datos como conjuntos de datos.

Fuentes compatibles con campañas organizadas supported

Los siguientes recursos son compatibles con las campañas orquestadas:

Tipo
Fuente
Almacenamiento en la nube
Amazon S3
Almacenamiento en la nube de Google
SFTP
Almacenes de datos en la nube
Snowflake
Google BigQuery
Zona de aterrizaje de datos
Azure Databricks
Cargas basadas en archivos
Carga de archivo local

Directrices para la higiene de datos de esquemas relacionales cdc

Para los conjuntos de datos habilitados con Cambiar captura de datos, todos los cambios de datos, incluidas las eliminaciones, se reflejarán automáticamente desde el sistema de origen a Adobe Experience Platform.

Dado que Adobe Journey Optimizer Campaign requiere que todos los conjuntos de datos incorporados estén habilitados con Cambiar captura de datos, es responsabilidad del cliente administrar las eliminaciones en el origen. Cualquier registro eliminado del sistema de origen se eliminará automáticamente del conjunto de datos correspondiente en Adobe Experience Platform.

Para eliminar registros mediante la ingesta basada en archivos, el archivo de datos del cliente debe marcar el registro con un valor D en el campo Change Request Type. Esto indica que el registro debe eliminarse en Adobe Experience Platform, reflejando el sistema de origen.

Si el cliente desea eliminar registros solo de Adobe Experience Platform sin afectar a los datos de origen originales, están disponibles las siguientes opciones:

  • Replicación de captura de datos proxy o saneada para cambio

    El cliente puede crear una tabla de origen proxy o saneada para controlar qué registros se replican en Adobe Experience Platform. Las eliminaciones se pueden administrar de forma selectiva desde esta tabla intermedia.

  • Eliminación mediante Data Distiller

    Si tiene licencia, Data Distiller se puede usar para admitir operaciones de eliminación directamente en Adobe Experience Platform, independientemente del sistema de origen.

    Más información sobre Data Distiller

Configuración de un flujo de datos

En este ejemplo se muestra cómo configurar un flujo de datos que ingiere datos estructurados en Adobe Experience Platform. El flujo de datos configurado admite la ingesta automatizada y programada y permite realizar actualizaciones en tiempo real.

  1. Desde el menú Conexiones, acceda al menú Fuentes.

  2. Elija su fuente según las Fuentes compatibles con las campañas orquestadas.

  3. Conecte su cuenta de Cloud Storage o Google Cloud Storage si elige fuentes basadas en la nube.

  4. Elija los datos que desea introducir en Adobe Experience Platform.

  5. En la página Detalles del conjunto de datos, marque Habilitar la captura de datos de cambio para mostrar solo los conjuntos de datos asignados a esquemas relacionales e incluir una clave principal y un descriptor de versión.

Obtenga más información sobre las directrices para la higiene de los datos de esquemas relacionales

IMPORTANT
Solo para orígenes basados en archivos, cada fila del archivo de datos debe incluir una columna _change_request_type con los valores U (actualización) o D (eliminación). Sin esta columna, el sistema no reconocerá los datos como compatibles con el seguimiento de cambios y no aparecerá la opción Campaña orquestada, lo que impedirá que se seleccione el conjunto de datos para el direccionamiento.

  1. Seleccione el conjunto de datos creado anteriormente y haga clic en Siguiente.

  2. Si solo usa orígenes basados en archivos, en la ventana Seleccionar datos, cargue los archivos locales y obtenga una vista previa de su estructura y contenido.

    Tenga en cuenta que el tamaño máximo admitido es de 100 MB.

  3. En la ventana Mapping, compruebe que cada atributo del archivo de origen esté asignado correctamente con los campos correspondientes del esquema de destino. Más información sobre las dimensiones de segmentación.

    Haga clic en Siguiente cuando haya terminado.

  4. Configure el flujo de datos Programar según la frecuencia que desee.

  5. Haga clic en Finalizar para crear el flujo de datos. Se ejecuta automáticamente según la programación definida.

  6. En el menú Conexiones, seleccione Fuentes y acceda a la pestaña Flujos de datos para rastrear la ejecución del flujo, revisar los registros ingeridos y solucionar cualquier error.

recommendation-more-help
b22c9c5d-9208-48f4-b874-1cefb8df4d76