Exportar conjuntos de datos a destinos de almacenamiento en la nube

AVAILABILITY
  • Esta funcionalidad está disponible para los clientes que hayan adquirido el paquete Real-Time CDP Prime o Ultimate, Adobe Journey Optimizer o Customer Journey Analytics. Póngase en contacto con el representante del Adobe para obtener más información.

En este artículo se explica el flujo de trabajo necesario para exportar conjuntos de datos de Adobe Experience Platform a su ubicación de almacenamiento en la nube preferida, como Amazon S3, ubicaciones SFTP o Google Cloud Storage, mediante la interfaz de usuario del Experience Platform.

También puede utilizar las API de Experience Platform para exportar conjuntos de datos. Lea el tutorial de API para exportar conjuntos de datos para obtener más información.

Conjuntos de datos disponibles para exportar datasets-to-export

Los conjuntos de datos que puede exportar varían en función de la aplicación del Experience Platform (Real-Time CDP, Adobe Journey Optimizer), el nivel (Prime o Ultimate) y cualquier complemento que haya adquirido (por ejemplo: Data Distiller).

Utilice la siguiente tabla para comprender qué tipos de conjuntos de datos puede exportar según la aplicación, el nivel de producto y los complementos adquiridos:

Aplicación/complemento
Nivel
Conjuntos de datos disponibles para exportar
Real-Time CDP
Prime
Conjuntos de datos de perfil y evento de experiencia creados en la interfaz de usuario de Experience Platform después de la ingesta o recopilación de datos mediante fuentes, SDK web, SDK móvil, conector de datos de Analytics y Audience Manager.
Ultimate
Adobe Journey Optimizer
Prime
Consulte la documentación de Adobe Journey Optimizer.
Ultimate
Consulte la documentación de Adobe Journey Optimizer.
Customer Journey Analytics
Todas
Conjuntos de datos de perfil y evento de experiencia creados en la interfaz de usuario de Experience Platform después de la ingesta o recopilación de datos mediante fuentes, SDK web, SDK móvil, conector de datos de Analytics y Audience Manager.
Data Distiller
Data Distiller (complemento)
Conjuntos de datos derivados creados mediante el servicio de consultas.

Tutorial de vídeo video-tutorial

Vea el siguiente vídeo para obtener una explicación completa del flujo de trabajo descrito en esta página, los beneficios de utilizar la funcionalidad de exportar conjunto de datos y algunos casos de uso sugeridos.

Destinos admitidos supported-destinations

Actualmente, puede exportar conjuntos de datos a los destinos de almacenamiento en la nube resaltados en la captura de pantalla y que se enumeran a continuación.

Página del catálogo de destinos que muestra qué destinos admiten exportaciones de conjuntos de datos.

Cuándo activar audiencias o exportar conjuntos de datos when-to-activate-audiences-or-activate-datasets

Algunos destinos basados en archivos del catálogo de Experience Platform admiten la activación de audiencias y la exportación de conjuntos de datos.

  • Considere la posibilidad de activar audiencias cuando desee estructurar los datos en perfiles agrupados por intereses o cualificaciones de audiencia.
  • Alternativamente, considere las exportaciones de conjuntos de datos cuando desee exportar conjuntos de datos sin procesar, que no están agrupados o estructurados por intereses o cualificaciones de audiencia. Puede utilizar estos datos para la creación de informes, los flujos de trabajo de ciencia de datos y muchos otros casos de uso. Por ejemplo, como administrador, ingeniero de datos o analista, puede exportar datos desde Experience Platform para sincronizarlos con el almacén de datos, usarlos en herramientas de análisis de BI, herramientas de ML de nube externas o almacenarlos en el sistema para necesidades de almacenamiento a largo plazo.

Este documento contiene toda la información necesaria para exportar conjuntos de datos. Si desea activar audiencias en destinos de marketing por correo electrónico o almacenamiento en la nube, lea Activar datos de audiencia en destinos de exportación de perfiles por lotes.

Requisitos previos prerequisites

Para exportar conjuntos de datos a destinos de almacenamiento en la nube, debe haber conectado correctamente a un destino. Si aún no lo ha hecho, vaya al catálogo de destinos, examine los destinos admitidos y configure el destino que desee utilizar.

Permisos necesarios permissions

Para exportar conjuntos de datos, necesita Ver destinos, Ver conjuntos de datos y Administrar y activar destinos de conjuntos de datos permisos de control de acceso. Lea la descripción general del control de acceso o póngase en contacto con el administrador del producto para obtener los permisos necesarios.

Para asegurarse de que tiene los permisos necesarios para exportar conjuntos de datos y de que el destino admite la exportación de conjuntos de datos, examine el catálogo de destinos. Si un destino tiene un control Activar o Exportar conjuntos de datos, tiene los permisos apropiados.

Seleccione su destino select-destination

Siga las instrucciones para seleccionar un destino al que exportar los conjuntos de datos:

  1. Vaya a Conexiones > Destinos y seleccione la pestaña Catálogo.

    Pestaña Catálogo de destino con control de catálogo resaltado.

  2. Seleccione Activar o Exportar conjuntos de datos en la tarjeta correspondiente al destino al que desea exportar los conjuntos de datos.

    Ficha de catálogo de destino con el control Activar resaltado.

  3. Seleccione Conjuntos de datos de tipo de datos y seleccione la conexión de destino a la que desea exportar los conjuntos de datos. A continuación, seleccione Siguiente.

TIP
Si desea configurar un nuevo destino para exportar conjuntos de datos, seleccione Configure new destination para almacenar en déclencheur el flujo de trabajo Connect to destination.

Flujo de trabajo de activación de destino con control de conjuntos de datos resaltado.

  1. Aparece la vista Seleccionar conjuntos de datos. Continúe con la siguiente sección para seleccionar sus conjuntos de datos para la exportación.

Seleccione sus conjuntos de datos select-datasets

Utilice las casillas de verificación de la izquierda de los nombres de los conjuntos de datos para seleccionar los conjuntos de datos que desea exportar al destino y, a continuación, seleccione Siguiente.

Flujo de trabajo de exportación de conjuntos de datos que muestra el paso Seleccionar conjuntos de datos, donde puede seleccionar qué conjuntos de datos exportar.

Programación de exportación del conjunto de datos scheduling

Use el paso Programación para:

  • Establezca una fecha de inicio y una fecha de finalización, así como una cadencia de exportación para las exportaciones de conjuntos de datos.
  • Configure si los archivos del conjunto de datos exportados deben exportar la pertenencia completa del conjunto de datos o solo los cambios incrementales en la pertenencia en cada ocurrencia de exportación.
  • Personalice la ruta de la carpeta en la ubicación de almacenamiento donde se deben exportar los conjuntos de datos. Obtenga más información sobre cómo editar la ruta de acceso a la carpeta de exportación.

Utilice el control Editar programación de la página para editar la cadencia de exportación de las exportaciones, así como para seleccionar si desea exportar archivos completos o incrementales.

Editar control de programación resaltado en el paso Programación.

La opción Exportar archivos incrementales está seleccionada de forma predeterminada. Esto déclencheur la exportación de uno o varios archivos que representan una instantánea completa del conjunto de datos. Los archivos posteriores son adiciones incrementales al conjunto de datos desde la exportación anterior. También puede seleccionar Exportar archivos completos. En este caso, seleccione la frecuencia Una vez para una exportación completa única del conjunto de datos.

IMPORTANT
La primera exportación de archivo incremental incluye todos los datos existentes en el conjunto de datos, y funciona como relleno. La exportación puede contener uno o varios archivos.

Flujo de trabajo de exportación del conjunto de datos que muestra el paso de programación.

  1. Utilice el selector Frecuencia para seleccionar la frecuencia de exportación:

    • Diario: Programe exportaciones de archivos incrementales una vez al día, todos los días y a la hora que especifique.
    • Por hora: Programar exportaciones de archivos incrementales cada 3, 6, 8 o 12 horas.
  2. Utilice el selector Time para elegir la hora del día, en formato UTC, en que debe realizarse la exportación.

  3. Utilice el selector Fecha para elegir el intervalo en el que debe realizarse la exportación.

  4. Seleccione Guardar para guardar la programación y continuar con el paso Revisar.

NOTE
Para las exportaciones de conjuntos de datos, los nombres de archivo tienen un formato preestablecido predeterminado que no se puede modificar. Consulte la sección Verificar la exportación correcta del conjunto de datos para obtener más información y ejemplos de archivos exportados.

Editar ruta de la carpeta edit-folder-path

Seleccione Editar ruta de carpeta para personalizar la estructura de carpetas en la ubicación de almacenamiento donde se depositan los conjuntos de datos exportados.

Editar control de ruta de carpeta resaltado en el paso de programación.

Puede utilizar varias macros disponibles para personalizar el nombre de la carpeta que desee. Haga doble clic en una macro para agregarla a la ruta de acceso de la carpeta y utilice / entre las macros para separar las carpetas.

Selección de macros resaltada en la ventana modal de la carpeta personalizada.

Después de seleccionar las macros deseadas, puede ver una vista previa de la estructura de carpetas que se creará en su ubicación de almacenamiento. El primer nivel de la estructura de carpetas representa la ruta de la carpeta que indicó al conectarse al destino para exportar conjuntos de datos.

Vista previa de la ruta de la carpeta resaltada en la ventana modal de la carpeta personalizada.

Revisar review

En la página Revisar, puedes ver un resumen de tu selección. Seleccione Cancelar para dividir el flujo, Atrás para modificar la configuración o Finalizar para confirmar su selección y comenzar a exportar conjuntos de datos al destino.

Flujo de trabajo de exportación del conjunto de datos que muestra el paso de revisión.

Verificar exportación correcta del conjunto de datos verify

Al exportar conjuntos de datos, el Experience Platform crea uno o varios archivos de .json o .parquet en la ubicación de almacenamiento proporcionada. Espere que los nuevos archivos se depositen en su ubicación de almacenamiento según la programación de exportación proporcionada.

Experience Platform crea una estructura de carpetas en la ubicación de almacenamiento especificada, donde deposita los archivos del conjunto de datos exportados. El patrón de exportación de carpetas predeterminado se muestra a continuación, pero puede personalizar la estructura de carpetas con sus macros preferidas.

TIP
El primer nivel de esta estructura de carpetas - folder-name-you-provided - representa la ruta de la carpeta que indicó al conectarse al destino para exportar conjuntos de datos.

folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM

El nombre de archivo predeterminado se genera de forma aleatoria y garantiza que los nombres de archivo exportados sean únicos.

Archivos de conjuntos de datos de muestra sample-files

La presencia de estos archivos en su ubicación de almacenamiento es la confirmación de una exportación correcta. Para comprender cómo se estructuran los archivos exportados, puede descargar un archivo de muestra .parquet o .json.

Archivos de conjuntos de datos comprimidos compressed-dataset-files

En el flujo de trabajo conectar con destino, puede seleccionar los archivos del conjunto de datos exportados que se van a comprimir, como se muestra a continuación:

Selección del tipo de archivo y la compresión al conectarse a un destino para exportar conjuntos de datos.

Tenga en cuenta la diferencia de formato de archivo entre los dos tipos de archivo al comprimirlos:

  • Al exportar archivos JSON comprimidos, el formato de archivo exportado es json.gz. El formato del JSON exportado es NDJSON, que es el formato de intercambio estándar en el ecosistema de big data. Adobe recomienda utilizar un cliente compatible con NDJSON para leer los archivos exportados.
  • Al exportar archivos de parquet comprimidos, el formato de archivo exportado es gz.parquet

Solo se admiten las exportaciones a archivos JSON en modo comprimido. Las exportaciones a archivos de Parquet se admiten en modo comprimido y sin comprimir.

Eliminación de conjuntos de datos de destinos remove-dataset

Para eliminar conjuntos de datos de un flujo de datos existente, siga los pasos a continuación:

  1. Inicie sesión en la interfaz de usuario del Experience Platform y seleccione Destinos en la barra de navegación izquierda. Seleccione Examinar en el encabezado superior para ver los flujos de datos de destino existentes.

    Vista de exploración de destino con una conexión de destino mostrada y el resto borroso.

    note tip
    TIP
    Seleccione el icono de filtro Filter-icon en la parte superior izquierda para iniciar el panel de ordenación. El panel de ordenación proporciona una lista de todos sus destinos. Puede seleccionar más de un destino de la lista para ver una selección filtrada de flujos de datos asociados al destino seleccionado.
  2. En la columna Datos de activación, seleccione el control de conjuntos de datos para ver todos los conjuntos de datos asignados a este flujo de datos de exportación.

    La opción de navegación de conjuntos de datos disponible resaltada en la columna de datos de activación.

  3. Aparecerá la página Datos de activación para el destino. Utilice las casillas de verificación del lado izquierdo de la lista de conjuntos de datos para seleccionar los conjuntos de datos que desea eliminar y, a continuación, seleccione Eliminar conjuntos de datos en el carril derecho para almacenar en déclencheur el cuadro de diálogo de confirmación Eliminar conjunto de datos.

    Cuadro de diálogo Quitar conjunto de datos que muestra el control Quitar conjunto de datos en el carril derecho.

  4. En el cuadro de diálogo de confirmación, seleccione Quitar para eliminar inmediatamente el conjunto de datos de las exportaciones al destino.

    Cuadro de diálogo que muestra la opción Confirmar eliminación del conjunto de datos del flujo de datos.

Derechos de exportación de conjuntos de datos licensing-entitlement

Consulte los documentos de descripción del producto para comprender cuántos datos puede exportar por año para cada solicitud de Experience Platform. Por ejemplo, puede ver la Descripción de producto de Real-Time CDP aquí.

Tenga en cuenta que los derechos de exportación de datos para diferentes aplicaciones no son aditivos. Por ejemplo, esto significa que si compra Real-Time CDP Ultimate y Adobe Journey Optimizer Ultimate, el derecho de exportación de perfil será el mayor de los dos, según las descripciones del producto. Las autorizaciones por volumen se calculan tomando el número total de perfiles con licencia y multiplicando por 500 KB para Real-Time CDP Prime o 700 KB para Real-Time CDP Ultimate para determinar el volumen de datos al que tiene derecho.

Por otro lado, si ha adquirido complementos como Data Distiller, el límite de exportación de datos al que está autorizado representa la suma del nivel de producto y el complemento.

Puede ver y rastrear sus exportaciones de perfil en relación con sus límites contractuales en tablero de uso de licencias.

Limitaciones conocidas known-limitations

Tenga en cuenta las siguientes limitaciones para la publicación de disponibilidad general de las exportaciones de conjuntos de datos:

  • Actualmente, solo puede exportar archivos incrementales y no se puede seleccionar una fecha de finalización para las exportaciones de conjuntos de datos.
  • El Experience Platform puede exportar varios archivos incluso para conjuntos de datos pequeños. La exportación de conjuntos de datos está diseñada para la integración entre sistemas y optimizada para el rendimiento, por lo que el número de archivos exportados no se puede personalizar.
  • Los nombres de archivo exportados no se pueden personalizar en este momento.
  • Actualmente, los conjuntos de datos creados mediante API no están disponibles para la exportación.
  • Actualmente, la IU no impide eliminar un conjunto de datos que se exporta a un destino. No elimine ningún conjunto de datos que se esté exportando a destinos. Quite el conjunto de datos de un flujo de datos de destino antes de eliminarlo.
  • Las métricas de monitorización para exportaciones de conjuntos de datos se mezclan actualmente con los números de las exportaciones de perfiles, de modo que no reflejan los números de exportación reales.
  • Se excluyen de las exportaciones de conjuntos de datos los datos con una marca de tiempo anterior a 365 días. Para obtener más información, vea las protecciones para las exportaciones de conjuntos de datos programados

Preguntas frecuentes faq

¿Podemos generar un archivo sin carpeta si solo lo guardamos en / como ruta de la carpeta? Además, si no se requiere una ruta de carpeta, ¿cómo se generarán los archivos con nombres duplicados en una carpeta o ubicación?

+++
A partir de la versión de septiembre de 2024, es posible personalizar el nombre de la carpeta e incluso utilizar / para exportar archivos de todos los conjuntos de datos de la misma carpeta. Adobe no lo recomienda para destinos que exportan varios conjuntos de datos, ya que los nombres de archivo generados por el sistema que pertenecen a diferentes conjuntos de datos se mezclarán en la misma carpeta.
+++

¿Puede enrutar el archivo de manifiesto a una carpeta y los archivos de datos a otra?

+++
No, no es posible copiar el archivo de manifiesto en otra ubicación.
+++

¿Podemos controlar la secuencia o el tiempo de entrega de los archivos?

+++
Existen opciones para programar la exportación. No hay opciones para retrasar o secuenciar la copia de los archivos. Se copian en su ubicación de almacenamiento en cuanto se generan.
+++

¿Qué formatos están disponibles para el archivo de manifiesto?

+++
El archivo de manifiesto está en formato .json.
+++

¿Hay disponibilidad de API para el archivo de manifiesto?

+++
No hay ninguna API disponible para el archivo de manifiesto, pero incluye una lista de archivos que comprenden la exportación.
+++

¿Podemos agregar detalles adicionales al archivo de manifiesto (es decir, recuento de registros)? Si es así, ¿cómo?

+++
No es posible añadir información adicional al archivo de manifiesto. El recuento de registros está disponible a través de la entidad flowRun (consultable mediante API). Obtenga más información en la monitorización de destinos.
+++

¿Cómo se dividen los archivos de datos? ¿Cuántos registros por archivo?

+++
Los archivos de datos se dividen según la partición predeterminada en el lago de datos del Experience Platform. Los conjuntos de datos más grandes tienen un número mayor de particiones. El usuario no puede configurar la partición predeterminada porque está optimizada para la lectura.
+++

¿Podemos establecer un umbral (número de registros por archivo)?

+++
No, no es posible.
+++

¿Cómo reenviamos un conjunto de datos en caso de que el envío inicial sea incorrecto?

+++
Los reintentos se realizan automáticamente para la mayoría de los tipos de errores del sistema.
+++

recommendation-more-help
7f4d1967-bf93-4dba-9789-bb6b505339d6