Exportar conjuntos de datos

Este artículo describe cómo se puede usar Customer Journey Analytics Export datasets para implementar el siguiente caso de uso de exportación de datos:

  • Backup de datos

Primeros pasos

Exportar datos mediante Experience Platform Export datasets le permite exportar datos de las vistas de datos del Customer Journey Analytics a cualquier destino de almacenamiento en la nube.

extensión de BI

Más información

Puede exportar conjuntos de datos sin procesar desde el lago de datos en Experience Platform a destinos de almacenamiento en la nube. Esta exportación se realiza en la terminología Destinos de Experience Platform, que se denomina destinos de exportación de conjuntos de datos. Consulte Exportar conjuntos de datos a destinos de almacenamiento en la nube para obtener una descripción general.

Se admiten los siguientes destinos de almacenamiento en la nube:

IU de Experience Platform

Puede exportar y programar la exportación de sus conjuntos de datos a través de la interfaz de usuario de Experience Platform. En esta sección se describen los pasos que debe seguir.

Seleccionar destino

Cuando haya determinado el destino de almacenamiento en la nube al que desea exportar el conjunto de datos, seleccione el destino. Cuando aún no haya configurado un destino para su almacenamiento en la nube preferido, debe crear una nueva conexión de destino.

Como parte de la configuración de un destino, puede definir:

  • el tipo de archivo (JSON o Parquet),
  • si el archivo resultante debe comprimirse o no, y
  • si se debe incluir o no un archivo de manifiesto.

Seleccionar conjunto de datos

Cuando haya seleccionado el destino, en el siguiente paso Seleccionar conjuntos de datos debe seleccionar el conjunto de datos de la lista de conjuntos de datos. Si ha creado varias consultas programadas y desea que los conjuntos de datos se envíen al mismo destino de almacenamiento en la nube, puede seleccionar los conjuntos de datos correspondientes. Consulte Seleccionar sus conjuntos de datos para obtener más información.

Programación de exportación del conjunto de datos

Por último, desea programar la exportación del conjunto de datos como parte del paso Programando. En ese paso puede definir la programación y si la exportación del conjunto de datos debe ser incremental o no. Consulte Programar exportación del conjunto de datos para obtener más información.

Pasos finales

Revise su selección y, cuando sea correcta, comience a exportar su conjunto de datos al destino de almacenamiento en la nube.

En primer lugar, debe verificar que la exportación de datos se haya realizado correctamente. Al exportar conjuntos de datos, el Experience Platform crea uno o varios archivos de .json o .parquet en la ubicación de almacenamiento definida en el destino. Se espera que los nuevos archivos se depositen en su ubicación de almacenamiento según la programación de exportación configurada. Experience Platform crea una estructura de carpetas en la ubicación de almacenamiento especificada como parte del destino seleccionado, donde deposita los archivos exportados. Se crea una carpeta nueva para cada tiempo de exportación, siguiendo el patrón: folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM. El nombre de archivo predeterminado se genera de forma aleatoria y garantiza que los nombres de archivo exportados sean únicos.

API de Flow Service

También puede exportar y programar la exportación de conjuntos de datos mediante API. Los pasos involucrados están documentados en Exportar conjuntos de datos mediante la API de Flow Service.

Introducción

Para exportar conjuntos de datos, asegúrese de que cuenta con los permisos necesarios. Compruebe también que el destino al que desea enviar el conjunto de datos admite la exportación de conjuntos de datos. A continuación, debe recopilar los valores de los encabezados obligatorios y opcionales que utiliza en las llamadas a la API. También necesita identificar las especificaciones de conexión y los ID de especificación de flujo del destino al que desea exportar los conjuntos de datos.

Recuperar conjuntos de datos aptos

Puede recuperar una lista de conjuntos de datos aptos para la exportación y comprobar si el conjunto de datos forma parte de esa lista mediante la API GET /connectionSpecs/{id}/configs.

Crear conexión de origen

A continuación, debe crear una conexión de origen para el conjunto de datos, usando su ID único, que desea exportar al destino de almacenamiento en la nube. Utiliza la API POST /sourceConnections.

Autenticar en el destino (crear conexión base)

Ahora debe crear una conexión base para autenticar y almacenar de forma segura las credenciales en su destino de almacenamiento en la nube mediante la API POST /targetConection.

Proporcionar parámetros de exportación

A continuación, debe crear una conexión de destino adicional que almacene los parámetros de exportación para su conjunto de datos mediante, una vez más, la API POST /targetConection. Estos parámetros de exportación incluyen ubicación, formato de archivo, compresión, etc.

Configurar flujo de datos

Finalmente, ha configurado el flujo de datos para asegurarse de que el conjunto de datos se exporta a su destino de almacenamiento en la nube mediante la API POST /flows. En este paso, puede definir la programación de la exportación mediante el parámetro scheduleParams.

Validar flujo de datos

Para comprobar las ejecuciones correctas del flujo de datos, utilice la API GET /runs y especifique el ID del flujo de datos como parámetro de consulta. Este ID de flujo de datos es un identificador que se devuelve al configurar el flujo de datos.

Verificar que la exportación de datos se haya realizado correctamente. Al exportar conjuntos de datos, el Experience Platform crea uno o varios archivos de .json o .parquet en la ubicación de almacenamiento definida en el destino. Se espera que los nuevos archivos se depositen en su ubicación de almacenamiento según la programación de exportación configurada. Experience Platform crea una estructura de carpetas en la ubicación de almacenamiento especificada como parte del destino seleccionado, donde deposita los archivos exportados. Se crea una carpeta nueva para cada tiempo de exportación, siguiendo el patrón: folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM. El nombre de archivo predeterminado se genera de forma aleatoria y garantiza que los nombres de archivo exportados sean únicos.

recommendation-more-help
080e5213-7aa2-40d6-9dba-18945e892f79