Exportar conjuntos de datos
Este artículo describe cómo se puede usar Customer Journey Analytics Export datasets para implementar el siguiente caso de uso de exportación de datos:
- Backup de datos
Primeros pasos
Exportar datos mediante Experience Platform Export datasets le permite exportar datos de las vistas de datos del Customer Journey Analytics a cualquier destino de almacenamiento en la nube.
Más información
Puede exportar conjuntos de datos sin procesar desde el lago de datos en Experience Platform a destinos de almacenamiento en la nube. Esta exportación se realiza en la terminología Destinos de Experience Platform, que se denomina destinos de exportación de conjuntos de datos. Consulte Exportar conjuntos de datos a destinos de almacenamiento en la nube para obtener una descripción general.
Se admiten los siguientes destinos de almacenamiento en la nube:
IU de Experience Platform
Puede exportar y programar la exportación de sus conjuntos de datos a través de la interfaz de usuario de Experience Platform. En esta sección se describen los pasos que debe seguir.
Seleccionar destino
Cuando haya determinado el destino de almacenamiento en la nube al que desea exportar el conjunto de datos, seleccione el destino. Cuando aún no haya configurado un destino para su almacenamiento en la nube preferido, debe crear una nueva conexión de destino.
Como parte de la configuración de un destino, puede definir:
- el tipo de archivo (JSON o Parquet),
- si el archivo resultante debe comprimirse o no, y
- si se debe incluir o no un archivo de manifiesto.
Seleccionar conjunto de datos
Cuando haya seleccionado el destino, en el siguiente paso Seleccionar conjuntos de datos debe seleccionar el conjunto de datos de la lista de conjuntos de datos. Si ha creado varias consultas programadas y desea que los conjuntos de datos se envíen al mismo destino de almacenamiento en la nube, puede seleccionar los conjuntos de datos correspondientes. Consulte Seleccionar sus conjuntos de datos para obtener más información.
Programación de exportación del conjunto de datos
Por último, desea programar la exportación del conjunto de datos como parte del paso Programando. En ese paso puede definir la programación y si la exportación del conjunto de datos debe ser incremental o no. Consulte Programar exportación del conjunto de datos para obtener más información.
Pasos finales
Revise su selección y, cuando sea correcta, comience a exportar su conjunto de datos al destino de almacenamiento en la nube.
En primer lugar, debe verificar que la exportación de datos se haya realizado correctamente. Al exportar conjuntos de datos, el Experience Platform crea uno o varios archivos de .json
o .parquet
en la ubicación de almacenamiento definida en el destino. Se espera que los nuevos archivos se depositen en su ubicación de almacenamiento según la programación de exportación configurada. Experience Platform crea una estructura de carpetas en la ubicación de almacenamiento especificada como parte del destino seleccionado, donde deposita los archivos exportados. Se crea una carpeta nueva para cada tiempo de exportación, siguiendo el patrón: folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM
. El nombre de archivo predeterminado se genera de forma aleatoria y garantiza que los nombres de archivo exportados sean únicos.
API de Flow Service
También puede exportar y programar la exportación de conjuntos de datos mediante API. Los pasos involucrados están documentados en Exportar conjuntos de datos mediante la API de Flow Service.
Introducción
Para exportar conjuntos de datos, asegúrese de que cuenta con los permisos necesarios. Compruebe también que el destino al que desea enviar el conjunto de datos admite la exportación de conjuntos de datos. A continuación, debe recopilar los valores de los encabezados obligatorios y opcionales que utiliza en las llamadas a la API. También necesita identificar las especificaciones de conexión y los ID de especificación de flujo del destino al que desea exportar los conjuntos de datos.
Recuperar conjuntos de datos aptos
Puede recuperar una lista de conjuntos de datos aptos para la exportación y comprobar si el conjunto de datos forma parte de esa lista mediante la API GET /connectionSpecs/{id}/configs
.
Crear conexión de origen
A continuación, debe crear una conexión de origen para el conjunto de datos, usando su ID único, que desea exportar al destino de almacenamiento en la nube. Utiliza la API POST /sourceConnections
.
Autenticar en el destino (crear conexión base)
Ahora debe crear una conexión base para autenticar y almacenar de forma segura las credenciales en su destino de almacenamiento en la nube mediante la API POST /targetConection
.
Proporcionar parámetros de exportación
A continuación, debe crear una conexión de destino adicional que almacene los parámetros de exportación para su conjunto de datos mediante, una vez más, la API POST /targetConection
. Estos parámetros de exportación incluyen ubicación, formato de archivo, compresión, etc.
Configurar flujo de datos
Finalmente, ha configurado el flujo de datos para asegurarse de que el conjunto de datos se exporta a su destino de almacenamiento en la nube mediante la API POST /flows
. En este paso, puede definir la programación de la exportación mediante el parámetro scheduleParams
.
Validar flujo de datos
Para comprobar las ejecuciones correctas del flujo de datos, utilice la API GET /runs
y especifique el ID del flujo de datos como parámetro de consulta. Este ID de flujo de datos es un identificador que se devuelve al configurar el flujo de datos.
Verificar que la exportación de datos se haya realizado correctamente. Al exportar conjuntos de datos, el Experience Platform crea uno o varios archivos de .json
o .parquet
en la ubicación de almacenamiento definida en el destino. Se espera que los nuevos archivos se depositen en su ubicación de almacenamiento según la programación de exportación configurada. Experience Platform crea una estructura de carpetas en la ubicación de almacenamiento especificada como parte del destino seleccionado, donde deposita los archivos exportados. Se crea una carpeta nueva para cada tiempo de exportación, siguiendo el patrón: folder-name-you-provided/datasetID/exportTime=YYYYMMDDHHMM
. El nombre de archivo predeterminado se genera de forma aleatoria y garantiza que los nombres de archivo exportados sean únicos.