Documentación Analytics Guía de componentes

Formatos de archivo del conjunto de clasificaciones

Last update: Tue Dec 16 2025 00:00:00 GMT+0000 (Coordinated Universal Time)

Temas:
Clasificaciones

Creado para:

Usuario
Administrador

Los conjuntos de clasificaciones admiten varios formatos de archivo para cargar datos de clasificación. Cada formato tiene requisitos específicos para que las cargas de datos se realicen correctamente.

Una vez que el archivo tenga el formato correcto según estas especificaciones, puede cargar los datos a través de la interfaz o la API de conjuntos de clasificaciones. Para obtener instrucciones detalladas de carga:

Carga del explorador: vea Cargar en la interfaz de Esquema para ver un conjunto de clasificaciones.
Carga de API: consulte la API de clasificaciones de Analytics

Los conjuntos de clasificaciones admiten los siguientes formatos de archivo:

JSON: archivos de notación de objetos de JavaScript con datos estructurados
CSV: archivos de valores separados por comas
TSV o TAB: archivos de valores separados por tabulaciones

Requisitos generales de archivo

Todos los formatos de archivo deben cumplir los siguientes requisitos:

Codificación de archivos: utilice UTF-8 sin marcas de orden de bytes. También se admite la codificación Latin1.
Límites de caracteres: Los valores de clasificación individuales tienen un límite máximo de 255 bytes.
Requisitos de clave: los valores de clave no pueden estar vacíos ni contener solo espacios en blanco. Si hay claves duplicadas, se utiliza la última ocurrencia.

Detalles del formato JSON

El formato de archivo JSON sigue las convenciones de las líneas JSON (JSONL). El archivo debe contener un objeto JSON por línea, donde cada objeto representa un único registro de clasificación.

note note
NOTE
A pesar de seguir las convenciones de las líneas JSON, utilice la extensión de archivo `.json` para todas las cargas. El uso de la extensión `.jsonl` puede provocar errores.

Estructura JSON

Cada objeto JSON debe contener:

key (obligatorio): El identificador único del registro de clasificación
data (requerido para actualizaciones): un objeto que contiene nombres de columnas de clasificación y sus valores
action (opcional): la acción que se va a realizar. Los valores admitidos son:
- update (la acción predeterminada, cuando no se especifica ninguna acción)
- delete-field
- delete-key
enc (opcional): especificación de codificación de datos. Los valores admitidos son:
- utf8 o UTF8 (predeterminado)
- latin1 o LATIN1

Todos los nombres de campo JSON (key, data, action, enc) distinguen entre mayúsculas y minúsculas y deben escribirse en minúsculas.

Reglas de validación de JSON

El campo key es obligatorio y no puede ser nulo ni estar vacío.
Para las acciones update, el campo data es obligatorio y no puede estar vacío.
Para las acciones delete-field, el campo data debe contener los campos que se van a eliminar.
Para las acciones delete-key, el campo data no debe estar presente.
Los valores de codificación admitidos no distinguen entre mayúsculas y minúsculas e incluyen nombres de conjuntos de caracteres estándar.

Ejemplos de JSON

Algunos ejemplos de registros JSON en un archivo JSON.

Registro de actualización básica

code language-json
`{"key": "product123", "data": {"Product Name": "Basketball Shoes", "Brand": "Brand A", "Category": "Sports"}}`

Actualización con codificación especificada

code language-json
`{"key": "product456", "enc": "utf8", "data": {"Product Name": "Running Shoes", "Brand": "Brand B"}}`

Eliminar campos específicos

code language-json
`{"key": "product789", "action": "delete-field", "data": {"Brand": null, "Category": null}}`

Eliminar una clave completa

code language-json
`{"key": "product999", "action": "delete-key"}`

Detalles del formato CSV

Los archivos CSV (valores separados por comas) utilizan comas para separar los campos de datos de clasificación.

Estructura CSV

Fila de encabezado: la primera fila debe contener encabezados de columna y la primera columna debe ser la columna de clave. Las columnas posteriores deben coincidir con los nombres del esquema del conjunto de clasificaciones.
Filas de datos: Cada fila subsiguiente contiene datos de clasificación
Delimitadores: los campos están separados por comas
Comillas: los campos que contienen comas, comillas o líneas nuevas deben escribirse entre comillas dobles

Reglas de formato CSV

Los campos que contienen comas deben ir entre comillas dobles.
Los campos que contienen comillas dobles deben omitir las comillas duplicándolas ("").
Los campos vacíos representan valores nulos para esa clasificación.
Los espacios iniciales y finales alrededor de los campos se recortan automáticamente.
Se conservan los caracteres especiales (pestañas, líneas nuevas) dentro de los campos entre comillas.

Operaciones de eliminación de CSV

Use ~deletekey~ en cualquier campo para eliminar toda la clave y todos sus datos de clasificación
Utilice ~empty~ en campos específicos para eliminar solo esos valores de clasificación (deja otros campos intactos)
Al usar ~empty~, puede combinar eliminaciones con actualizaciones en el mismo archivo

Ejemplos de CSV

Algunos ejemplos de registros CSV en un archivo CSV.

Datos básicos de clasificación

code language-csv
`Key,Product Name,Brand,Category,Price product123,"Basketball Shoes",Brand A,Sports,89.99 product456,"Running Shoes",Brand B,Sports,79.99 product789,"Winter Jacket",Brand C,Clothing,149.99`

Eliminar una clave completa

code language-csv
`Key,Product Name,Brand,Category,Price product999,~deletekey~,,,`

Eliminar campos específicos (mezclados con actualizaciones)

code language-csv
`Key,Product Name,Brand,Category,Price product123,"Updated Product Name",Brand A,Sports,89.99 product456,,~empty~,~empty~,79.99`

Detalles de formato TSV y TAB

Los archivos TSV (valores separados por tabulaciones) y TAB utilizan caracteres de tabulación para separar los campos de datos de clasificación.

Estructura de TSV y TAB

Fila de encabezado: la primera fila debe contener encabezados de columna y la primera columna debe ser la columna de clave. Las columnas posteriores deben coincidir con los nombres del esquema del conjunto de clasificaciones.
Filas de datos: Cada fila subsiguiente contiene datos de clasificación.
Delimitadores: los campos están separados por caracteres de tabulación (\t).
Comillas: Generalmente no se necesita comillas, pero algunas implementaciones admiten campos entre comillas.

Reglas de formato TSV y TAB

Los campos están separados por caracteres de una sola tabulación.
Los campos vacíos (pestañas consecutivas) representan valores nulos.
No suele ser necesario un presupuesto especial.
Se conservan los espacios iniciales y finales.
Deben evitarse los caracteres de nueva línea dentro de los campos.

Operaciones de eliminación de TSV y TAB

Use ~deletekey~ en cualquier campo para eliminar toda la clave y todos sus datos de clasificación.
Utilice ~empty~ en campos específicos para eliminar solo esos valores de clasificación (deja otros campos intactos).
Al usar ~empty~, puede combinar eliminaciones con actualizaciones en el mismo archivo.

Ejemplos de TSV y TAB

Algunos ejemplos de registros delimitados por TSV o TAB en un archivo TSV o TAB.

Datos básicos de clasificación

code language-tsv
`Key Product Name Brand Category Price product123 Basketball Shoes Brand A Sports 89.99 product456 Running Shoes Brand B Sports 79.99 product789 Winter Jacket Brand C Clothing 149.99`

Eliminar una clave completa

code language-tsv
`Key Product Name Brand Category Price product999 ~deletekey~`

Eliminar campos específicos (mezclados con actualizaciones)

code language-tsv
`Key Product Name Brand Category Price product123 Updated Product Name Brand A Sports 89.99 product456 ~empty~ ~empty~ 79.99`

Control de errores

Problemas y soluciones comunes al cargar archivos:

Errores generales de formato de archivo

Formato de archivo no válido: compruebe que la extensión de archivo coincide con el formato de contenido (.json, .csv, .tsv o .tab).
Encabezado desconocido: los nombres de columna deben coincidir con el esquema del conjunto de clasificaciones (se aplica a todos los formatos).

Errores específicos de JSON

La clave es un campo obligatorio: Todos los registros JSON deben tener un campo "key" que no esté vacío (en minúsculas, que distinga mayúsculas de minúsculas).
Los datos son un campo obligatorio al usar action=update: Las acciones de actualización de JSON deben incluir un campo "data".
Los datos son un campo obligatorio al usar action=delete-field: Las acciones de eliminar campos JSON deben especificar qué campos eliminar en el campo "data".
Los datos no deben estar presentes al usar action=delete-key: las acciones de eliminar clave JSON no pueden incluir un campo "data".
Codificación no admitida: use solo valores de codificación admitidos en el campo "enc" (utf8, UTF8, latin1, LATIN1).
Sintaxis JSON no válida: Asegúrese de que el archivo JSON tiene el formato correcto según las convenciones JSONL. Compruebe también si hay formato JSON general, comillas, comas, corchetes, etc.

Errores específicos de CSV y TSV

Es necesario que la primera columna sea la clave: asegúrese de que el archivo CSV o TSV tenga una fila de encabezado adecuada con la columna clave primero.
Se requiere un mínimo de dos elementos de encabezado: los archivos CSV o TSV deben tener al menos una columna Key y una columna de clasificación.
La primera columna de encabezado debe llamarse 'Key': El primer encabezado de columna debe ser exactamente Key (mayúscula K, distingue entre mayúsculas y minúsculas).
No se permiten encabezados en blanco: todos los encabezados de columna CSV/TSV deben tener nombres.
El número de columnas no coincide con los encabezados: cada fila de datos CSV o TSV debe tener el mismo número de campos que la fila de encabezado.
"Documento mal formado: compruebe el entrecomillado CSV, la separación correcta de tabulaciones en los archivos TSV y más.

Errores de límite de tamaño

La clave supera el tamaño máximo: las claves individuales no pueden superar los 255 bytes.
El valor de columna supera el tamaño máximo: los valores de clasificación individual no pueden superar los 255 bytes.

Prácticas recomendadas

Tamaño de archivo: 50 MB es el tamaño máximo de archivo para las cargas de explorador y API.
Procesamiento por lotes: Para conjuntos de datos grandes, considere la posibilidad de dividirlos en archivos más pequeños.
Validación de datos: realice pruebas con un archivo de muestra pequeño antes de cargar conjuntos de datos grandes.
Copia de seguridad: conserve copias de los archivos de datos de origen.
Actualizaciones incrementales: Utilice el formato JSON para controlar de forma precisa las actualizaciones y eliminaciones de registros individuales.

recommendation-more-help

46b8682c-fda6-4669-9355-1a44923e549e