Más información sobre la Data Workbench Anuncio de fin de vida útil.
El procesamiento de archivos XML como orígenes de registro para definir descodificadores para extraer datos del archivo XML.
La definición de grupos de decodificadores XML para orígenes de registro XML requiere conocer la estructura y el contenido del archivo XML, los datos que se extraerán y los campos en los que se almacenan esos datos. Esta sección proporciona descripciones básicas de los parámetros que se pueden especificar para los descodificadores. La forma en que utilice cualquier decodificador depende del archivo XML que contiene los datos de origen.
Para obtener información sobre los requisitos de formato para los orígenes de registro XML, consulte Fuentes de registro. Para obtener ayuda con la definición de descodificadores XML, póngase en contacto con el Adobe.
El nivel superior de un decodificador XML es un grupo de decodificadores (XMLDecoderGroup), que es un conjunto de tablas de decodificador que se utilizan para extraer datos de un archivo XML de un formato determinado. Si tiene archivos XML de diferentes formatos, debe definir un grupo de decodificadores para cada formato. Cada grupo de descodificadores consta de una o más tablas de decodificador.
En la tabla siguiente se describe el parámetro Tables y todos los subparámetros que debe especificar para definir un grupo de descodificadores XML.
Parámetro | Descripción |
---|---|
Tablas | Cada tabla de un grupo de descodificadores representa un nivel de datos que se extraerán del archivo XML. Por ejemplo, si desea extraer datos sobre los visitantes, debe crear una tabla de descodificador que incluya la información que desee extraer para cada visitante. También puede crear tablas de decodificador dentro de tablas de decodificador (consulte Elementos secundarios). Agregar una tabla a un grupo de descodificadores
|
Campos | Los campos ampliados (por ejemplo, x-trackingid, x-email) en los que se almacenan los datos. Los datos que se van a almacenar en el campo están determinados por los subcampos Path y/o Operation . La ruta es el nivel del campo dentro del archivo XML estructurado. La ruta de un campo es relativa a la ruta de la tabla en la que está definida. Algunos ejemplos son tag.tag.tag o tag.tag.tag.@attribute . Tenga en cuenta que las rutas distinguen entre mayúsculas y minúsculas. Se aplica una operación a cada línea de la ruta especificada para producir una salida. Las operaciones disponibles son las siguientes:
Adición de un campo a una tabla de decodificador
|
Ruta | Nivel dentro del archivo XML estructurado para el que la tabla del decodificador contiene información. Para una tabla de decodificador XML secundaria, la ruta de acceso es relativa a la ruta de acceso de la tabla principal. Tenga en cuenta que las rutas distinguen entre mayúsculas y minúsculas. Por ejemplo, si el archivo XML contiene la estructura:
|
Tabla | El valor de este parámetro siempre debe ser "Entrada de registro".
Nota: No cambie este valor sin consultar el Adobe. |
Niños | Opcional. Una o más tablas de decodificador incrustadas. Cada elemento secundario incluye los parámetros Campos, Ruta y Tabla descritos anteriormente. Adición de un elemento secundario a una tabla de decodificador
|
Para utilizar un archivo XML como origen de registro para un conjunto de datos, los grupos de decodificadores XML y las tablas deben definirse para extraer la información que se va a procesar en el conjunto de datos. En este ejemplo, puede ver cómo definir grupos de decodificadores y tablas para un origen de registro XML de ejemplo para un conjunto de datos web.
El siguiente archivo XML contiene información sobre un visitante de un sitio web, incluido un ID de Experience Cloud, una dirección de correo electrónico, una dirección física e información sobre las vistas de página del visitante.
Dado que tenemos un solo archivo XML, solo necesitamos un grupo de decodificadores, al que llamamos "Formato XML de muestra". Este grupo de descodificadores se aplica a cualquier otro archivo XML con el mismo formato que este archivo. Para empezar a construir tablas de decodificador XML dentro de este grupo de decodificadores, primero debemos determinar qué información queremos extraer y qué campos se guardarán los datos.
En este ejemplo, extraemos información sobre el visitante y las vistas de página asociadas con ese visitante. Para ello, creamos una tabla de decodificador XML (principal) de nivel superior con información sobre el visitante y una tabla de decodificador XML incrustada (secundaria) con información sobre las vistas de página de ese visitante.
La información de la tabla principal (visitante) es la siguiente
La información de la tabla secundaria (vistas de página) es la siguiente:
La siguiente captura de pantalla muestra una parte de Log Processing Dataset Include archivo con el grupo de decodificadores XML resultante para el archivo XML de ejemplo basado en la estructura discutida de las tablas de decodificador XML principal y secundaria.
Una tabla que muestra el resultado de este decodificador para nuestro archivo XML de muestra tiene un aspecto similar al siguiente:
x-rowtype | cs—uri-stem | x-email | x-is-register | x-event-time | x-tracking-id |
---|---|---|---|---|---|
VISITANTE | foo@bar.com | 1 | 1 | ||
PAGEVIEW | /index.html | 2006-01-01 08:00:00 | 1 | ||
PAGEVIEW | / | 2006-01-01 08:00:30 | 1 |
Puede crear una tabla como la anterior en Data Workbench utilizando una interfaz de visor de campos. Para obtener información sobre la interfaz del visor de campos, consulte Herramientas de configuración de conjuntos de datos.
Ahora puede usar la variable #value en rutas XML para extraer el valor de un elemento XML.
Por ejemplo, anteriormente se especificaba una ruta de <Hit><Page name="Home Page" index="20">home.html</Page></Hit>
no puede leer el valor de la variable <Page>
etiqueta. Para leer el valor de un <Page>
y sus atributos, puede utilizar Hit.Page.@name y Hit.Page.@index respectivamente. También puede extraer el valor de la etiqueta utilizando Hit.Page.#value
expresión.
Por ejemplo, puede leer el valor de la etiqueta <varValue>
añadiendo el siguiente campo en el decodificador:
7 = XMLDecoderField:
Field = string: x-varvalue-name-added
Operation = string: LAST
Path = string:
<b>#value</b>
Path = string: varValue
Table = string: Log Entry
Del mismo modo, puede leer el valor de la etiqueta <Rep>
añadiendo el siguiente campo en el decodificador:
7 = XMLDecoderField:
Field = string: x-rep-name-added
Operation = string: LAST
Path = string: Rep.#
<b>value</b>
Path = string: Reps
Table = string: Log Entry
Por el contrario, para leer el valor de la etiqueta de elemento sin atributo , un <text>
bajo un <line>
y su valor se puede leer directamente dando " text" en una ruta o utilizando line.text, según cómo haya creado el decodificador.
2 = XMLDecoderField:
Field = string: x-chat-text
Operation = string: LAST
Path = string:
<b>text</b>
Path = string:
<b>line</b>
Table = string: Log Entry