Gruppi decodificatori XML

Elaborazione di file XML come origini di registro per definire decoder per l'estrazione di dati dal file XML.

NOTA

La definizione dei gruppi di decodificatori XML per le origini di log XML richiede la conoscenza della struttura e del contenuto del file XML, dei dati da estrarre e dei campi in cui tali dati vengono memorizzati. Questa sezione fornisce descrizioni di base dei parametri che è possibile specificare per i decoder. Il modo in cui si utilizza un decodificatore dipende dal file XML che contiene i dati di origine.

Per informazioni sui requisiti di formato per le origini di registro XML, vedere Origini di registro. Per assistenza sulla definizione dei decodificatori XML, contatta l’Adobe .

Il livello superiore di un decodificatore XML è un gruppo di decodificatori (XMLDecoderGroup), un set di tabelle di decodificazione che consente di estrarre dati da un file XML di un particolare formato. Se si dispone di file XML di formati diversi, è necessario definire un gruppo di decodificatori per ogni formato. Ogni gruppo di decodificatori è costituito da una o più tabelle di decodificazione.

La tabella seguente descrive il parametro Tables e tutti i sottoparametri che è necessario specificare per definire un gruppo di decodificatori XML.

Parametro Descrizione
Tabelle

Ogni tabella in un gruppo di decodificatori rappresenta un livello di dati da estrarre dal file XML. Ad esempio, se desideri estrarre dati sui visitatori, crea una tabella di decodifica che consiste delle informazioni che desideri estrarre per ogni visitatore. È inoltre possibile creare tabelle di decodificazione all’interno di tabelle di decoder (vedere Bambini).

Aggiunta di una tabella a un gruppo di decodificatori

  • Fai clic con il pulsante destro del mouse su Tabelle e fai clic su Aggiungi nuovo > XMLDecoderTable .

Campi

Campi estesi (ad esempio, x-trackingid, x-email) in cui vengono archiviati i dati. I dati da memorizzare nel campo sono determinati dai sottocampi Percorso e/o Operazione .

Il percorso è il livello del campo all'interno del file XML strutturato. Il percorso di un campo è relativo al percorso della tabella in cui è definito. Gli esempi includono tag.tag.tag o tag.tag.tag.@attribute . I percorsi sono sensibili all’uso di maiuscole e minuscole.

A ogni linea del percorso specificato viene applicata un'operazione per produrre un output. Sono disponibili le seguenti operazioni:

  • LAST: il campo prende il valore dell'ultima occorrenza del percorso nel file XML.
  • RANDOM: assegna un valore casuale al campo. Questa operazione è utile se devi generare un ID univoco, ad esempio per il campo x-trackingid .
  • EREDITARIO: il campo definito eredita il suo valore dal campo corrispondente della tabella padre.
  • "costante ": la costante deve essere racchiusa tra virgolette. È possibile utilizzare un'operazione costante per verificare l'esistenza di un particolare percorso; se il percorso esiste, al campo viene assegnato il valore della costante.

Aggiunta di un campo a una tabella decoder

  • Fai clic con il pulsante destro del mouse su Campi , quindi fai clic su Aggiungi nuovo > XMLDecoderField . Definire il campo, l’operazione e il percorso appropriati.

Path

Livello all’interno del file XML strutturato per il quale la tabella del decodificatore contiene informazioni. Per una tabella di decodificazione XML figlio, il percorso è relativo al percorso della tabella padre. I percorsi sono sensibili all’uso di maiuscole e minuscole.

Ad esempio, se il file XML contiene la struttura:

<visitor>

 

..

 

</visitor>

</logdata>    <p> allora il percorso sarebbe <span class="filepath">logdata.visitor</span> . </p> </td>
Tabella

Il valore di questo parametro deve sempre essere "Log Entry".

Nota: Non modificare questo valore senza consultare un Adobe.

Bambini

Facoltativo. Una o più tabelle decoder incorporate. Ogni elemento secondario include i parametri Fields, Path e Table descritti in precedenza.

Aggiunta di un elemento figlio a una tabella decoder

  • Fai clic con il pulsante destro del mouse su Figli e fai clic su Aggiungi nuovo > XMLDecoderTable . Definire il campo, l’operazione e il percorso appropriati.

Per utilizzare un file XML come origine di registro per un set di dati, è necessario definire gruppi e tabelle di decodifica XML per estrarre le informazioni da elaborare nel set di dati. In questo esempio, puoi vedere come definire gruppi di decodificatori e tabelle per un’origine di log XML di esempio per un set di dati web.

Il seguente file XML contiene informazioni su un visitatore del sito web, tra cui un ID Experience Cloud, un indirizzo e-mail, un indirizzo fisico e informazioni sulle visualizzazioni di pagina del visitatore.

Poiché abbiamo un singolo file XML, abbiamo bisogno di un solo gruppo di decodificatori, che chiamiamo "Sample XML Format". Questo gruppo di decodificatori si applica a qualsiasi altro file XML dello stesso formato di questo file. Per iniziare a costruire tabelle di decodificatore XML all'interno di questo gruppo di decoder, dobbiamo prima determinare quali informazioni si desidera estrarre e i campi in cui i dati verranno memorizzati.

In questo esempio, estraiamo informazioni sul visitatore e sulle visualizzazioni di pagina associate a tale visitatore. A questo scopo, creiamo una tabella di decodificatore XML di livello principale (padre) con informazioni sul visitatore e una tabella di decodifica XML incorporata (figlio) con informazioni sulle visualizzazioni di pagina del visitatore.

Le informazioni per la tabella padre (visitatore) sono le seguenti:

  • Identificatore del tipo di dati per ogni riga di dati nel file XML. Usiamo VISITOR come identificatore per identificare rapidamente le righe di dati relative al visitatore e non alle visualizzazioni di pagina. Possiamo memorizzare questo valore nel campo x-rowtype .
  • L’ID del visitatore, che memorizziamo nel campo x-trackingid .
  • L’indirizzo e-mail del visitatore (contact.email), che memorizziamo nel campo x-email.
  • Lo stato di registrazione del visitatore. Se il visitatore è un utente registrato, possiamo memorizzare il valore "1" nel campo x-is-registrato.
  • Il valore Path è logdata.visitor e il valore Table è Log Entry. Per informazioni su questi parametri, vedere la tabella XMLDecoderGroup riportata sopra.

Le informazioni per la tabella figlio (visualizzazioni pagina) sono le seguenti:

  • Identificatore del tipo di dati per ogni riga di dati nel file XML. Usiamo "PAGEVIEW" come identificatore per identificare rapidamente le righe di dati relativi alle visualizzazioni di pagina del visitatore e non solo al visitatore. Questo valore viene memorizzato nel campo x-rowtype .
  • L'ID del visitatore. Questo valore viene ereditato dalla tabella padre e memorizzato nel campo x-trackingid .
  • La marca temporale di ciascuna visualizzazione di pagina, memorizzata nel campo x-event-time.
  • URI di ogni visualizzazione di pagina, memorizzato nel campo cs-uri-stem.
  • Il valore Path è pageview e il valore Table è "Log Entry". Per informazioni su questi parametri, vedere la tabella XMLDecoderGroup riportata sopra.

La seguente acquisizione dello schermo mostra una parte del file Log Processing Dataset Include con il gruppo di decodificatori XML risultante per il file XML di esempio in base alla struttura discussa delle tabelle di decoder XML padre e figlio.

Una tabella che mostra l'output del decodificatore per il file XML di esempio ha un aspetto simile al seguente:

x-rowtype cs—uri-stem x-mail x-is-registrato x-event-time x-tracking-id
VISITATORE foo@bar.com 1 1
PAGEVIEW /index.html 2006-01-01 08:00:00 1
PAGEVIEW / 2006-01-01 08:00:30 1

Puoi creare una tabella come quella riportata sopra in Data Workbench utilizzando un’interfaccia per visualizzatori di campi. Per informazioni sull'interfaccia del visualizzatore di campi, vedere Strumenti di configurazione del set di dati.

Utilizzo di #value sull'elemento XML per leggere il valore dell'attributo

È ora possibile utilizzare il tag #value in percorsi XML per spingere il valore di un elemento XML.

Ad esempio, specificando in precedenza un percorso di <Hit><Page name="Home Page" index="20">home.html</Page></Hit> non è possibile leggere il valore del tag <Page> . Per leggere il valore di un tag <Page> e i relativi attributi, puoi utilizzare rispettivamente Hit.Page.@name e Hit.Page.@index. Puoi anche richiamare il valore del tag utilizzando l’espressione Hit.Page.#value .

Ad esempio, puoi leggere il valore del tag <varValue> aggiungendo il seguente campo nel decoder:

7 = XMLDecoderField: 
Field = string: x-varvalue-name-added 
Operation = string: LAST 
Path = string:  
<b>#value</b> 
Path = string: varValue 
Table = string: Log Entry

Allo stesso modo, puoi leggere il valore del tag <Rep> aggiungendo il seguente campo nel decoder:

7 = XMLDecoderField: 
Field = string: x-rep-name-added 
Operation = string: LAST 
Path = string: Rep.# 
<b>value</b> 
Path = string: Reps 
Table = string: Log Entry

Al contrario, per leggere il valore del tag elemento senza alcun attributo, un tag <text> sotto un tag <line> e il relativo valore possono essere letti direttamente dando " text" in un percorso o utilizzando line.text, a seconda di come è stato creato il decoder.

2 = XMLDecoderField: 
Field = string: x-chat-text 
Operation = string: LAST 
Path = string:  
<b>text</b> 
Path = string:  
<b>line</b> 
Table = string: Log Entry

In questa pagina

Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now