Gruppi decodificatori XML

IMPORTANTE

Ulteriori informazioni su Data Workbench Annuncio di fine vita.

Elaborazione di file XML come origini di registro per definire decoder per l'estrazione di dati dal file XML.

NOTA

La definizione dei gruppi di decodificatori XML per le origini di log XML richiede la conoscenza della struttura e del contenuto del file XML, dei dati da estrarre e dei campi in cui tali dati vengono memorizzati. Questa sezione fornisce descrizioni di base dei parametri che è possibile specificare per i decoder. Il modo in cui si utilizza un decodificatore dipende dal file XML che contiene i dati di origine.

Per informazioni sui requisiti di formato per le origini di registro XML, consulta Origini del registro. Per assistenza sulla definizione dei decodificatori XML, contatta l’Adobe .

Il livello superiore di un decodificatore XML è un gruppo di decodificatori (XMLDecoderGroup), un set di tabelle di decodificazione che consente di estrarre dati da un file XML di un particolare formato. Se si dispone di file XML di formati diversi, è necessario definire un gruppo di decodificatori per ogni formato. Ogni gruppo di decodificatori è costituito da una o più tabelle di decodificazione.

La tabella seguente descrive il parametro Tables e tutti i sottoparametri che è necessario specificare per definire un gruppo di decodificatori XML.

Parametro Descrizione
Tabelle

Ogni tabella in un gruppo di decodificatori rappresenta un livello di dati da estrarre dal file XML. Ad esempio, se desideri estrarre dati sui visitatori, crea una tabella di decodifica che consiste delle informazioni che desideri estrarre per ogni visitatore. È inoltre possibile creare tabelle di decodificazione all’interno di tabelle di decoder (vedere Bambini).

Aggiunta di una tabella a un gruppo di decodificatori

  • Fai clic con il pulsante destro del mouse Tabelle e fai clic su Aggiungi nuovo > XMLDecoderTable .

Campi

Campi estesi (ad esempio, x-trackingid, x-email) in cui vengono archiviati i dati. I dati da memorizzare nel campo sono determinati dai sottocampi Percorso e/o Operazione .

Il percorso è il livello del campo all'interno del file XML strutturato. Il percorso di un campo è relativo al percorso della tabella in cui è definito. Esempi tag.tag.tag o tag.tag.tag.@attribute . I percorsi sono sensibili all’uso di maiuscole e minuscole.

A ogni linea del percorso specificato viene applicata un'operazione per produrre un output. Sono disponibili le seguenti operazioni:

  • ULTIMO: Il campo prende il valore dell'ultima occorrenza del percorso nel file XML.
  • CASUALE: Assegna un valore casuale al campo. Questa operazione è utile se devi generare un ID univoco, ad esempio per il campo x-trackingid .
  • EREDITARIO: Il campo definito eredita il proprio valore dal campo corrispondente della tabella padre.
  • "costante ": La costante deve essere racchiusa tra virgolette. È possibile utilizzare un'operazione costante per verificare l'esistenza di un particolare percorso; se il percorso esiste, al campo viene assegnato il valore della costante.

Aggiunta di un campo a una tabella decoder

  • Fai clic con il pulsante destro del mouse Campi , quindi fai clic su Aggiungi nuovo > XMLDecoderField . Definire il campo, l’operazione e il percorso appropriati.

Path

Livello all’interno del file XML strutturato per il quale la tabella del decodificatore contiene informazioni. Per una tabella di decodificazione XML figlio, il percorso è relativo al percorso della tabella padre. I percorsi sono sensibili all’uso di maiuscole e minuscole.

Ad esempio, se il file XML contiene la struttura:

<visitor>

 

...

 

</visitor>

</logdata>  </code> <p> allora il percorso sarebbe <span class="filepath">logdata.visitor</span> . </p> </td>
Tabella

Il valore di questo parametro deve sempre essere "Log Entry".

Nota: Non modificare questo valore senza consultare un Adobe.

Bambini

Facoltativo. Una o più tabelle decoder incorporate. Ogni elemento secondario include i parametri Fields, Path e Table descritti in precedenza.

Aggiunta di un elemento figlio a una tabella decoder

  • Fai clic con il pulsante destro del mouse Bambini e fai clic su Aggiungi nuovo > XMLDecoderTable . Definire il campo, l’operazione e il percorso appropriati.

Per utilizzare un file XML come origine di registro per un set di dati, è necessario definire gruppi e tabelle di decodifica XML per estrarre le informazioni da elaborare nel set di dati. In questo esempio, puoi vedere come definire gruppi di decodificatori e tabelle per un’origine di log XML di esempio per un set di dati web.

Il seguente file XML contiene informazioni su un visitatore del sito web, tra cui un ID Experience Cloud, un indirizzo e-mail, un indirizzo fisico e informazioni sulle visualizzazioni di pagina del visitatore.

Poiché abbiamo un singolo file XML, abbiamo bisogno di un solo gruppo di decodificatori, che chiamiamo "Sample XML Format". Questo gruppo di decodificatori si applica a qualsiasi altro file XML dello stesso formato di questo file. Per iniziare a costruire tabelle di decodificatore XML all'interno di questo gruppo di decoder, dobbiamo prima determinare quali informazioni si desidera estrarre e i campi in cui i dati verranno memorizzati.

In questo esempio, estraiamo informazioni sul visitatore e sulle visualizzazioni di pagina associate a tale visitatore. A questo scopo, creiamo una tabella di decodificatore XML di livello principale (padre) con informazioni sul visitatore e una tabella di decodifica XML incorporata (figlio) con informazioni sulle visualizzazioni di pagina del visitatore.

Le informazioni per la tabella padre (visitatore) sono le seguenti:

  • Identificatore del tipo di dati per ogni riga di dati nel file XML. Usiamo VISITOR come identificatore per identificare rapidamente le righe di dati relative al visitatore e non alle visualizzazioni di pagina. Possiamo memorizzare questo valore nel campo x-rowtype .
  • L’ID del visitatore, che memorizziamo nel campo x-trackingid .
  • L’indirizzo e-mail del visitatore (contact.email), che memorizziamo nel campo x-email.
  • Lo stato di registrazione del visitatore. Se il visitatore è un utente registrato, possiamo memorizzare il valore "1" nel campo x-is-registrato.
  • Il valore Path è logdata.visitore il valore della tabella è Log Entry. Per informazioni su questi parametri, vedere la tabella XMLDecoderGroup riportata sopra.

Le informazioni per la tabella figlio (visualizzazioni pagina) sono le seguenti:

  • Identificatore del tipo di dati per ogni riga di dati nel file XML. Usiamo "PAGEVIEW" come identificatore per identificare rapidamente le righe di dati relativi alle visualizzazioni di pagina del visitatore e non solo al visitatore. Questo valore viene memorizzato nel campo x-rowtype .
  • L'ID del visitatore. Questo valore viene ereditato dalla tabella padre e memorizzato nel campo x-trackingid .
  • La marca temporale di ciascuna visualizzazione di pagina, memorizzata nel campo x-event-time.
  • URI di ogni visualizzazione di pagina, memorizzato nel campo cs-uri-stem.
  • Il valore Path è pageview e il valore Table è "Log Entry". Per informazioni su questi parametri, vedere la tabella XMLDecoderGroup riportata sopra.

La seguente schermata di acquisizione mostra una parte di Log Processing Dataset Include file con il gruppo di decodificatori XML risultante per il file XML di esempio in base alla struttura discussa delle tabelle di decoder XML padre e figlio.

Una tabella che mostra l'output del decodificatore per il file XML di esempio ha un aspetto simile al seguente:

x-rowtype cs—uri-stem x-mail x-is-registrato x-event-time x-tracking-id
VISITATORE foo@bar.com 1 1
PAGEVIEW /index.html 01/01/2006:00:00 1
PAGEVIEW / 01/01/2006:00:30 1

Puoi creare una tabella come quella riportata sopra in Data Workbench utilizzando un’interfaccia per visualizzatori di campi. Per informazioni sull’interfaccia del visualizzatore di campi, vedi Strumenti di configurazione del set di dati.

Utilizzo di #value sull'elemento XML per leggere il valore dell'attributo

Ora puoi utilizzare la #value in percorsi XML per richiamare il valore di un elemento XML.

Ad esempio, specificando in precedenza un percorso di <Hit><Page name="Home Page" index="20">home.html</Page></Hit> non è possibile leggere il valore del <Page> tag . Per leggere il valore di un <Page> tag e relativi attributi, puoi utilizzare Hit.Page.@name e Hit.Page.@index rispettivamente. Puoi anche richiamare il valore del tag utilizzando Hit.Page.#value espressione.

Ad esempio, puoi leggere il valore del tag <varValue> aggiungendo il seguente campo nel decoder:

7 = XMLDecoderField:
Field = string: x-varvalue-name-added
Operation = string: LAST
Path = string:
<b>#value</b>
Path = string: varValue
Table = string: Log Entry

Allo stesso modo, puoi leggere il valore del tag <Rep> aggiungendo il seguente campo nel decoder:

7 = XMLDecoderField:
Field = string: x-rep-name-added
Operation = string: LAST
Path = string: Rep.#
<b>value</b>
Path = string: Reps
Table = string: Log Entry

Al contrario, per leggere il valore del tag elemento senza alcun attributo, un <text> tag sotto a <line> tag e il relativo valore possono essere letti direttamente dando " text" in un percorso o utilizzando line.text, a seconda di come è stato creato il decodificatore.

2 = XMLDecoderField:
Field = string: x-chat-text
Operation = string: LAST
Path = string:
<b>text</b>
Path = string:
<b>line</b>
Table = string: Log Entry

In questa pagina