Ulteriori informazioni su Data Workbench Annuncio di fine vita.
Elaborazione di file XML come origini di registro per definire decoder per l'estrazione di dati dal file XML.
La definizione dei gruppi di decodificatori XML per le origini di log XML richiede la conoscenza della struttura e del contenuto del file XML, dei dati da estrarre e dei campi in cui tali dati vengono memorizzati. Questa sezione fornisce descrizioni di base dei parametri che è possibile specificare per i decoder. Il modo in cui si utilizza un decodificatore dipende dal file XML che contiene i dati di origine.
Per informazioni sui requisiti di formato per le origini di registro XML, consulta Origini del registro. Per assistenza sulla definizione dei decodificatori XML, contatta l’Adobe .
Il livello superiore di un decodificatore XML è un gruppo di decodificatori (XMLDecoderGroup), un set di tabelle di decodificazione che consente di estrarre dati da un file XML di un particolare formato. Se si dispone di file XML di formati diversi, è necessario definire un gruppo di decodificatori per ogni formato. Ogni gruppo di decodificatori è costituito da una o più tabelle di decodificazione.
La tabella seguente descrive il parametro Tables e tutti i sottoparametri che è necessario specificare per definire un gruppo di decodificatori XML.
Parametro | Descrizione |
---|---|
Tabelle | Ogni tabella in un gruppo di decodificatori rappresenta un livello di dati da estrarre dal file XML. Ad esempio, se desideri estrarre dati sui visitatori, crea una tabella di decodifica che consiste delle informazioni che desideri estrarre per ogni visitatore. È inoltre possibile creare tabelle di decodificazione all’interno di tabelle di decoder (vedere Bambini). Aggiunta di una tabella a un gruppo di decodificatori
|
Campi | Campi estesi (ad esempio, x-trackingid, x-email) in cui vengono archiviati i dati. I dati da memorizzare nel campo sono determinati dai sottocampi Percorso e/o Operazione . Il percorso è il livello del campo all'interno del file XML strutturato. Il percorso di un campo è relativo al percorso della tabella in cui è definito. Esempi tag.tag.tag o tag.tag.tag.@attribute . I percorsi sono sensibili all’uso di maiuscole e minuscole. A ogni linea del percorso specificato viene applicata un'operazione per produrre un output. Sono disponibili le seguenti operazioni:
Aggiunta di un campo a una tabella decoder
|
Path | Livello all’interno del file XML strutturato per il quale la tabella del decodificatore contiene informazioni. Per una tabella di decodificazione XML figlio, il percorso è relativo al percorso della tabella padre. I percorsi sono sensibili all’uso di maiuscole e minuscole. Ad esempio, se il file XML contiene la struttura:
|
Tabella | Il valore di questo parametro deve sempre essere "Log Entry".
Nota: Non modificare questo valore senza consultare un Adobe. |
Bambini | Facoltativo. Una o più tabelle decoder incorporate. Ogni elemento secondario include i parametri Fields, Path e Table descritti in precedenza. Aggiunta di un elemento figlio a una tabella decoder
|
Per utilizzare un file XML come origine di registro per un set di dati, è necessario definire gruppi e tabelle di decodifica XML per estrarre le informazioni da elaborare nel set di dati. In questo esempio, puoi vedere come definire gruppi di decodificatori e tabelle per un’origine di log XML di esempio per un set di dati web.
Il seguente file XML contiene informazioni su un visitatore del sito web, tra cui un ID Experience Cloud, un indirizzo e-mail, un indirizzo fisico e informazioni sulle visualizzazioni di pagina del visitatore.
Poiché abbiamo un singolo file XML, abbiamo bisogno di un solo gruppo di decodificatori, che chiamiamo "Sample XML Format". Questo gruppo di decodificatori si applica a qualsiasi altro file XML dello stesso formato di questo file. Per iniziare a costruire tabelle di decodificatore XML all'interno di questo gruppo di decoder, dobbiamo prima determinare quali informazioni si desidera estrarre e i campi in cui i dati verranno memorizzati.
In questo esempio, estraiamo informazioni sul visitatore e sulle visualizzazioni di pagina associate a tale visitatore. A questo scopo, creiamo una tabella di decodificatore XML di livello principale (padre) con informazioni sul visitatore e una tabella di decodifica XML incorporata (figlio) con informazioni sulle visualizzazioni di pagina del visitatore.
Le informazioni per la tabella padre (visitatore) sono le seguenti:
Le informazioni per la tabella figlio (visualizzazioni pagina) sono le seguenti:
La seguente schermata di acquisizione mostra una parte di Log Processing Dataset Include file con il gruppo di decodificatori XML risultante per il file XML di esempio in base alla struttura discussa delle tabelle di decoder XML padre e figlio.
Una tabella che mostra l'output del decodificatore per il file XML di esempio ha un aspetto simile al seguente:
x-rowtype | cs—uri-stem | x-mail | x-is-registrato | x-event-time | x-tracking-id |
---|---|---|---|---|---|
VISITATORE | foo@bar.com | 1 | 1 | ||
PAGEVIEW | /index.html | 01/01/2006:00:00 | 1 | ||
PAGEVIEW | / | 01/01/2006:00:30 | 1 |
Puoi creare una tabella come quella riportata sopra in Data Workbench utilizzando un’interfaccia per visualizzatori di campi. Per informazioni sull’interfaccia del visualizzatore di campi, vedi Strumenti di configurazione del set di dati.
Ora puoi utilizzare la #value in percorsi XML per richiamare il valore di un elemento XML.
Ad esempio, specificando in precedenza un percorso di <Hit><Page name="Home Page" index="20">home.html</Page></Hit>
non è possibile leggere il valore del <Page>
tag . Per leggere il valore di un <Page>
tag e relativi attributi, puoi utilizzare Hit.Page.@name e Hit.Page.@index rispettivamente. Puoi anche richiamare il valore del tag utilizzando Hit.Page.#value
espressione.
Ad esempio, puoi leggere il valore del tag <varValue>
aggiungendo il seguente campo nel decoder:
7 = XMLDecoderField:
Field = string: x-varvalue-name-added
Operation = string: LAST
Path = string:
<b>#value</b>
Path = string: varValue
Table = string: Log Entry
Allo stesso modo, puoi leggere il valore del tag <Rep>
aggiungendo il seguente campo nel decoder:
7 = XMLDecoderField:
Field = string: x-rep-name-added
Operation = string: LAST
Path = string: Rep.#
<b>value</b>
Path = string: Reps
Table = string: Log Entry
Al contrario, per leggere il valore del tag elemento senza alcun attributo, un <text>
tag sotto a <line>
tag e il relativo valore possono essere letti direttamente dando " text" in un percorso o utilizzando line.text, a seconda di come è stato creato il decodificatore.
2 = XMLDecoderField:
Field = string: x-chat-text
Operation = string: LAST
Path = string:
<b>text</b>
Path = string:
<b>line</b>
Table = string: Log Entry