Scripting per lo scorrimento SAINT

In questa sezione viene illustrato lo script Saint Scrubber.

Panoramica della classificazione SAINT

La classificazione è nota anche dall'acronimo SAINT per lo strumento SiteCatalyst per l'importazione e la denominazione di attributi.

Quando si "classifica" una variabile di SiteCatalyst, viene stabilita una relazione tra una variabile e i metadati correlati a tale variabile. Le classificazioni vengono utilizzate più di frequente nell'area Campagne e quindi lo utilizzerò per spiegarle. La maggior parte dei client invia il traffico delle campagne al proprio sito utilizzando un codice di tracciamento. Questo codice di tracciamento è un identificatore che può rappresentare una parola chiave specifica acquistata su Google, ad esempio "goog123". Questo identificatore viene passato nella variabile s.campaign in modo da poter vedere gli eventi di successo del sito che si verificano dopo che i visitatori arrivano sul sito dal codice della campagna.

Ma cosa succede se, invece di visualizzare le campagne solo in base al codice di tracciamento, si desidera visualizzare i risultati delle campagne in base al motore di ricerca o alla parola chiave o al canale della campagna? È necessario creare una nuova variabile di conversione per Motore di ricerca, un'altra per Parola chiave e un'altra per Canale campagna? In tal caso, potete utilizzare molte delle cinquanta variabili solo per Campagne! Per fortuna, puoi utilizzare le classificazioni per rendere la tua vita più facile! Poiché ogni codice di tracciamento può avere un motore di ricerca, una parola chiave o un canale di campagna, potete semplicemente creare tre classificazioni della variabile Campagne per rappresentarle. In sostanza state dicendo a SiteCatalyst che esiste una relazione diretta tra la variabile Campagne e questi tre altri valori "meta-dati". Con questa operazione, SiteCatalyst consente di suddividere in sezioni ed eliminare eventi di successo del sito con tutte e quattro le variabili senza tag aggiuntivi.

Script di scorrimento SAINT in DWB

Questo script viene utilizzato quando si inseriscono dati di classificazione SAINT in DWB. Lo script SaintScrubber.dat si trova normalmente nella cartella \Scripts\Scripository dell'FSU.

Lo scopo principale di questo script è quello di rimuovere l'intestazione nei file di classificazione <discoiqbr> SAINT. Inoltre, conteggia il numero se la colonna indicata nella riga di intestazione della colonna e controlla tutte le righe di dati. Se ci sono righe con un numero di colonne inferiore o superiore, le righe vengono rimosse dal file.

Lo script SaintScrubber.dat chiama internamente lo script *saint_scrubber.pl *. Di seguito sono riportati i dettagli per questo file di script:

Percorso: E:\Scripts\Scripository\Library\Perl

Argomenti script:

  1. Cartella di input (obbligatoria): source_directory
  2. Cartella di output (obbligatoria): directory_destinazione
  3. Delimitatore (obbligatorio): delimiter
  4. Rifiuta cartella (facoltativo)(il parametro può essere lasciato vuoto o omesso dalla riga di comando)
  5. Cartella di registro (facoltativo) (il parametro può essere lasciato vuoto o omesso dalla riga di comando)

Passaggi eseguiti nello script Perl:

  1. Sostituire feed di modulo con escape, linee nuove, ritorni a capo, tabulazioni con spazi.

  2. Rimuovete i doppi byte che vengono interpretati come un carattere di controllo nel BMP UTF-8 (Piano multilingue di base) ad eccezione di:

    • 9 schede orizzontali
    • Alimentazione a 10 righe
    • 12 feed modulo
    • 13 ritorno a capo
    • Utilizzate la parola chiave pipe, come delimitatore per| ad esempio: tubo di delimitazione
    • Rimuovere altri caratteri problematici
    • Dopo il passaggio del mouse sopra, rilasciare qualsiasi riga con un numero di colonne diverso dalla prima riga di dati (non vuoto o commento)
    • Supportare i file di rifiuto facoltativi per mantenere le righe rifiutate invece di semplicemente ignorarle
    • Supportare la cartella di input ricorsiva; genera cartelle di output della stessa struttura
    • Spostare i file di input elaborati nelle sottocartelle elaborate in modo che lo script non ripeta lo sforzo quando viene eseguito nuovamente sulla stessa cartella di input esistente
    • riconoscere la data nei nomi dei file workbench; ordinate prima l'elaborazione in base alla data e poi all'alfa, indipendentemente dal nome della cartella. Questo garantisce che la sequenza sia corretta indipendentemente dal tipo di file workbench (ecom, non ecom) o dall'ID suite di rapporti (se state elaborando più suite di rapporti in un unico set di dati Insight).
    • Avvisi e-mail di supporto <discoiqbr>

In questa pagina