Linee guida per i campi derivati

I campi derivati di Customer Journey Analytics consentono di trasformare, classificare e arricchire dati in fase di query senza modificare i set di dati di origine. Questa flessibilità può introdurre complessità, problemi di prestazioni e sovraccarico di manutenzione se applicata senza disciplina.

Questo articolo fornisce linee guida (best practice, guardrail e insidie comuni) per l’utilizzo dei campi derivati. Il pubblico previsto sono architetti di dati, amministratori di prodotto e analisti che devono:

Questo articolo organizza le sezioni intorno ai seguenti temi:

Ogni sezione include:

  • Pattern da rilevare: segnali osservabili nelle definizioni dei campi derivati.
  • Diagnosi dei rischi: perché il modello è problematico. Possibili cause: effetti negativi sulle prestazioni, qualità dei dati o manutenzione.
  • Consigli: passaggi concreti per eseguire il refactoring o migliorare l’implementazione.

Queste linee guida ti aiutano a creare implementazioni efficienti, scalabili e corrette dal punto di vista semantico in Customer Journey Analytics. Applica queste linee guida quando esegui il controllo di visualizzazioni dati esistenti, progetta nuovi campi derivati o crea strumenti di governance.

Campi derivati ad alta cardinalità

Questa sezione descrive i segmenti predefiniti della visualizzazione dati che fanno riferimento a campi derivati ad alta cardinalità.

Pattern

  • I segmenti predefiniti della visualizzazione dati che fanno riferimento a un campo derivato basato su una dimensione ad alta cardinalità (circa un milione o più valori distinti). Ad esempio: URL della pagina intera.
  • Operazioni semplici come Minuscolo, Taglio o Caso Quando i controlli nell’URL della pagina sono spesso più costosi della stessa logica nei campi con bassa cardinalità.

Diagnosi dei rischi: prestazioni

  • I segmenti predefiniti che filtrano i campi derivati che toccano l’URL della pagina o altre dimensioni ad alta cardinalità aggiungono latenza a ogni query rispetto alla visualizzazione dati.

Funzione Consigli

  • Evita di fare riferimento agli URL di pagine intere o a componenti con cardinalità elevata simile direttamente nei segmenti predefiniti della visualizzazione dati. Effettua il push della logica dell’URL pesante (complesso Case When, Regex Replace, più funzioni di stringa) a monte di Preparazione dati o set di dati di ricerca in modo che le classificazioni risultanti arrivino a dimensioni più semplici e a bassa cardinalità.
  • Preferisci le chiavi a bassa cardinalità, come il nome di pagina normalizzato, la sezione del sito o i gruppi di URL preclassificati.
  • Controlla periodicamente i segmenti predefiniti e i campi derivati della visualizzazione dati esistenti per i riferimenti a dimensioni ad alta cardinalità (URL della pagina, ID campagna, stringhe di query non elaborate) ed effettua il refactoring alle chiavi normalizzate o raggruppate.

Caso eccessivamente complesso nelle catene di regole

Questa sezione descrive catene eccessivamente complesse di regole Case When.

Customer Journey Analytics applica limiti espliciti di funzione e operatore per campo derivato (ad esempio, numero massimo di operatori, numero massimo di funzioni per tipo). Le funzioni e le catene eccessivamente complesse all’interno delle funzioni sono più difficili da mantenere e più soggette a errori.

Pattern

  • Caso molto grande Quando funziona con catene If e Else If complesse:

    • Molte condizioni (ad esempio: più di 20 operatori) o nidificazione profonda (più di 3 o 4 livelli di logica Case When If e Else If nidificata).
    • Condizioni ripetute sullo stesso campo con valori diversi.
  • Corrispondenza stringa costante ripetuta.

    accordion
    Esempio
    Best practice - esempio di corrispondenza costante della stringa ripetuta

Diagnosi dei rischi: prestazioni, qualità dei dati, manutenzione elevata

  • Manutenzione e rischio di errore: la logica codificata come blocco di regola monolitico è difficile da eseguire sul debug e aggiornare.
  • Prestazioni potenziali e rischio limite: potresti raggiungere o avvicinarti ai limiti di operatore o funzione, soprattutto con modelli simili a quelli di classificazione.

Funzione Consigli

  • Dividi in più campi derivati. Ad esempio, separa la normalizzazione della campagna (mappatura di identificatori di campagna incoerenti a un valore canonico) dal bucket del canale invece di combinare tutto in un’unica regola gigante.
  • Utilizza i set di dati di ricerca. Molti Se il valore valore criterio criterio, impostare valore su valore le condizioni vengono implementate meglio come set di dati di ricerca combinato con la funzione Ricerca invece di utilizzare lunghe catene Caso Quando.
  • Utilizza i filtri dei componenti della visualizzazione dati. Se una parte della logica esclude semplicemente i valori non validi, utilizza include exclude a livello del componente della visualizzazione dati anziché incorporare tale logica in un campo derivato.

Utilizzo errato

Questa sezione descrive l’utilizzo errato dei campi derivati. In particolare, dove le alternative sono una soluzione migliore.

NOTE
Lo spostamento della logica da un campo derivato a un’impostazione del componente Visualizzazione dati non migliora di per sé le prestazioni delle query. Entrambi gli approcci si basano sulla stessa logica derivata sottostante. Le raccomandazioni contenute in questa sezione riguardano la chiarezza, la governance e il riutilizzo anziché la velocità.

Pattern

  • Un campo derivato replica il comportamento già disponibile nelle impostazioni dei componenti:

    • Normalizzazione dei casi, ritaglio o filtraggio semplice (ad esempio: escludendo unknown, undefined o null) senza complessità aggiuntiva.

    • Inserimento di intervalli di numeri negli intervalli di base.

      accordion
      Esempio
      Utilizzo errato del bucket di base

      Utilizza invece bucket di valori in una dimensione nella visualizzazione dati.

    • Logica di persistenza o attribuzione codificata con Next o Previous o logica di sequenza manuale in cui sarebbero sufficienti le impostazioni di visualizzazione dati attribution e expiration.

    • Una metrica derivata che conta semplicemente una metrica esistente in una condizione.

      accordion
      Esempio
      Utilizzo errato della logica condizionale

      Questo approccio replica ciò che potrebbe ottenere una metrica filtrata o Includi valori di esclusione.

Diagnosi dei rischi: qualità dei dati, manutenzione elevata

  • Complessità ridondante: i campi derivati vengono utilizzati laddove esistono funzioni di visualizzazione dati integrate più semplici.
  • Rischio di governance: altri utenti potrebbero non capire perché esiste un campo derivato invece di un’impostazione nativa. Il pattern aumenta il disordine nell’amministrazione dei campi derivati.
  • Riutilizzabilità ridotta: la codifica dei flag condizionali come campi derivati rende più difficile riutilizzare le metriche di base con filtri diversi nei progetti.

Funzione Consigli

  • Taglia / Minuscolo: utilizzare le impostazioni del componente Substring e Behavior a meno che non siano necessarie trasformazioni combinate in più passaggi.

  • Esclusione di valore: utilizzare Includi valori di esclusione per le metriche o i valori di dimensione a livello del componente della visualizzazione dati, non in un campo derivato.

  • Attribuzione e persistenza: utilizzare le impostazioni della visualizzazione dati Persistenza (Modello di allocazione e Scadenza) per le dimensioni invece di simularle in un campo derivato con Successivo o Precedente o altra logica sequenziale.

  • Bucket numerico: mantieni numerico il campo derivato e lascia che la visualizzazione dati crei una dimensione a bucket in primo piano, invece delle etichette di intervallo a codifica fissa in una catena Case When.

  • Logica condizionale: converti la logica del flag semplice 0 o 1 in:

    • la metrica originale con logica di filtro dei valori di inclusione o esclusione applicata in Analysis Workspace.
    • una metrica filtrata utilizzando la configurazione delle impostazioni del componente della visualizzazione dati.

Errori di classificazione di metriche e dimensioni

Questa sezione descrive le classificazioni errate di metriche e dimensioni.

Pattern

  • Un campo derivato produce chiaramente:

    • Output numerici (conteggio, rapporto o aritmetica) ma il componente è configurato come dimensione.
    • Output categorici (etichette o stringhe) ma il componente è configurato come metrica.
  • Un campo derivato codifica i flag 0/1 come stringhe.

Customer Journey Analytics consente di forzare i campi numerici per le dimensioni e i campi stringa per le metriche a livello di visualizzazione dati, ma un disallineamento può creare rapporti confusi.

Diagnosi dei rischi: qualità dei dati

  • Mancata corrispondenza semantica: il tipo di componente non corrisponde alla natura del risultato derivato, rendendo più difficile l’analisi o l’aggregazione corretta del tipo di componente.

Funzione Consigli

  • Se l’output è numerico:

    • Impostare il tipo di componente su Metrica nella visualizzazione dati.
    • Se il componente rappresenta una metrica subset (ad esempio, Visualizzazioni pagina di checkout), utilizza una metrica filtrata all’interno della visualizzazione dati, anziché una stringa derivata e una metrica calcolata all’inizio.
  • Se l’output è un’etichetta:

    • Imposta il tipo di componente su Dimension e configura di conseguenza le impostazioni di Persistenza (Modello di allocazione e Scadenza).

Insidie del canale di marketing e della logica della campagna

Questa sezione descrive le insidie del canale di marketing e della logica della campagna.

NOTE
Considera la semplificazione a monte: utilizza Preparazione dati, set di dati di ricerca o funzioni campo derivato come Classifica per consolidare regole di canale di marketing simili e ridurre il numero di operatori nella logica Caso di utilizzo. Inoltre, limita il numero di campi ad alta cardinalità a cui si fa riferimento nella logica di classificazione del canale (ad esempio, molte chiavi di parametri di query distinte), in quanto questi campi aumentano sia la cardinalità che il costo della query.

Pattern

  • I canali di marketing Customer Journey Analytics vengono spesso implementati utilizzando campi derivati.

    • Campi derivati che implementano il canale di marketing o il bucket di campagne in base a parametri URL, referrer, pagina di destinazione e altro ancora.
    • Ordine sospetto: prima di applicare regole più specifiche, viene visualizzata una regola generale catch-all.
    • Gestione incompleta di tutte le opzioni possibili: nessun ramo esplicito per Il dominio di riferimento non è impostato o Il parametro di query non è impostato.

Diagnosi dei rischi: qualità dei dati

  • Errore nell’ordinamento logico: regole successive nella catena che potrebbero ignorare canali specifici e causare una classificazione errata del traffico.
  • Errata etichettatura del traffico diretto: il traffico senza corrispondenza rientra in un canale non desiderato o è etichettato come Other.

Funzione Consigli

  • Applica l’ordinamento di priorità top-down. Inserisci prima i segnali più forti (ad esempio: domini interni per escludere i parametri di campagne a pagamento).
  • Includi un finale esplicito. Altrimenti imposta il valore su maiuscole/minuscole. Impostare il fallback su Nessun valore per evitare la sovrascrittura dei canali precedenti. Non impostare il valore su Valore stringa personalizzato e quindi il Valore stringa personalizzato su Direct, None o Unclassified in questo passaggio catch-all.
  • Utilizzare i modelli. Se possibile, sfrutta i modelli di campo derivati del canale di marketing. In alternativa, allinea la logica con le best practice consigliate per il canale di marketing di Adobe.

Chiavi stringa non normalizzate utilizzate nelle ricerche

Questa sezione descrive l’utilizzo di chiavi di stringa non normalizzate nelle ricerche.

Pattern

  • Una funzione Lookup su un evento o un campo di profilo che alimenta un set di dati di ricerca.
  • Nessun elemento Minuscolo, Trim o Regex Replace precedente standardizza la chiave.
  • Candidati comuni: URL, ID campagna, e-mail, ID account.

Diagnosi dei rischi: qualità dei dati, manutenzione elevata

  • Rischio di qualità dei dati: le ricerche non riescono quando il case della chiave o lo spazio vuoto differiscono dalla tabella di ricerca, causando nessuna corrispondenza e lacune nei rapporti.

Funzione Consigli

  • Aggiungi le funzioni Minuscolo e Taglia prima della funzione Ricerca a meno che non vi sia un motivo documentato per mantenere lettere maiuscole o minuscole.
  • Se più trasformazioni sono già concatenate, verificane l’ordine: normalizza prima, quindi cerca.

Uso improprio o sovraccarico di Regex

Questa sezione descrive l’uso improprio o l’overreach della funzionalità regex per i campi derivati.

Pattern

  • Regex Replace o condizioni basate su regex utilizzano pattern ampi; Case più semplice Quando funzioni con Contains o Starts with sono alternative migliori.

    accordion
    Esempio

    Best practice - Regex Replace 1

    Best practice - Regex Replace 1

  • Più condizioni regex si sovrappongono o entrano in conflitto.

  • Utilizzo intensivo di regex per analizzare gli URL invece di utilizzare la funzione URL Parse.

Diagnosi dei rischi: prestazioni, qualità dei dati, manutenzione elevata

  • Rischio di prestazioni e manutenibilità: i pattern regex complessi sono più difficili da eseguire e possono essere più lenti.
  • Rischio di correttezza: un’eccessiva ampiezza di regex può acquisire valori non desiderati.

Funzione Consigli

  • Preferisci Analisi URL per elementi URL standard (dominio, percorso, parametri query) invece di Sostituzione regex.
  • Per controlli pattern semplici, utilizza Case When con Contains, Starts with o Ends with logic invece delle espressioni regolari con Regex Replace.
  • Contrassegna le espressioni regolari che utilizzano più gruppi nidificati o alternative per i pattern semplici. Oppure espressioni regolari che possono essere sostituite utilizzando funzioni di stringa di campo derivate.

Logica di stile della metrica calcolata nei campi derivati

Questa sezione descrive l’utilizzo della logica di stile calcolata in un campo derivato.

NOTE
I campi derivati vengono valutati a livello di evento (riga) prima dell’aggregazione, mentre le metriche calcolate di Analysis Workspace funzionano su valori già aggregati. I rapporti, le medie e i calcoli in stile distinto possono quindi produrre risultati diversi a seconda che questi calcoli vengano implementati come campo derivato o come metrica calcolata. Siate decisi su dove vive l'aritmetica, perché la grandezza della valutazione cambia la risposta.

Pattern

  • Aritmetica pura su campi numerici all’interno di un campo derivato (somma, sottrazione, divisione) che si presenta come una metrica calcolata.

    accordion
    Esempi

    Best practice - Calcolo del profitto

    Best practice - Ordini per impression .

  • Non viene utilizzato alcun tipo di manipolazione o classificazione delle stringhe; la logica è puramente numerica.

Diagnosi dei rischi: qualità dei dati

  • Questione di governance e progettazione: l’aritmetica può essere meglio posizionata come:

    • Una metrica di campo derivata (se desideri che il campo derivato sia una metrica standard gestita per tutti gli utenti).
    • Una metrica calcolata in Analysis Workspace (se la metrica calcolata è specifica per l’analisi).

Funzione Consigli

  • Se il risultato aritmetico è generalmente utile tra utenti e progetti, mantienilo come metrica di campo derivata. Assicurati che il tipo di componente sia metrica e che la formattazione (valuta, percentuale) sia configurata a livello di visualizzazione dati.
  • Se il risultato è specifico per la nicchia o per l’analista, spostalo in una metrica calcolata e semplifica la visualizzazione dati.

Utilizzo eccessivo delle funzioni Successivo o Precedente o sequenziale

Questa sezione descrive l’utilizzo eccessivo di funzioni successive o precedenti o sequenziali.

Pattern

  • Un campo derivato utilizza più volte le funzioni Successivo o Precedente (in prossimità del limite documentato per campo).
  • Next o Previous viene utilizzato per implementare una logica di persistenza (ad esempio: portare avanti una campagna) invece di utilizzare la persistenza della visualizzazione dati.

Diagnosi dei rischi: qualità dei dati, manutenzione elevata

  • Complessità e fragilità: una logica sequenziale pesante è più difficile da ragionare e può interrompersi se le regole di sessionizzazione o di ordinamento cambiano.
  • Ridondanza con persistenza della dimensione: le impostazioni della visualizzazione dati Persistenza (modello di allocazione) sulla dimensione descrivono meglio alcuni casi d’uso (ad esempio, Canale ultimo contatto in una sessione).

Funzione Consigli

  • Per i pattern che assomigliano alla persistenza standard (ad esempio, il trasferimento di un valore in una sessione o persona), utilizza le impostazioni Persistenza della dimensione (Modello di allocazione e Scadenza) nella visualizzazione dati invece di simulare questi pattern con Successivo o Precedente.
  • Riserva Successivo o Precedente per il percorso avanzato in più passaggi o per l’etichettatura funnel che la sola persistenza della dimensione non può raggiungere (ad esempio: concatenazione della sequenza di canale).

Ignorare il contesto a livello di sessione e persona

In questa sezione viene descritto come ignorare il contesto a livello di sessione e persona durante la definizione di un campo derivato.

NOTE
In alcuni casi, un segmento con ambito a livello di sessione o di persona in Analysis Workspace può modellare il comportamento più semplicemente di un campo derivato. Valuta l’utilizzo di segmenti invece di campi derivati complessi da più ambiti, se appropriato.

Pattern

  • Un campo derivato presuppone implicitamente un particolare livello contenitore (evento, sessione o persona), ma:

    • Il campo derivato non fa riferimento ad attributi a livello di sessione o di persona.
    • Le impostazioni della sessione della visualizzazione dati sono in conflitto con la logica prevista.

Diagnosi dei rischi: qualità dei dati

  • Mancata corrispondenza concettuale: la semantica dei campi derivati potrebbe non corrispondere al livello di aggregazione previsto dagli analisti (ad esempio, un campo basato su utente tipo che può cambiare con ogni evento).

Funzione Consigli

  • Se la logica deve essere a livello di sessione: verificare che le impostazioni di sessione siano configurate in modo appropriato e provare a utilizzare componenti con ambito di sessione o riepilogo in Analysis Workspace o in uno strumento di business intelligence integrato.
  • Se la logica deve essere a livello di persona: utilizza i set di dati di profilo o di ricerca e fai riferimento a tali set di dati all’interno di campi derivati.
  • Valuta se un segmento con ambito di sessione o di persona in Analysis Workspace raggiungerebbe lo stesso risultato più semplicemente di un campo derivato.

Raggiungere o avvicinarsi ai limiti documentati delle funzioni

Questa sezione descrive le implicazioni di raggiungere o avvicinarsi ai limiti documentati delle funzioni di campo derivato.

NOTE
Riduci la dipendenza da campi ad alta cardinalità all'interno di campi derivati complessi, ove possibile (ad esempio: utilizza chiavi normalizzate o classificazioni raggruppate) per limitare i costi delle query e la probabilità di raggiungere i limiti di operatore o funzione.

Il numero massimo di funzioni e operatori per campo derivato di Customer Percorsi Analytics documents, inclusi i limiti per tipo di funzione.atterns**

Diagnosi dei rischi: prestazioni, manutenzione elevata

  • Rischio di scalabilità: le aggiunte future potrebbero non riuscire o comportarsi in modo imprevisto se il campo raggiunge il limite di funzioni.

Funzione Consigli

  • Segnala in modo proattivo quando l’utilizzo supera una soglia (ad esempio: > 70% di qualsiasi limite di funzione o operatore).
  • Dividi la logica in più campi derivati concatenati (ad esempio, un campo derivato A che normalizza una chiave di ricerca e un campo derivato B che utilizza la chiave di ricerca normalizzata per cercare un’etichetta).
  • Utilizza la preparazione dati esterna o un set di dati di ricerca in cui sono necessarie classificazioni particolarmente grandi.

Regole di ottimizzazione specifiche della visualizzazione dati

Questa sezione descrive le regole di ottimizzazione specifiche della visualizzazione dati per i campi derivati.

Controlla anche la configurazione della visualizzazione dati per ciascun componente derivato.

Pattern

  • Una dimensione derivata ha un’attribuzione predefinita (ad esempio: Ultimo contatto con scadenza sessione), ma il nome del campo derivato implica una semantica diversa (ad esempio: First Campaign of Visit, Original Source).
  • Una dimensione derivata ha impostazioni Persistenza predefinite (ad esempio: Allocazione più recente con Sessione scadenza) ma il nome della dimensione derivata implica una semantica diversa (ad esempio First Campaign of Visit o Original Source).

Diagnosi dei rischi: qualità dei dati

  • Mancata corrispondenza semantica: l’etichetta della dimensione suggerisce un comportamento di allocazione o scadenza diverso (ad esempio, allocazione originale o scadenza a livello di persona) rispetto a quello effettivamente configurato.
  • Questa mancata corrispondenza aumenta il rischio che gli analisti interpretino erroneamente i rapporti o confrontino componenti che appaiono simili per nome ma che utilizzano modelli di allocazione diversi.

Funzione Consigli

  • Regola il modello di allocazione ​ e la scadenza ​ su quella dimensione per allineare nome e comportamento. Ad esempio, una dimensione campo derivata denominata Original Source deve utilizzare l’attribuzione Primo contatto con scadenza impostata su Persona.
  • Regola il modello di allocazione e la scadenza nelle impostazioni di persistenza della dimensione per allineare nome e comportamento. Ad esempio, Original Source deve impostare Allocation model su Original con Expiration impostato su Person.
recommendation-more-help
analytics-platform-help-main