Riktlinjer för härledda fält
Med Customer Journey Analytics härledda fält kan du omforma, klassificera och förbättra data vid frågetiden utan att ändra källdatamängder. Den flexibiliteten kan medföra komplexitet, prestandaproblem och underhållskostnader om de tillämpas utan disciplin.
Den här artikeln innehåller riktlinjer (bästa praxis, skyddsmetoder och vanliga fallgropar) för arbete med härledda fält. Målgruppen är dataarkitekter, produktadministratörer och analytiker som behöver:
-
Optimera prestanda: Identifiera mönster som saktar ned körningen av frågor eller träffsystemsgränser för att välja rätt verktyg för jobbet:
-
Förbättra underhållet: Skapa härledd fältlogik som är tydlig, modulär och enkel att uppdatera.
-
Kontrollera att är korrekt: Undvik vanliga logiska fel i klassificering, attribuering och dataomvandling.
I den här artikeln ordnas avsnitten om följande teman:
- Fält som härletts från högkardinalitet
- Överkomplext skiftläge när regelkedjan
- Felaktig användning
- Felklassificeringar av mätvärden och mått
- Marknadsföringskanal och kampanjlogik fallgropar
- Icke-normaliserade strängnycklar som används i uppslag
- Felanvändning eller överanvändning av Regex
- Beräknad metrisk formatlogik i härledda fält
- Överanvändning av funktionerna Nästa eller Föregående eller sekventiellt
- Ignorerar session- och personnivåsammanhang
- Gränser för hingrande eller närliggande dokumenterade funktioner
- Optimeringsregler som är specifika för datavy
Varje avsnitt innehåller:
- Mönster som ska identifieras: observerbara signaler i dina härledda fältdefinitioner.
- Riskdiagnos: Varför mönstret är problematiskt. Möjliga orsaker är negativa effekter på prestanda, datakvalitet eller underhåll.
- Rekommendationer: Skapa steg för att omfaktorisera eller förbättra implementeringen.
Dessa riktlinjer hjälper dig att skapa effektiva, skalbara och semantiskt korrekta implementeringar i Customer Journey Analytics. Använd dessa riktlinjer när du granskar befintliga datavyer, utformar nya härledda fält eller bygger upp styrningsverktyg.
Fält som härletts från högkardinalitet
I det här avsnittet beskrivs standardsegment för datavy som refererar till härledda fält med hög kardinalitet.
Mönster
- Standardsegment i datavyn som refererar till ett härlett fält som är byggt på en hög kardinalitetsdimension (ungefär en miljon eller fler distinkta värden). Till exempel: URL för helsida.
- Enkla åtgärder som Gemener, Rensa eller Fall när kontroller på sidans URL är ofta dyrare än samma logik i fält med låg kardinalitet.
Riskdiagnos: prestanda
- Standardsegment som filtrerar på härledda fält som rör sidans URL eller andra dimensioner med hög kardinalitet lägger till fördröjning i varje fråga mot datavyn.
Rekommendationer
- Undvik att referera till URL-adresser för hela sidor eller liknande komponenter för hög kardinalitet direkt i standardsegmenten för datavyn. Överför tung URL-logik (komplicerad Case When, Regex Replace, flera strängfunktioner) uppströms till Data Prep eller lookup datasets så att de resulterande klassificeringarna landar på enklare, lägre kardinalitetsmått.
- Föredra lägre kardinalitetstangenter som normaliserat sidnamn, webbplatsavsnitt eller förklassificerade URL-grupper.
- Granska regelbundet befintliga datavyns standardsegment och härledda fält för referenser till högkardinalitetsdimensioner (sid-URL, kampanj-ID:n, råfrågesträngar) och omfaktorisera till normaliserade eller grupperade nycklar.
Överkomplext skiftläge när regelkedjan
I det här avsnittet beskrivs överkomplexa kedjor för reglerna Fall när används.
Customer Journey Analytics tvingar fram uttryckliga funktions- och operatorbegränsningar per härlett fält (till exempel maximalt antal operatorer, maximalt antal funktioner per typ). För komplexa funktioner och kedjor i funktioner är svårare att underhålla och mer felbenägna.
Mönster
-
Mycket stora Skiftläge när -funktioner med komplexa If- och Else If-kedjor:
- Många villkor (till exempel: fler än 20 operatorer) eller djupkapsling (fler än 3 eller 4 nivåer av kapslad Case When If och Else If logic).
- Upprepade villkor i samma fält med olika värden.
-
Upprepad konstant strängmatchning.
accordion Exempel
Riskdiagnos: prestanda, datakvalitet, högt underhåll
- Underhållbarhet och felrisk: logik som kodats som ett monolitiskt regelblock är svår att felsöka och uppdatera.
- Potentiella prestanda och begränsningsrisker: du kan träffa på eller närma dig operatorn eller funktionsgränserna, särskilt med klassifierande mönster.
Rekommendationer
- Dela upp i flera härledda fält. Skilj till exempel kampanjnormalisering (mappar inkonsekventa kampanjidentifierare till ett kanoniskt värde) från kanalblockering i stället för att kombinera allt i en enda regel.
- Använd uppslagsdatauppsättningar. Många If Value _värde _villkor_villkor _Ange sedan_värde _till värdevillkor som är bättre implementerade som en uppslagsuppsättning kombinerad med funktionen Uppslag i stället för att använda långa Skiftläge när-kedjor.
- Använda komponentfilter i datavyn. Om en del av logiken bara filtrerar bort felaktiga värden använder du include exclude på datavykomponentnivå i stället för att bädda in logiken i ett härlett fält.
Felaktig användning
I det här avsnittet beskrivs felaktig användning av härledda fält. I synnerhet där alternativ är en bättre lösning.
Mönster
-
Ett härlett fält replikerar beteendet som redan finns i komponentinställningarna:
-
Ärendenormalisering, trimning eller enkel filtrering (till exempel: exkludering av
unknown,undefinedellernull) utan någon ytterligare komplexitet. -
Grundläggande buckning på nummerintervall.
accordion Exempel
Använd i stället värdebucketing på en dimension i datavyn.
-
Persistens- eller attribueringslogik som är kodad med Nästa eller Föregående eller manuell sekvenslogik där inställningarna för datavyn attribution och expiration är tillräckliga.
-
Ett härlett mått som helt enkelt räknar ett befintligt mått under ett villkor.
accordion Exempel
Den här metoden replikerar vad ett filtrerat mätvärde eller Inkludera exkluderingsvärden kan uppnå.
-
Riskdiagnos: datakvalitet, högt underhåll
- Överflödig komplexitet: härledda fält används där det finns enklare inbyggda datavyfunktioner.
- Styrningsrisk: andra användare kanske inte förstår varför ett härlett fält finns i stället för en intern inställning. Mönstret gör det lättare att hantera härledda fält.
- Minskad återanvändbarhet: kodning av villkorsstyrda flaggor som härledda fält gör det svårare att återanvända basvärden med olika filter i olika projekt.
Rekommendationer
-
Trimma/gemener: använd komponentinställningarna Delsträng och Beteende om du inte behöver kombinerade flerstegsomformningar.
-
Undantag av värden: använd Inkludera exkluderade värden för mått eller dimensionsvärden på datavyns komponentnivå, inte i ett härlett fält.
-
Attribut och beständighet: Använd datavyn Persistence-inställningar (Allocation model och Expiration) för dimensioner i stället för att simulera dem i ett härlett fält med Nästa eller Föregående eller annan sekventiell logik.
-
Numerisk paketering: behåll det härledda fältet numeriskt och låt datavyn skapa en bucketdimension överst, i stället för att skriva in taggiga intervalletiketter i en Case When -kedja.
-
Villkorslogik: konvertera enkel 0- eller 1-flagglogik till antingen:
- det ursprungliga måttet med filterlogiken include eller exclude som används i Analysis Workspace.
- ett filtrerat mätvärde med hjälp av konfiguration av komponentinställningar för datavyn.
Felklassificeringar av mätvärden och mått
I det här avsnittet beskrivs felklassificeringen av mått och mått.
Mönster
-
Ett härlett fält ger tydligt
- Numeriska utdata (antal, proportion eller aritmetisk) men komponenten är konfigurerad som en dimension.
- Kategoriserade utdata (etiketter eller strängar) men komponenten är konfigurerad som ett mått.
-
Ett härlett fält kodar 0/1-flaggor som strängar.
Customer Journey Analytics tillåter att numeriska fält tvingas till dimensioner och strängfält till mätvärden på datavynivå, men feljustering kan skapa förvirrande rapporter.
Riskdiagnos: datakvalitet
- Semantisk felmatchning: komponenttypen matchar inte det härledda resultatets typ, vilket gör komponenttypen svårare att analysera eller sammanställa korrekt.
Rekommendationer
-
Om utdata är numeriska:
- Ange komponenttypen till Metric i datavyn.
- Om komponenten representerar ett delmängdsmått (till exempel Checkout Page Views) använder du ett filtrerat mått i datavyn i stället för en härledd sträng plus ett beräknat mått överst.
-
Om utdata är en etikett:
- Ange komponenttypen till Dimension och konfigurera Persistence-inställningarna (Allocation model och Expiration) därefter.
Marknadsföringskanal och kampanjlogik fallgropar
I det här avsnittet behandlas problem med marknadsföringskanaler och kampanjlogik.
Mönster
-
Customer Journey Analytics marknadsföringskanaler implementeras ofta med hjälp av härledda fält.
- Härledda fält som implementerar marknadsföringskanal eller kampanjpaketering baserat på URL-parametrar, hänvisare, landningssida med mera.
- Misstänkt ordning: en allmän regel för att spara alla visas innan mer specifika regler tillämpas.
- Ofullständig hantering av alla möjliga alternativ: ingen explicit gren för Referring Domain is not set eller Query Parameter is not set.
Riskdiagnos: datakvalitet
- Fel vid logikbeställning: senare regler i kedjan som kan åsidosätta specifika kanaler och leda till felklassificerad trafik.
- Felaktig direkttrafik: omatchad trafik hamnar i en oavsedd kanal eller har etiketten
Other.
Rekommendationer
- Använd prioritetsordning uppifrån och ned. Placera de starkaste signalerna först (till exempel interna domäner för att exkludera betalda kampanjparametrar).
- Inkludera ett slutligt explicit Otherwise set value to-fall. Ställ in reservvärdet på No value för att undvika att skriva över tidigare kanaler. Ange inte värdet till Custom string value och sedan Custom string value till
Direct,NoneellerUnclassifiedi det här catch-all-steget. - Använd mallar. Utnyttja mallar för härledda marknadsföringskanaler där det är möjligt. Eller anpassa logiken åtminstone till Adobe rekommenderade marknadsföringskanaler.
Icke-normaliserade strängnycklar som används i uppslag
I det här avsnittet beskrivs användningen av icke-normaliserade strängnycklar i uppslag.
Mönster
- En sökfunktion över ett händelse- eller profilfält som matar en sökdatamängd.
- Ingen föregående gement, Trim eller Regex Replace standardiserar nyckeln.
- Vanliga kandidater: URL, kampanj-ID, e-post, konto-ID.
Riskdiagnos: Datakvalitet, högt underhåll
- Datakvalitetsrisk: sökningar misslyckas när nyckelversaler eller mellanrum skiljer sig från uppslagstabellen, vilket leder till inga matchningsvärden och luckor i rapporteringen.
Rekommendationer
Felanvändning eller överanvändning av Regex
I det här avsnittet beskrivs hur regex-funktionaliteten för härledda fält används felaktigt eller är för stor.
Mönster
-
Regex Replace eller regex-baserade villkor använder breda mönster. Enklare Case When -funktioner med Contains eller Starts with är bättre alternativ.
accordion Exempel
-
Flera regex-villkor överlappar eller står i konflikt.
-
Kraftig regex-användning för att analysera URL:er i stället för att använda funktionen URL Parse.
Riskdiagnos: prestanda, datakvalitet, högt underhåll
- Prestanda- och underhållsrisk: komplexa regex-mönster är svårare att felsöka och kan vara långsammare.
- Korrektionsrisk: alltför bred regex kan fånga upp oavsiktliga värden.
Rekommendationer
- Föredra URL-parsning för standard-URL-element (domän, sökväg, frågeparametrar) i stället för Regex-ersättning.
- För enkla mönsterkontroller använder du logiken Skiftläge när används med Contains, Starts with eller Ends with i stället för reguljära uttryck med Regex Replace.
- Flagga reguljära uttryck som använder flera kapslade grupper eller alternativ för enkla mönster. Eller reguljära uttryck som du kan ersätta med härledda fältsträngsfunktioner.
Beräknad metrisk formatlogik i härledda fält
I det här avsnittet beskrivs användningen av logik för beräknade format i ett härlett fält.
Mönster
-
Ren aritmetisk på numeriska fält i ett härlett fält (summa, subtraktion, division) som ser ut som ett beräknat mått.
accordion Exempel
.
-
Ingen användning av strängmanipulation eller klassificering. Logiken är helt numerisk.
Riskdiagnos: datakvalitet
-
Styrnings- och designfråga: Det aritmetiska kan bättre placeras som:
- En härledd fältmätare (om du vill att det härledda fältet ska vara ett styrt standardmått för alla användare).
- Ett beräknat mätvärde i Analysis Workspace (om det beräknade mätvärdet är analysspecifikt).
Rekommendationer
- Om det aritmetiska resultatet i allmänhet är användbart för användare och projekt ska du behålla resultatet som ett härlett fältmått. Kontrollera att komponenttypen är metrisk och att formateringen (valuta, procent) är konfigurerad på datavynivå.
- Om resultatet är nischat eller analytikerspecifikt flyttar du resultatet till ett beräknat mått och förenklar datavyn.
Överanvändning av funktionerna Nästa eller Föregående eller sekventiellt
I det här avsnittet beskrivs överanvändningen av funktionerna Nästa eller Föregående eller sekventiellt.
Mönster
- I ett härlett fält används funktionerna Nästa eller Föregående flera gånger (nära gränsen för dokumenterade per fält).
- Nästa eller Föregående används för att implementera beständig logik (till exempel: föra en kampanj framåt) i stället för att använda beständighet för datavyn.
Riskdiagnos: datakvalitet, högt underhåll
- Komplexitet och skörhet: det är svårare att skapa en tung sekventiell logik och den kan gå sönder om reglerna för sessioner eller ordningsföljden ändras.
- Redundans med dimensionsbeständighet: Inställningarna för datavyn Persistence (allokeringsmodell) för dimensionen täcker bättre vissa användningsfall (till exempel sista beröringskanalen i en session).
Rekommendationer
- För mönster som liknar standardbeständighet (till exempel för att föra ett värde framåt över en session eller person) använder du dimensionens Persistence -inställningar (Allocation model och Expiration) i datavyn i stället för att simulera dessa mönster med Nästa eller Föregående.
- Reservera Nästa eller Föregående för avancerade flerstegssökvägar eller funnel-etiketter som inte kan uppnå enbart denna dimensionsbeständighet (till exempel kanalsekvenssammanfogning).
Ignorerar session- och personnivåsammanhang
I det här avsnittet diskuteras ignorering av session- och personnivåsammanhang när ett härlett fält definieras.
Mönster
-
Ett härlett fält förutsätter implicit en viss behållarnivå (händelse, session eller person) men:
- Det härledda fältet refererar inte till attribut på sessions- eller personnivå.
- Inställningarna för datavyssessioner står i konflikt med den avsedda logiken.
Riskdiagnos: Datakvalitet
- Konceptuell felmatchning: härledda fältsemantik kanske inte matchar den aggregeringsnivå som analytiker förväntar sig (till exempel ett personbaserat fält som kan ändras med varje händelse).
Rekommendationer
- Om logiken är avsedd att vara sessionsnivå: verifiera att sessionsinställningarna har konfigurerats korrekt och överväg att använda sessionsomfångskomponenter eller sammanfattning i Analysis Workspace eller i ett integrerat BI-verktyg.
- Om logiken är avsedd att vara personnivå: använd profildatamängder eller uppslagsdatamängder och referera till dessa datamängder i härledda fält.
- Utvärdera om ett sessionsomfattat eller personomfattat segment i Analysis Workspace skulle uppnå samma resultat enklare än ett härlett fält.
Gränser för hingrande eller närliggande dokumenterade funktioner
I det här avsnittet beskrivs konsekvenserna av att hacka eller närma de dokumenterade härledda fältfunktionsgränserna.
Customer Journey Analytics documents maxfunktioner och operatorer per härlett fält, inklusive begränsningar per funktionstyp.atterns**
- Ett härlett fält använder många uppslag, matematik-åtgärder, delning eller andra funktioner.
- Antalet operatorer ligger nära dokumenterade gränser (till exempel: mer än 70 % - 80 % av det tillåtna antalet).
Riskdiagnos: prestanda, högt underhåll
- Skalbarhetsrisk: framtida tillägg kan misslyckas eller uppträda oväntat om fältet når sin funktionsgräns.
Rekommendationer
- Flagga aktivt när användningen överskrider ett tröskelvärde (till exempel: > 70 % av en funktions- eller operatorgräns).
- Dela upp logiken i flera härledda fält som är sammankopplade (till exempel: ett härlett fält A som normaliserar en söknyckel och ett härlett fält B som använder den normaliserade söknyckeln för att söka efter en etikett).
- Använd en extern dataprep eller en uppslagsdatauppsättning där särskilt stora klassificeringar behövs.
Optimeringsregler som är specifika för datavy
I det här avsnittet behandlas datavyns specifika optimeringsregler för härledda fält.
Kontrollera även datavykonfigurationen för varje härledd komponent.
Mönster
- En härledd dimension har standardattribuering (t.ex. sista beröringen med sessionens förfallodatum) men det härledda fältnamnet antyder en annan semantik (t.ex.:
First Campaign of Visit,Original Source). - En härledd dimension har standardinställningarna för Persistence (till exempel: Most Recent allokering med Session förfallodatum), men namnet på den härledda dimensionen antyder en annan semantik (till exempel
First Campaign of VisitellerOriginal Source).
Riskdiagnos: datakvalitet
- Semantisk felmatchning: dimensionens etikett föreslår ett annat allokerings- eller förfallobeteende (till exempel Ursprunglig allokering eller Utgångsdatum) än vad som faktiskt är konfigurerat.
- Denna felmatchning ökar risken för att analytiker feltolkar rapporter eller jämför komponenter som ser ut ungefär som namn, men som använder olika allokeringsmodeller.
Rekommendationer
- Justera allokeringsmodellen och förfallodatumet för den dimensionen för att justera namn och beteende. En härledd fältdimension med namnet
Original Sourcebör till exempel använda attributet First touch med förfallotiden inställd på Person. - Justera Allocation model och Expiration i dimensionens Persistence -inställningar för att justera namn och beteende.
Original Sourcebör till exempel ange Allocation model till Original med Expiration inställt på Person.