Riktlinjer för härledda fält

Med Customer Journey Analytics härledda fält kan du omforma, klassificera och förbättra data vid frågetiden utan att ändra källdatamängder. Den flexibiliteten kan medföra komplexitet, prestandaproblem och underhållskostnader om de tillämpas utan disciplin.

Den här artikeln innehåller riktlinjer (bästa praxis, skyddsmetoder och vanliga fallgropar) för arbete med härledda fält. Målgruppen är dataarkitekter, produktadministratörer och analytiker som behöver:

  • Optimera prestanda: Identifiera mönster som saktar ned körningen av frågor eller träffsystemsgränser för att välja rätt verktyg för jobbet:

  • Förbättra underhållet: Skapa härledd fältlogik som är tydlig, modulär och enkel att uppdatera.

  • Kontrollera att är korrekt: Undvik vanliga logiska fel i klassificering, attribuering och dataomvandling.

I den här artikeln ordnas avsnitten om följande teman:

Varje avsnitt innehåller:

  • Mönster som ska identifieras: observerbara signaler i dina härledda fältdefinitioner.
  • Riskdiagnos: Varför mönstret är problematiskt. Möjliga orsaker är negativa effekter på prestanda, datakvalitet eller underhåll.
  • Rekommendationer: Skapa steg för att omfaktorisera eller förbättra implementeringen.

Dessa riktlinjer hjälper dig att skapa effektiva, skalbara och semantiskt korrekta implementeringar i Customer Journey Analytics. Använd dessa riktlinjer när du granskar befintliga datavyer, utformar nya härledda fält eller bygger upp styrningsverktyg.

Fält som härletts från högkardinalitet

I det här avsnittet beskrivs standardsegment för datavy som refererar till härledda fält med hög kardinalitet.

Mönster

  • Standardsegment i datavyn som refererar till ett härlett fält som är byggt på en hög kardinalitetsdimension (ungefär en miljon eller fler distinkta värden). Till exempel: URL för helsida.
  • Enkla åtgärder som Gemener, Rensa eller Fall när kontroller på sidans URL är ofta dyrare än samma logik i fält med låg kardinalitet.

Riskdiagnos: prestanda

  • Standardsegment som filtrerar på härledda fält som rör sidans URL eller andra dimensioner med hög kardinalitet lägger till fördröjning i varje fråga mot datavyn.

Rekommendationer

  • Undvik att referera till URL-adresser för hela sidor eller liknande komponenter för hög kardinalitet direkt i standardsegmenten för datavyn. Överför tung URL-logik (komplicerad Case When, Regex Replace, flera strängfunktioner) uppströms till Data Prep eller lookup datasets så att de resulterande klassificeringarna landar på enklare, lägre kardinalitetsmått.
  • Föredra lägre kardinalitetstangenter som normaliserat sidnamn, webbplatsavsnitt eller förklassificerade URL-grupper.
  • Granska regelbundet befintliga datavyns standardsegment och härledda fält för referenser till högkardinalitetsdimensioner (sid-URL, kampanj-ID:n, råfrågesträngar) och omfaktorisera till normaliserade eller grupperade nycklar.

Överkomplext skiftläge när regelkedjan

I det här avsnittet beskrivs överkomplexa kedjor för reglerna Fall när används.

Customer Journey Analytics tvingar fram uttryckliga funktions- och operatorbegränsningar per härlett fält (till exempel maximalt antal operatorer, maximalt antal funktioner per typ). För komplexa funktioner och kedjor i funktioner är svårare att underhålla och mer felbenägna.

Mönster

  • Mycket stora Skiftläge när ​-funktioner med komplexa If- och Else If-kedjor:

    • Många villkor (till exempel: fler än 20 operatorer) eller djupkapsling (fler än 3 eller 4 nivåer av kapslad Case When If och Else If logic).
    • Upprepade villkor i samma fält med olika värden.
  • Upprepad konstant strängmatchning.

    accordion
    Exempel
    God praxis - exempel på upprepad strängmatchning

Riskdiagnos: prestanda, datakvalitet, högt underhåll

  • Underhållbarhet och felrisk: logik som kodats som ett monolitiskt regelblock är svår att felsöka och uppdatera.
  • Potentiella prestanda och begränsningsrisker: du kan träffa på eller närma dig operatorn eller funktionsgränserna, särskilt med klassifierande mönster.

Rekommendationer

  • Dela upp i flera härledda fält. Skilj till exempel kampanjnormalisering (mappar inkonsekventa kampanjidentifierare till ett kanoniskt värde) från kanalblockering i stället för att kombinera allt i en enda regel.
  • Använd uppslagsdatauppsättningar. Många If Value _värde _villkor_villkor _Ange sedan_värde _till värde​villkor som är bättre implementerade som en uppslagsuppsättning kombinerad med funktionen Uppslag i stället för att använda långa Skiftläge när-kedjor.
  • Använda komponentfilter i datavyn. Om en del av logiken bara filtrerar bort felaktiga värden använder du include exclude på datavykomponentnivå i stället för att bädda in logiken i ett härlett fält.

Felaktig användning

I det här avsnittet beskrivs felaktig användning av härledda fält. I synnerhet där alternativ är en bättre lösning.

NOTE
Att flytta logik från ett härlett fält till en datavykomponentinställning förbättrar inte i sig frågeprestanda. Båda metoderna kompileras till samma underliggande härledda logik. Rekommendationerna i det här avsnittet handlar om klarhet, styrning och återanvändning snarare än om hastighet.

Mönster

  • Ett härlett fält replikerar beteendet som redan finns i komponentinställningarna:

    • Ärendenormalisering, trimning eller enkel filtrering (till exempel: exkludering av unknown, undefined eller null) utan någon ytterligare komplexitet.

    • Grundläggande buckning på nummerintervall.

      accordion
      Exempel
      Felaktig användning av grundläggande bucketing

      Använd i stället värdebucketing på en dimension i datavyn.

    • Persistens- eller attribueringslogik som är kodad med Nästa eller Föregående eller manuell sekvenslogik där inställningarna för datavyn attribution och expiration är tillräckliga.

    • Ett härlett mått som helt enkelt räknar ett befintligt mått under ett villkor.

      accordion
      Exempel
      Felaktig användning av villkorlig logik

      Den här metoden replikerar vad ett filtrerat mätvärde eller Inkludera exkluderingsvärden kan uppnå.

Riskdiagnos: datakvalitet, högt underhåll

  • Överflödig komplexitet: härledda fält används där det finns enklare inbyggda datavyfunktioner.
  • Styrningsrisk: andra användare kanske inte förstår varför ett härlett fält finns i stället för en intern inställning. Mönstret gör det lättare att hantera härledda fält.
  • Minskad återanvändbarhet: kodning av villkorsstyrda flaggor som härledda fält gör det svårare att återanvända basvärden med olika filter i olika projekt.

Rekommendationer

  • Trimma/gemener: använd komponentinställningarna Delsträng och Beteende om du inte behöver kombinerade flerstegsomformningar.

  • Undantag av värden: använd Inkludera exkluderade värden för mått eller dimensionsvärden på datavyns komponentnivå, inte i ett härlett fält.

  • Attribut och beständighet: Använd datavyn Persistence-inställningar (Allocation model och Expiration) för dimensioner i stället för att simulera dem i ett härlett fält med Nästa eller Föregående eller annan sekventiell logik.

  • Numerisk paketering: behåll det härledda fältet numeriskt och låt datavyn skapa en bucketdimension överst, i stället för att skriva in taggiga intervalletiketter i en Case When -kedja.

  • Villkorslogik: konvertera enkel 0- eller 1-flagglogik till antingen:

    • det ursprungliga måttet med filterlogiken include eller exclude som används i Analysis Workspace.
    • ett filtrerat mätvärde med hjälp av konfiguration av komponentinställningar för datavyn.

Felklassificeringar av mätvärden och mått

I det här avsnittet beskrivs felklassificeringen av mått och mått.

Mönster

  • Ett härlett fält ger tydligt

    • Numeriska utdata (antal, proportion eller aritmetisk) men komponenten är konfigurerad som en dimension.
    • Kategoriserade utdata (etiketter eller strängar) men komponenten är konfigurerad som ett mått.
  • Ett härlett fält kodar 0/1-flaggor som strängar.

Customer Journey Analytics tillåter att numeriska fält tvingas till dimensioner och strängfält till mätvärden på datavynivå, men feljustering kan skapa förvirrande rapporter.

Riskdiagnos: datakvalitet

  • Semantisk felmatchning: komponenttypen matchar inte det härledda resultatets typ, vilket gör komponenttypen svårare att analysera eller sammanställa korrekt.

Rekommendationer

  • Om utdata är numeriska:

    • Ange komponenttypen till Metric i datavyn.
    • Om komponenten representerar ett delmängdsmått (till exempel Checkout Page Views) använder du ett filtrerat mått i datavyn i stället för en härledd sträng plus ett beräknat mått överst.
  • Om utdata är en etikett:

    • Ange komponenttypen till Dimension och konfigurera Persistence-inställningarna (Allocation model och Expiration) därefter.

Marknadsföringskanal och kampanjlogik fallgropar

I det här avsnittet behandlas problem med marknadsföringskanaler och kampanjlogik.

NOTE
Överväg förenklad uppströms: använd Dataprep, uppslagsdatamängder eller härledda fältfunktioner som Classify för att konsolidera liknande regler för marknadsföringskanaler och minska antalet operatorer i Case When -logiken. Begränsa även antalet högkardinalitetsfält som refereras i kanalklassificeringslogiken (till exempel många distinkta frågeparameternycklar), eftersom dessa fält ökar både kardinalitet och frågekostnad.

Mönster

  • Customer Journey Analytics marknadsföringskanaler implementeras ofta med hjälp av härledda fält.

    • Härledda fält som implementerar marknadsföringskanal eller kampanjpaketering baserat på URL-parametrar, hänvisare, landningssida med mera.
    • Misstänkt ordning: en allmän regel för att spara alla visas innan mer specifika regler tillämpas.
    • Ofullständig hantering av alla möjliga alternativ: ingen explicit gren för Referring Domain is not set eller Query Parameter is not set.

Riskdiagnos: datakvalitet

  • Fel vid logikbeställning: senare regler i kedjan som kan åsidosätta specifika kanaler och leda till felklassificerad trafik.
  • Felaktig direkttrafik: omatchad trafik hamnar i en oavsedd kanal eller har etiketten Other.

Rekommendationer

  • Använd prioritetsordning uppifrån och ned. Placera de starkaste signalerna först (till exempel interna domäner för att exkludera betalda kampanjparametrar).
  • Inkludera ett slutligt explicit Otherwise set value to-fall. Ställ in reservvärdet på No value för att undvika att skriva över tidigare kanaler. Ange inte värdet till Custom string value och sedan Custom string value till Direct, None eller Unclassified i det här catch-all-steget.
  • Använd mallar. Utnyttja mallar för härledda marknadsföringskanaler där det är möjligt. Eller anpassa logiken åtminstone till Adobe rekommenderade marknadsföringskanaler.

Icke-normaliserade strängnycklar som används i uppslag

I det här avsnittet beskrivs användningen av icke-normaliserade strängnycklar i uppslag.

Mönster

  • En sökfunktion över ett händelse- eller profilfält som matar en sökdatamängd.
  • Ingen föregående gement, Trim eller Regex Replace standardiserar nyckeln.
  • Vanliga kandidater: URL, kampanj-ID, e-post, konto-ID.

Riskdiagnos: Datakvalitet, högt underhåll

  • Datakvalitetsrisk: sökningar misslyckas när nyckelversaler eller mellanrum skiljer sig från uppslagstabellen, vilket leder till inga matchningsvärden och luckor i rapporteringen.

Rekommendationer

  • Lägg till funktionerna Gemener och Trimma före funktionen Sök om det inte finns någon dokumenterad anledning att behålla versaler eller gemener.
  • Om flera omformningar redan är kedjade kontrollerar du först ordningen: normalisera först och slå sedan upp.

Felanvändning eller överanvändning av Regex

I det här avsnittet beskrivs hur regex-funktionaliteten för härledda fält används felaktigt eller är för stor.

Mönster

  • Regex Replace eller regex-baserade villkor använder breda mönster. Enklare Case When -funktioner med Contains eller Starts with är bättre alternativ.

    accordion
    Exempel

    God praxis - ersätt regex 1

    God praxis - ersätt regex 1

  • Flera regex-villkor överlappar eller står i konflikt.

  • Kraftig regex-användning för att analysera URL:er i stället för att använda funktionen URL Parse.

Riskdiagnos: prestanda, datakvalitet, högt underhåll

  • Prestanda- och underhållsrisk: komplexa regex-mönster är svårare att felsöka och kan vara långsammare.
  • Korrektionsrisk: alltför bred regex kan fånga upp oavsiktliga värden.

Rekommendationer

  • Föredra URL-parsning för standard-URL-element (domän, sökväg, frågeparametrar) i stället för Regex-ersättning.
  • För enkla mönsterkontroller använder du logiken Skiftläge när används med Contains, Starts with eller Ends with i stället för reguljära uttryck med Regex Replace.
  • Flagga reguljära uttryck som använder flera kapslade grupper eller alternativ för enkla mönster. Eller reguljära uttryck som du kan ersätta med härledda fältsträngsfunktioner.

Beräknad metrisk formatlogik i härledda fält

I det här avsnittet beskrivs användningen av logik för beräknade format i ett härlett fält.

NOTE
Härledda fält utvärderas på händelsenivå (rad) före aggregering, medan Analysis Workspace beräknade värden fungerar på redan aggregerade värden. Proportioner, medelvärden och distinkta beräkningar kan därför ge olika resultat beroende på om dessa beräkningar implementeras som ett härlett fält eller som ett beräknat mått. Var medveten om var aritmetiken bor, eftersom utvärderingskvoten ändrar svaret.

Mönster

  • Ren aritmetisk på numeriska fält i ett härlett fält (summa, subtraktion, division) som ser ut som ett beräknat mått.

    accordion
    Exempel

    God praxis - Vinstberäkning

    God praxis - beställningar per intryck .

  • Ingen användning av strängmanipulation eller klassificering. Logiken är helt numerisk.

Riskdiagnos: datakvalitet

  • Styrnings- och designfråga: Det aritmetiska kan bättre placeras som:

    • En härledd fältmätare (om du vill att det härledda fältet ska vara ett styrt standardmått för alla användare).
    • Ett beräknat mätvärde i Analysis Workspace (om det beräknade mätvärdet är analysspecifikt).

Rekommendationer

  • Om det aritmetiska resultatet i allmänhet är användbart för användare och projekt ska du behålla resultatet som ett härlett fältmått. Kontrollera att komponenttypen är metrisk och att formateringen (valuta, procent) är konfigurerad på datavynivå.
  • Om resultatet är nischat eller analytikerspecifikt flyttar du resultatet till ett beräknat mått och förenklar datavyn.

Överanvändning av funktionerna Nästa eller Föregående eller sekventiellt

I det här avsnittet beskrivs överanvändningen av funktionerna Nästa eller Föregående eller sekventiellt.

Mönster

Riskdiagnos: datakvalitet, högt underhåll

  • Komplexitet och skörhet: det är svårare att skapa en tung sekventiell logik och den kan gå sönder om reglerna för sessioner eller ordningsföljden ändras.
  • Redundans med dimensionsbeständighet: Inställningarna för datavyn Persistence (allokeringsmodell) för dimensionen täcker bättre vissa användningsfall (till exempel sista beröringskanalen i en session).

Rekommendationer

  • För mönster som liknar standardbeständighet (till exempel för att föra ett värde framåt över en session eller person) använder du dimensionens Persistence -inställningar (Allocation model och Expiration) i datavyn i stället för att simulera dessa mönster med Nästa eller Föregående.
  • Reservera Nästa eller Föregående för avancerade flerstegssökvägar eller funnel-etiketter som inte kan uppnå enbart denna dimensionsbeständighet (till exempel kanalsekvenssammanfogning).

Ignorerar session- och personnivåsammanhang

I det här avsnittet diskuteras ignorering av session- och personnivåsammanhang när ett härlett fält definieras.

NOTE
I vissa fall kan ett segment som omfångats på sessions- eller personnivå i Analysis Workspace modellera beteendet enklare än ett härlett fält. Överväg att använda segment i stället för komplexa härledda fält som sträcker sig över flera områden när det är lämpligt.

Mönster

  • Ett härlett fält förutsätter implicit en viss behållarnivå (händelse, session eller person) men:

    • Det härledda fältet refererar inte till attribut på sessions- eller personnivå.
    • Inställningarna för datavyssessioner står i konflikt med den avsedda logiken.

Riskdiagnos: Datakvalitet

  • Konceptuell felmatchning: härledda fältsemantik kanske inte matchar den aggregeringsnivå som analytiker förväntar sig (till exempel ett personbaserat fält som kan ändras med varje händelse).

Rekommendationer

  • Om logiken är avsedd att vara sessionsnivå: verifiera att sessionsinställningarna har konfigurerats korrekt och överväg att använda sessionsomfångskomponenter eller sammanfattning i Analysis Workspace eller i ett integrerat BI-verktyg.
  • Om logiken är avsedd att vara personnivå: använd profildatamängder eller uppslagsdatamängder och referera till dessa datamängder i härledda fält.
  • Utvärdera om ett sessionsomfattat eller personomfattat segment i Analysis Workspace skulle uppnå samma resultat enklare än ett härlett fält.

Gränser för hingrande eller närliggande dokumenterade funktioner

I det här avsnittet beskrivs konsekvenserna av att hacka eller närma de dokumenterade härledda fältfunktionsgränserna.

NOTE
Minska beroendet av högkardinalitetsfält i komplexa härledda fält där det är möjligt (till exempel med normaliserade nycklar eller grupperade klassificeringar) för att begränsa frågekostnaden och sannolikheten för att operatorn eller funktionsgränserna identifieras.

Customer Journey Analytics documents maxfunktioner och operatorer per härlett fält, inklusive begränsningar per funktionstyp.atterns**

Riskdiagnos: prestanda, högt underhåll

  • Skalbarhetsrisk: framtida tillägg kan misslyckas eller uppträda oväntat om fältet når sin funktionsgräns.

Rekommendationer

  • Flagga aktivt när användningen överskrider ett tröskelvärde (till exempel: > 70 % av en funktions- eller operatorgräns).
  • Dela upp logiken i flera härledda fält som är sammankopplade (till exempel: ett härlett fält A som normaliserar en söknyckel och ett härlett fält B som använder den normaliserade söknyckeln för att söka efter en etikett).
  • Använd en extern dataprep eller en uppslagsdatauppsättning där särskilt stora klassificeringar behövs.

Optimeringsregler som är specifika för datavy

I det här avsnittet behandlas datavyns specifika optimeringsregler för härledda fält.

Kontrollera även datavykonfigurationen för varje härledd komponent.

Mönster

  • En härledd dimension har standardattribuering (t.ex. sista beröringen med sessionens förfallodatum) men det härledda fältnamnet antyder en annan semantik (t.ex.: First Campaign of Visit, Original Source).
  • En härledd dimension har standardinställningarna för Persistence (till exempel: Most Recent allokering med Session förfallodatum), men namnet på den härledda dimensionen antyder en annan semantik (till exempel First Campaign of Visit eller Original Source).

Riskdiagnos: datakvalitet

  • Semantisk felmatchning: dimensionens etikett föreslår ett annat allokerings- eller förfallobeteende (till exempel Ursprunglig allokering eller Utgångsdatum) än vad som faktiskt är konfigurerat.
  • Denna felmatchning ökar risken för att analytiker feltolkar rapporter eller jämför komponenter som ser ut ungefär som namn, men som använder olika allokeringsmodeller.

Rekommendationer

  • Justera allokeringsmodellen och förfallodatumet för den dimensionen för att justera namn och beteende. En härledd fältdimension med namnet Original Source bör till exempel använda attributet First touch med förfallotiden inställd på Person.
  • Justera Allocation model och Expiration i dimensionens Persistence -inställningar för att justera namn och beteende. Original Source bör till exempel ange Allocation model till Original med Expiration inställt på Person.
recommendation-more-help
analytics-platform-help-main