Richtlijnen voor afgeleide velden

Customer Journey Analytics ​ afgeleide gebieden ​ laat u transformeren, classificeren, en verrijken gegevens in vraagtijd zonder brondatasets te wijzigen. Die flexibiliteit kan complexiteit, prestatieproblemen en overhead voor onderhoud met zich meebrengen als deze zonder discipline wordt toegepast.

Dit artikel bevat richtlijnen (aanbevolen procedures, instructies en valkuilen) voor het werken met afgeleide velden. Het beoogde publiek bestaat uit gegevensarchitecten, productbeheerders en analisten die:

In dit artikel worden de secties rond de volgende thema’s gerangschikt:

Elk gedeelte omvat:

  • Patronen om te ontdekken: De waarneembare signalen in uw afgeleide gebiedsdefinities.
  • de diagnose van het Risico: Waarom het patroon problematisch is. Mogelijke redenen zijn negatieve gevolgen op prestaties, gegevenskwaliteit, of onderhoud.
  • Aanbevelingen: Concrete stappen om de implementatie te weerspiegelen of te verbeteren.

Deze richtlijnen helpen u om efficiënte, scalable, en semantisch correcte implementaties in Customer Journey Analytics tot stand te brengen. Pas deze richtlijnen toe wanneer u bestaande gegevensmeningen controleert, nieuwe afgeleide gebieden ontwerpt, of beheersingshulpmiddelen bouwt.

Van hoge kwaliteit afgeleide velden

Deze sectie bespreekt standaardsegmenten van de gegevensmening die high-cardinality afgeleide gebieden van verwijzingen voorzien.

Patronen

  • De meningsstandaardsegmenten van gegevens die van verwijzingen voorzien een afgeleid gebied dat op een high-cardinaliteitsdimensie (ongeveer één miljoen of meer verschillende waarden) wordt voortgebouwd. Bijvoorbeeld: URL van volledige pagina.
  • De eenvoudige verrichtingen zoals ​ Kleine letters ​, ​ Versiering ​, of ​ Geval wanneer ​ controles op pagina URL vaak duurder zijn dan de zelfde logica op laag-kardinaliteitsgebieden.

De diagnose van het Risico: prestaties

  • De standaardsegmenten die op afgeleide gebieden filtreren die pagina URL of andere high-cardinality afmetingen raken voegen latentie aan elke vraag tegen de gegevensmening toe.

Aanbevelingen

  • Verwijs niet rechtstreeks naar volledige pagina-URL’s of soortgelijke high-cardinality componenten in de standaardsegmenten van de gegevensweergave. Duw zware logica URL (complex ​ Geval wanneer ​, ​ Regex ​ vervangt, veelvoudige koordfuncties) stroomopwaarts tot ​ Prep van Gegevens ​ of ​ raadplegingsdatasets ​ zodat de resulterende classificaties op eenvoudigere, laag-kardinaliteitsdimensies landen.
  • Voorkeur voor achterste-kardinaalsleutels zoals genormaliseerde paginanaam, plaatssectie, of pre-gerubriceerde URL groepen.
  • De bestaande standaardsegmenten van de gegevensmening en afgeleide gebieden van de periodieke controle voor verwijzingen naar high-cardinaliteitsafmetingen (pagina URL, campagne IDs, ruwe vraagkoorden) en refactor aan genormaliseerde of gegroepeerde sleutels.

Te complexe hoofdletters/kleine letters wanneer regelketens

Deze sectie bespreekt over-complexe ketens van ​ Geval wanneer ​ regels.

Customer Journey Analytics dwingt expliciete ​ functie en exploitantgrenzen ​ per afgeleid gebied (bijvoorbeeld, maximumaantal exploitanten, maximumaantal functie per type) af. Te complexe functies en ketens binnen functies zijn moeilijker te onderhouden en vertonen meer fouten.

Patronen

  • Zeer groot ​ Geval wanneer ​ met complexe If en Else If ketens werkt:

    • Vele voorwaarden (bijvoorbeeld: meer dan 20 exploitanten) of diep het nesten (meer dan 3 of 4 niveaus van genestelde ​ Geval wanneer ​ If en Else If logica).
    • Herhaalde voorwaarden in hetzelfde veld met verschillende waarden.
  • Herhaalde overeenkomende constante tekenreeks.

    accordion
    Voorbeeld
    ​ Beste praktijken - voorbeeld van herhaalde constante koord aanpassing ​

de diagnose van het Risico: prestaties, gegevenskwaliteit, hoog onderhoud

  • Onderhoud en foutenrisico: logica die als monolithisch regelblok wordt gecodeerd is moeilijk om te zuiveren en bij te werken.
  • Potentiële prestaties en beperkingsrisico: u kunt ​ exploitant of functielimieten ​ raken of benaderen, vooral met classificeren-als patronen.

Aanbevelingen

  • Splitsen op meerdere afgeleide velden. Bijvoorbeeld, afzonderlijke campagne normalisatie (het in kaart brengen van inconsistente campagneherkenningstekens aan een canonieke waarde) van kanaalsluiting in plaats van het combineren van alles in één reuzenregel.
  • Gebruik opzoekgegevenssets. Vele If Value _2} criterium van de waarde Criterium dan plaats waarde aan waarde _voorwaarden worden beter uitgevoerd als a​raadplegingsdataset ​ gecombineerd met de ​ 10} functie van de Opzoekmachine {in plaats van het gebruiken van lange ​ Geval wanneer ​ ketens.🔗
  • Filters van gegevensweergavecomponenten gebruiken. Als een deel van de logica eenvoudig slechte waarden uitfiltert, omvat het gebruik ​ ​ op het niveau van de component van de gegevensmening in plaats van het inbedden die logica in een afgeleid gebied.

Onjuist gebruik

In deze sectie wordt het onjuiste gebruik van afgeleide velden besproken. Vooral daar waar alternatieven een betere oplossing zijn.

NOTE
Het bewegen van logica van een afgeleid gebied in een component het plaatsen van de gegevensmening verbetert op zich niet vraagprestaties. Beide benaderingen compileren aan de zelfde onderliggende afgeleide logica. De aanbevelingen in deze sectie gaan over duidelijkheid, bestuur, en hergebruik eerder dan snelheid.

Patronen

  • Een afgeleid veld dupliceert gedrag dat al beschikbaar is in componentinstellingen:

    • Normalisatie van hoofdletters en kleine letters, bijsnijden of eenvoudig filteren (bijvoorbeeld unknown , undefined of null ) zonder extra complexiteit.

    • De basisemmer op aantalwaaiers.

      accordion
      Voorbeeld
      ​ Verkeerd gebruik van basisbucketing ​

      In plaats daarvan, gebruik ​ waarde emmer ​ op een afmeting in uw mening van Gegevens.

    • De persistentie of attributielogica codeerde met ​ Volgende of Vorige ​ of handopeenvolgingslogica waar de mening van Gegevens ​ attributie ​ en ​ vervalsing ​ montages voldoende zouden zijn.

    • Een afgeleide metrisch die eenvoudig bestaande metrisch onder een voorwaarde telt.

      accordion
      Voorbeeld
      ​ Verkeerd gebruik van voorwaardelijke logica ​

      Deze benadering herhaalt wat gefilterde metrisch of ​ omvat waarden ​ kon bereiken.

de diagnose van het Risico: gegevenskwaliteit, hoog onderhoud

  • Overbodige complexiteit: afgeleide velden worden gebruikt waar eenvoudigere ingebouwde functies voor gegevensweergave bestaan.
  • Governance-risico: andere gebruikers begrijpen mogelijk niet waarom een afgeleid veld bestaat in plaats van een native instelling. Het patroon verhoogt het beheer van afgeleide velden overzichtelijker.
  • Beperkte herbruikbaarheid: het coderen van voorwaardelijke vlaggen als afgeleide gebieden maakt het moeilijker om basismetriek met verschillende filters over projecten opnieuw te gebruiken.

Aanbevelingen

  • Bijsnijden/Kleine letters: gebruik ​ Substring ​ en ​ de componentenmontages van het Gedrag ​ tenzij u gecombineerde multi-step transformaties nodig hebt.

  • De uitsluiting van de waarde: gebruik ​ omvat waarden ​ voor metriek of afmetingswaarden op het niveau van de component van de gegevensmening, niet op een afgeleid gebied.

  • Attributie en persistentie: Gebruik de montages van de gegevensmening ​ Persistence ​ (Allocation model en Expiration) voor dimensies in plaats van het simuleren van hen op een afgeleid gebied met ​ Volgende of Vorige ​ of andere opeenvolgende logica.

  • Numerieke het opsluiten: houd het afgeleide gebied numeriek en laat de gegevensmening tot een gekloonde afmeting bovenop, eerder dan hard-coderende waaieretiketten in a ​ Geval leiden wanneer ​ ketting.

  • Voorwaardelijke logica: zet eenvoudige 0- of 1-vlaglogica om in:

    • de oorspronkelijke metrische waarde met logica voor het opnemen of uitsluiten van het waardenfilter, zoals toegepast in Analysis Workspace.
    • een gefilterde metrisch gebruikend de montagesconfiguratie van de component van de gegevensmening.

Verkeerde classificaties van metriek en afmetingen

In deze sectie wordt de onjuiste classificatie van metriek en afmetingen besproken.

Patronen

  • Een afgeleid veld produceert duidelijk:

    • Numerieke output (telling, verhouding, of rekenkunde) maar de component wordt gevormd als dimensie.
    • Categorische output (etiketten of koorden) maar de component wordt gevormd als metrisch.
  • Een afgeleid veld codeert 0/1-markeringen als tekenreeksen.

In Customer Journey Analytics kunnen numerieke velden naar afmetingen en tekenreeksvelden naar maateenheden worden afgedwongen op het niveau van de gegevensweergave, maar een verkeerde uitlijning kan leiden tot verwarrende rapportage.

De diagnose van het Risico: gegevenskwaliteit

  • Semantische mismatch: het componenttype komt niet overeen met de aard van het afgeleide resultaat, waardoor het componenttype moeilijker te analyseren of correct samen te voegen is.

Aanbevelingen

  • Als de uitvoer numeriek is:

    • Stel het componenttype in op Metric in de gegevensweergave.
    • Wanneer de component een metrische subset (bijvoorbeeld Checkout Page Views ) vertegenwoordigt, gebruikt u een gefilterde metrische waarde in de gegevensweergave in plaats van een afgeleide tekenreeks plus een berekende metrische waarde bovenaan.
  • Als de uitvoer een label is:

    • Plaats het componententype aan Dimension en vorm de ​ persistentie ​ montages (Allocation model en Expiration) dienovereenkomstig.

Logische valkuilen van marketingkanalen en campagnes

In deze sectie worden het marketingkanaal en de logische valkuilen van de campagne besproken.

NOTE
Overweeg upstream vereenvoudiging: gebruik ​ Prep van Gegevens ​, ​ raadplegingsdatasets ​, of afgeleide gebiedsfuncties zoals ​ classificeren ​ om gelijkaardige marketing kanaalregels te consolideren en het aantal exploitanten in uw ​ Geval te verminderen wanneer ​ logica. Ook, beperk het aantal high-cardinality gebieden van verwijzingen voorzien in de logica van de kanaalclassificatie (bijvoorbeeld: vele verschillende sleutels van de vraagparameter), aangezien deze gebieden zowel kardinaliteit als vraagkosten verhogen.

Patronen

  • Customer Journey Analytics-marketingkanalen worden vaak geïmplementeerd met behulp van afgeleide velden.

    • Afgeleide gebieden die marketing kanaal of campagneopsluiting uitvoeren die op URL parameters, verwijzing, landingspagina, en meer worden gebaseerd.
    • Verdacht bestellen: een generieke catch-all-regel wordt weergegeven voordat meer specifieke regels worden toegepast.
    • Onvolledige afhandeling van alle mogelijke opties: geen expliciete vertakking voor Referring Domain is not set of Query Parameter is not set .

De diagnose van het Risico: gegevenskwaliteit

  • Logische bestelfout: latere regels in de keten die mogelijk specifieke kanalen overschrijven en leiden tot onjuist geclassificeerd verkeer.
  • Onjuiste labels voor direct verkeer: onovertrokken verkeer valt in een onbedoeld kanaal of wordt aangeduid als Other .

Aanbevelingen

  • Prioriteitenvolgorde top-down afdwingen. Plaats eerst de sterkste signalen (bijvoorbeeld: interne domeinen om betaalde campagneparameters uit te sluiten).
  • Neem een laatste expliciete Otherwise set value to case op. Stel de fallback in op No value om te voorkomen dat eerdere kanalen worden overschreven. Stel de waarde niet in op Custom string value en vervolgens op Custom string value to Direct , None of Unclassified in deze catch-all-stap.
  • Gebruik sjablonen. Gebruik waar mogelijk de marketing-kanaal afgeleide-gebiedsmalplaatjes. U kunt de logica ook ten minste uitlijnen met de aanbevolen tips en trucs voor marketingkanalen die door Adobe worden aanbevolen.

Niet-genormaliseerde tekenreekssleutels die in raadplegingen worden gebruikt

In deze sectie wordt het gebruik van niet-genormaliseerde tekenreekssleutels in zoekopdrachten besproken.

Patronen

de diagnose van het Risico: De Kwaliteit van gegevens, Hoog Onderhoud

  • Het kwaliteitsrisico van gegevens: de raadplegingen ontbreken wanneer zeer belangrijke casing of whitespace van de raadplegingslijst verschilt, die tot leiden geen gelijke waarden en hiaten in het melden.

Aanbevelingen

Misbruik of overmatig gebruik van Regex

Deze sectie bespreekt het misbruik of het overbereiken van de regex functionaliteit voor afgeleide gebieden.

Patronen

de diagnose van het Risico: Prestaties, Kwaliteit van Gegevens, Hoog Onderhoud

  • Risico voor prestaties en onderhoud: complexe regex-patronen zijn moeilijker te debuggen en kunnen trager zijn.
  • Juistheidsrisico: te brede regex kan onbedoelde waarden vastleggen.

Aanbevelingen

  • De voorkeur ​ parseert URL ​ voor standaardURL elementen (domein, weg, vraagparameters) eerder dan ​ Regex vervangt ​.
  • Voor eenvoudige patrooncontroles, gebruik ​ Geval wanneer ​ met Contains, Starts with, of Ends with logica in plaats van regelmatige uitdrukkingen met ​ Regex vervangt ​.
  • Vlag regelmatige uitdrukkingen die veelvoudige genestelde groepen of alternatieven voor eenvoudige patronen gebruiken. Of reguliere expressies die u kunt vervangen door gebruik te maken van afgeleide tekenreeksfuncties.

Berekende logica in metrische stijl in afgeleide gebieden

Deze sectie bespreekt het gebruik van berekende stijllogica op een afgeleid gebied.

NOTE
Afgeleide velden worden vóór aggregatie op het niveau van de gebeurtenis (rij) geëvalueerd, terwijl Analysis Workspace berekende meetwaarden op reeds geaggregeerde waarden werken. Verhoudingen, gemiddelden en berekeningen in afzonderlijke stijl kunnen daarom verschillende resultaten opleveren, afhankelijk van het feit of deze berekeningen als een afgeleid veld of als een berekende metrische waarde zijn geïmplementeerd. Wees bewust over waar de rekenkunde leeft, want de graan van de evaluatie verandert het antwoord.

Patronen

  • Zuiver rekenkundig op numerieke gebieden binnen een afgeleid gebied (som, aftrekking, afdeling) dat als berekende metrisch kijkt.

    accordion
    Voorbeelden

    ​ Beste praktijken - de berekening van de Winst ​

    ​ Beste praktijken - orden per indruk ​ .

  • Geen gebruik van tekenreeksmanipulatie of classificatie; de logica is puur numeriek.

De diagnose van het Risico: gegevenskwaliteit

  • Governance- en ontwerpvraag: de rekenkunde kan beter worden geplaatst als:

    • Een afgeleide metrische waarde van het gebied (als u het afgeleide gebied als bestuurde standaardmetrisch voor alle gebruikers wilt).
    • Een berekende metrische waarde in Analysis Workspace (als de berekende metrische waarde analytisch specifiek is).

Aanbevelingen

  • Als het rekenkundige resultaat over het algemeen nuttig over gebruikers en projecten is, houd het resultaat als afgeleid metrisch gebied. Zorg ervoor dat het componenttype metrisch is en het formatteren (munt, percentage) wordt gevormd op het niveau van de gegevensmening.
  • Als het resultaat niche of analyst-specifiek is, verplaatst u het resultaat naar een berekende metrische waarde en vereenvoudigt u de gegevensweergave.

Te veel gebruik van de volgende of vorige of opeenvolgende functies

Deze sectie bespreekt het over-gebruik van ​ Volgende of Vorige ​ of opeenvolgende functies.

Patronen

  • Een afgeleid gebied gebruikt ​ Volgende of Vorige ​ functies veelvoudige tijden (dicht bij de gedocumenteerde grens per-gebied).
  • ​ Volgende of Vorige ​ wordt gebruikt om persistentie-als logica (bijvoorbeeld: het dragen van een campagne door:sturen) in plaats van het gebruiken van persistentie van de gegevensmening uit te voeren.

de diagnose van het Risico: gegevenskwaliteit, hoog onderhoud

  • Complexiteit en kwetsbaarheid: een zware sequentiële logica is moeilijker te begrijpen en kan breken als sessionisatieregels of het bestellen van wijzigingen.
  • De overtolligheid met afmetingspersistentie: de montages van de gegevensmening ​ Persistentie ​ (het model van de Toewijzing) op de afmeting behandelen beter sommige gebruiksgevallen (bijvoorbeeld, Laatste aanrakingskanaal op een zitting).

Aanbevelingen

  • Voor patronen die op standaardpersistentie (bijvoorbeeld, dragend een waarde over een zitting of een persoon) lijken, gebruik de 1} montages van de dimensie ​ Persistence {( en Allocation model) in de gegevensmening in plaats van het simuleren van deze patronen met Expiration Volgende of Vorige .
  • De reserve ​ Volgende of Vorige ​ voor geavanceerde multi-step weg of het etiketteren van funnel dat de afmetingspersistentie alleen niet kan bereiken (bijvoorbeeld: de aaneenschakeling van de kanaalopeenvolging).

Sessie- en persoonlijke context negeren

Deze sectie bespreekt het negeren van zitting en persoon-vlakke context wanneer het bepalen van een afgeleid gebied.

NOTE
In sommige gevallen, kan een segment dat bij de zitting of het persoonniveau in Analysis Workspace wordt behandeld het gedrag eenvoudiger modelleren dan een afgeleid gebied. Overweeg waar nodig segmenten te gebruiken in plaats van complexe afgeleide velden voor meerdere bereiken.

Patronen

  • Een afgeleid gebied veronderstelt impliciet een bepaald ​ containerniveau ​ (gebeurtenis, zitting, of persoon) maar:

    • In het afgeleide veld wordt niet verwezen naar kenmerken op sessie- of persoonniveau.
    • De montages van de de meningszitting van gegevens strijden met de voorgenomen logica.

De diagnose van het Risico: De Kwaliteit van gegevens

  • Conceptuele afwijking: afgeleide veldsemantiek komt mogelijk niet overeen met het aggregatieniveau dat analisten verwachten (bijvoorbeeld: een op personen gebaseerd veld dat bij elke gebeurtenis kan veranderen).

Aanbevelingen

  • Als de logica bedoeld is om zitting-niveau te zijn: verifieer dat ​ zittingsmontages ​ geschikt worden gevormd, en denk na gebruikend zitting-scoped componenten of samenvatting in Analysis Workspace of in een ​ geïntegreerd hulpmiddel BI ​.
  • Als de logica bedoeld is om persoon-niveau te zijn: gebruik profieldatasets of raadplegingsdatasets en verwijs deze datasets binnen afgeleide gebieden.
  • Evalueer of een zitting-scoped of persoon-scoped segment in Analysis Workspace het zelfde resultaat eenvoudigweg dan een afgeleid gebied zou bereiken.

Aanraken of naderen van gedocumenteerde functielimieten

In deze sectie worden de implicaties besproken van het aanpassen of naderen van de gedocumenteerde afgeleide functielimieten van het veld.

NOTE
Verminder afhankelijkheid van high-cardinality gebieden binnen complexe afgeleide gebieden waar mogelijk (bijvoorbeeld: gebruik genormaliseerde sleutels of gegroepeerde classificaties) om vraagkosten en de waarschijnlijkheid te beperken om ​ exploitant of functiegrenzen ​ te raken.

De Analyse van de Reis van de klant ​ documenten ​ maximumfuncties en exploitanten per afgeleid gebied, met inbegrip van grenzen per functietype.atterns**

de diagnose van het Risico: prestaties, hoog onderhoud

  • Schaalbaarheidsrisico: toekomstige toevoegingen kunnen mislukken of onverwacht gedrag vertonen als het veld de functielimiet bereikt.

Aanbevelingen

  • Markering proactief wanneer het gebruik een drempel overschrijdt (bijvoorbeeld: > 70% van een functie- of operatorlimiet).
  • Splits de logica in veelvoudige afgeleide gebieden die samen worden geketend (bijvoorbeeld: een afgeleid gebied A dat een raadplegingssleutel normaliseert, en een afgeleid gebied B dat de genormaliseerde raadplegingssleutel gebruikt om een etiket te zoeken).
  • De externe Prep van Gegevens van het gebruik of een raadplegingsdataset waar bijzonder grote classificaties nodig zijn.

Gegevensweergavespecifieke optimalisatieregels

In deze sectie worden specifieke optimalisatieregels voor gegevensweergave voor afgeleide velden besproken.

Controleer ook de configuratie van de gegevensmening voor elke afgeleide component.

Patronen

  • Een afgeleide dimensie heeft standaardattributie (bijvoorbeeld: Laatste aanraking met sessievervaldatum) maar de afgeleide veldnaam impliceert een andere semantische waarde (bijvoorbeeld: First Campaign of Visit, Original Source).
  • Een afgeleide dimensie heeft standaard ​ persistentie ​ montages (bijvoorbeeld: Most Recent toewijzing met Session vervaldatum) maar de naam van de afgeleide dimensie impliceert een verschillend semantisch (b.v., First Campaign of Visit of Original Source).

De diagnose van het Risico: gegevenskwaliteit

  • Semantische wanverhouding: het etiket van de dimensie stelt een verschillend toewijzings of vervalgedrag (bijvoorbeeld, Originele toewijzing of Person-level vervaldatum) voor dan wat eigenlijk wordt gevormd.
  • Hierdoor neemt het risico toe dat analisten rapporten verkeerd interpreteren of componenten vergelijken die op naam vergelijkbaar lijken maar verschillende toewijzingsmodellen gebruiken.

Aanbevelingen

recommendation-more-help
analytics-platform-help-main