Richtlijnen voor afgeleide velden
Customer Journey Analytics afgeleide gebieden laat u transformeren, classificeren, en verrijken gegevens in vraagtijd zonder brondatasets te wijzigen. Die flexibiliteit kan complexiteit, prestatieproblemen en overhead voor onderhoud met zich meebrengen als deze zonder discipline wordt toegepast.
Dit artikel bevat richtlijnen (aanbevolen procedures, instructies en valkuilen) voor het werken met afgeleide velden. Het beoogde publiek bestaat uit gegevensarchitecten, productbeheerders en analisten die:
-
optimaliseer prestaties: Identificeer patronen die de uitvoering van vragen vertragen of systeemgrenzen raken, om het juiste hulpmiddel voor de baan te selecteren:
-
verbeter onderhoudbaarheid: Bouw afgeleide gebiedslogica die duidelijk, modulair, en gemakkelijk is bij te werken.
-
verzekert juistheid: Vermijd gemeenschappelijke logische fouten in classificatie, attributie, en gegevenstransformatie.
In dit artikel worden de secties rond de volgende thema’s gerangschikt:
- Van hoge kwaliteit afgeleide velden
- Te complexe hoofdletters/kleine letters wanneer regelketens
- Onjuist gebruik
- Verkeerde classificaties van metriek en afmetingen
- Logische valkuilen van marketingkanalen en campagnes
- Niet-genormaliseerde tekenreekssleutels die in raadplegingen worden gebruikt
- Misbruik of overmatig gebruik van Regex
- Berekende logica in metrische stijl in afgeleide gebieden
- Te veel gebruik van de volgende of vorige of opeenvolgende functies
- Sessie- en persoonlijke context negeren
- Aanraken of naderen van gedocumenteerde functielimieten
- Gegevensweergavespecifieke optimalisatieregels
Elk gedeelte omvat:
- Patronen om te ontdekken: De waarneembare signalen in uw afgeleide gebiedsdefinities.
- de diagnose van het Risico: Waarom het patroon problematisch is. Mogelijke redenen zijn negatieve gevolgen op prestaties, gegevenskwaliteit, of onderhoud.
- Aanbevelingen: Concrete stappen om de implementatie te weerspiegelen of te verbeteren.
Deze richtlijnen helpen u om efficiënte, scalable, en semantisch correcte implementaties in Customer Journey Analytics tot stand te brengen. Pas deze richtlijnen toe wanneer u bestaande gegevensmeningen controleert, nieuwe afgeleide gebieden ontwerpt, of beheersingshulpmiddelen bouwt.
Van hoge kwaliteit afgeleide velden
Deze sectie bespreekt standaardsegmenten van de gegevensmening die high-cardinality afgeleide gebieden van verwijzingen voorzien.
Patronen
- De meningsstandaardsegmenten van gegevens die van verwijzingen voorzien een afgeleid gebied dat op een high-cardinaliteitsdimensie (ongeveer één miljoen of meer verschillende waarden) wordt voortgebouwd. Bijvoorbeeld: URL van volledige pagina.
- De eenvoudige verrichtingen zoals Kleine letters , Versiering , of Geval wanneer controles op pagina URL vaak duurder zijn dan de zelfde logica op laag-kardinaliteitsgebieden.
De diagnose van het Risico: prestaties
- De standaardsegmenten die op afgeleide gebieden filtreren die pagina URL of andere high-cardinality afmetingen raken voegen latentie aan elke vraag tegen de gegevensmening toe.
Aanbevelingen
- Verwijs niet rechtstreeks naar volledige pagina-URL’s of soortgelijke high-cardinality componenten in de standaardsegmenten van de gegevensweergave. Duw zware logica URL (complex Geval wanneer , Regex vervangt, veelvoudige koordfuncties) stroomopwaarts tot Prep van Gegevens of raadplegingsdatasets zodat de resulterende classificaties op eenvoudigere, laag-kardinaliteitsdimensies landen.
- Voorkeur voor achterste-kardinaalsleutels zoals genormaliseerde paginanaam, plaatssectie, of pre-gerubriceerde URL groepen.
- De bestaande standaardsegmenten van de gegevensmening en afgeleide gebieden van de periodieke controle voor verwijzingen naar high-cardinaliteitsafmetingen (pagina URL, campagne IDs, ruwe vraagkoorden) en refactor aan genormaliseerde of gegroepeerde sleutels.
Te complexe hoofdletters/kleine letters wanneer regelketens
Deze sectie bespreekt over-complexe ketens van Geval wanneer regels.
Customer Journey Analytics dwingt expliciete functie en exploitantgrenzen per afgeleid gebied (bijvoorbeeld, maximumaantal exploitanten, maximumaantal functie per type) af. Te complexe functies en ketens binnen functies zijn moeilijker te onderhouden en vertonen meer fouten.
Patronen
-
Zeer groot Geval wanneer met complexe If en Else If ketens werkt:
- Vele voorwaarden (bijvoorbeeld: meer dan 20 exploitanten) of diep het nesten (meer dan 3 of 4 niveaus van genestelde Geval wanneer If en Else If logica).
- Herhaalde voorwaarden in hetzelfde veld met verschillende waarden.
-
Herhaalde overeenkomende constante tekenreeks.
accordion Voorbeeld
de diagnose van het Risico: prestaties, gegevenskwaliteit, hoog onderhoud
- Onderhoud en foutenrisico: logica die als monolithisch regelblok wordt gecodeerd is moeilijk om te zuiveren en bij te werken.
- Potentiële prestaties en beperkingsrisico: u kunt exploitant of functielimieten raken of benaderen, vooral met classificeren-als patronen.
Aanbevelingen
- Splitsen op meerdere afgeleide velden. Bijvoorbeeld, afzonderlijke campagne normalisatie (het in kaart brengen van inconsistente campagneherkenningstekens aan een canonieke waarde) van kanaalsluiting in plaats van het combineren van alles in één reuzenregel.
- Gebruik opzoekgegevenssets. Vele If Value _2} criterium van de waarde Criterium dan plaats waarde aan waarde _voorwaarden worden beter uitgevoerd als araadplegingsdataset gecombineerd met de 10} functie van de Opzoekmachine {in plaats van het gebruiken van lange Geval wanneer ketens.🔗
- Filters van gegevensweergavecomponenten gebruiken. Als een deel van de logica eenvoudig slechte waarden uitfiltert, omvat het gebruik op het niveau van de component van de gegevensmening in plaats van het inbedden die logica in een afgeleid gebied.
Onjuist gebruik
In deze sectie wordt het onjuiste gebruik van afgeleide velden besproken. Vooral daar waar alternatieven een betere oplossing zijn.
Patronen
-
Een afgeleid veld dupliceert gedrag dat al beschikbaar is in componentinstellingen:
-
Normalisatie van hoofdletters en kleine letters, bijsnijden of eenvoudig filteren (bijvoorbeeld
unknown,undefinedofnull) zonder extra complexiteit. -
De basisemmer op aantalwaaiers.
accordion Voorbeeld
In plaats daarvan, gebruik waarde emmer op een afmeting in uw mening van Gegevens.
-
De persistentie of attributielogica codeerde met Volgende of Vorige of handopeenvolgingslogica waar de mening van Gegevens attributie en vervalsing montages voldoende zouden zijn.
-
Een afgeleide metrisch die eenvoudig bestaande metrisch onder een voorwaarde telt.
accordion Voorbeeld
Deze benadering herhaalt wat gefilterde metrisch of omvat waarden kon bereiken.
-
de diagnose van het Risico: gegevenskwaliteit, hoog onderhoud
- Overbodige complexiteit: afgeleide velden worden gebruikt waar eenvoudigere ingebouwde functies voor gegevensweergave bestaan.
- Governance-risico: andere gebruikers begrijpen mogelijk niet waarom een afgeleid veld bestaat in plaats van een native instelling. Het patroon verhoogt het beheer van afgeleide velden overzichtelijker.
- Beperkte herbruikbaarheid: het coderen van voorwaardelijke vlaggen als afgeleide gebieden maakt het moeilijker om basismetriek met verschillende filters over projecten opnieuw te gebruiken.
Aanbevelingen
-
Bijsnijden/Kleine letters: gebruik Substring en de componentenmontages van het Gedrag tenzij u gecombineerde multi-step transformaties nodig hebt.
-
De uitsluiting van de waarde: gebruik omvat waarden voor metriek of afmetingswaarden op het niveau van de component van de gegevensmening, niet op een afgeleid gebied.
-
Attributie en persistentie: Gebruik de montages van de gegevensmening Persistence (Allocation model en Expiration) voor dimensies in plaats van het simuleren van hen op een afgeleid gebied met Volgende of Vorige of andere opeenvolgende logica.
-
Numerieke het opsluiten: houd het afgeleide gebied numeriek en laat de gegevensmening tot een gekloonde afmeting bovenop, eerder dan hard-coderende waaieretiketten in a Geval leiden wanneer ketting.
-
Voorwaardelijke logica: zet eenvoudige 0- of 1-vlaglogica om in:
- de oorspronkelijke metrische waarde met logica voor het opnemen of uitsluiten van het waardenfilter, zoals toegepast in Analysis Workspace.
- een gefilterde metrisch gebruikend de montagesconfiguratie van de component van de gegevensmening.
Verkeerde classificaties van metriek en afmetingen
In deze sectie wordt de onjuiste classificatie van metriek en afmetingen besproken.
Patronen
-
Een afgeleid veld produceert duidelijk:
- Numerieke output (telling, verhouding, of rekenkunde) maar de component wordt gevormd als dimensie.
- Categorische output (etiketten of koorden) maar de component wordt gevormd als metrisch.
-
Een afgeleid veld codeert 0/1-markeringen als tekenreeksen.
In Customer Journey Analytics kunnen numerieke velden naar afmetingen en tekenreeksvelden naar maateenheden worden afgedwongen op het niveau van de gegevensweergave, maar een verkeerde uitlijning kan leiden tot verwarrende rapportage.
De diagnose van het Risico: gegevenskwaliteit
- Semantische mismatch: het componenttype komt niet overeen met de aard van het afgeleide resultaat, waardoor het componenttype moeilijker te analyseren of correct samen te voegen is.
Aanbevelingen
-
Als de uitvoer numeriek is:
- Stel het componenttype in op Metric in de gegevensweergave.
- Wanneer de component een metrische subset (bijvoorbeeld Checkout Page Views ) vertegenwoordigt, gebruikt u een gefilterde metrische waarde in de gegevensweergave in plaats van een afgeleide tekenreeks plus een berekende metrische waarde bovenaan.
-
Als de uitvoer een label is:
- Plaats het componententype aan Dimension en vorm de persistentie montages (Allocation model en Expiration) dienovereenkomstig.
Logische valkuilen van marketingkanalen en campagnes
In deze sectie worden het marketingkanaal en de logische valkuilen van de campagne besproken.
Patronen
-
Customer Journey Analytics-marketingkanalen worden vaak geïmplementeerd met behulp van afgeleide velden.
- Afgeleide gebieden die marketing kanaal of campagneopsluiting uitvoeren die op URL parameters, verwijzing, landingspagina, en meer worden gebaseerd.
- Verdacht bestellen: een generieke catch-all-regel wordt weergegeven voordat meer specifieke regels worden toegepast.
- Onvolledige afhandeling van alle mogelijke opties: geen expliciete vertakking voor Referring Domain is not set of Query Parameter is not set .
De diagnose van het Risico: gegevenskwaliteit
- Logische bestelfout: latere regels in de keten die mogelijk specifieke kanalen overschrijven en leiden tot onjuist geclassificeerd verkeer.
- Onjuiste labels voor direct verkeer: onovertrokken verkeer valt in een onbedoeld kanaal of wordt aangeduid als
Other.
Aanbevelingen
- Prioriteitenvolgorde top-down afdwingen. Plaats eerst de sterkste signalen (bijvoorbeeld: interne domeinen om betaalde campagneparameters uit te sluiten).
- Neem een laatste expliciete Otherwise set value to case op. Stel de fallback in op No value om te voorkomen dat eerdere kanalen worden overschreven. Stel de waarde niet in op Custom string value en vervolgens op Custom string value to
Direct,NoneofUnclassifiedin deze catch-all-stap. - Gebruik sjablonen. Gebruik waar mogelijk de marketing-kanaal afgeleide-gebiedsmalplaatjes. U kunt de logica ook ten minste uitlijnen met de aanbevolen tips en trucs voor marketingkanalen die door Adobe worden aanbevolen.
Niet-genormaliseerde tekenreekssleutels die in raadplegingen worden gebruikt
In deze sectie wordt het gebruik van niet-genormaliseerde tekenreekssleutels in zoekopdrachten besproken.
Patronen
- A functie van de Opzoekup over een gebeurtenis of profielgebied dat een raadplegingsdataset van het voer voorziet.
- Geen voorafgaand Kleine letters , Versiering , of Regex vervangt normaliseert de sleutel.
- Veelvoorkomende kandidaten: URL, campagne-id, e-mail, account-id.
de diagnose van het Risico: De Kwaliteit van gegevens, Hoog Onderhoud
- Het kwaliteitsrisico van gegevens: de raadplegingen ontbreken wanneer zeer belangrijke casing of whitespace van de raadplegingslijst verschilt, die tot leiden geen gelijke waarden en hiaten in het melden.
Aanbevelingen
- Voeg in kleine letters en de functies van de Versiering vóór de Opzoeken functie toe tenzij er een gedocumenteerde reden is om hogere of lagere letters te bewaren.
- Als er al meerdere transformaties zijn gekoppeld, controleert u eerst de volgorde: eerst normaliseren en vervolgens opzoeken.
Misbruik of overmatig gebruik van Regex
Deze sectie bespreekt het misbruik of het overbereiken van de regex functionaliteit voor afgeleide gebieden.
Patronen
-
Regex vervangt of regex-Gebaseerde voorwaarden gebruiken brede patronen; eenvoudiger Geval wanneer functies met Contains of Starts with betere alternatieven zijn.
accordion Voorbeeld
-
Meerdere regex-voorwaarden overlappen of veroorzaken een conflict.
-
Het zware regexgebruik om URLs in plaats van het gebruiken van de te ontleden functie URL .
de diagnose van het Risico: Prestaties, Kwaliteit van Gegevens, Hoog Onderhoud
- Risico voor prestaties en onderhoud: complexe regex-patronen zijn moeilijker te debuggen en kunnen trager zijn.
- Juistheidsrisico: te brede regex kan onbedoelde waarden vastleggen.
Aanbevelingen
- De voorkeur parseert URL voor standaardURL elementen (domein, weg, vraagparameters) eerder dan Regex vervangt .
- Voor eenvoudige patrooncontroles, gebruik Geval wanneer met Contains, Starts with, of Ends with logica in plaats van regelmatige uitdrukkingen met Regex vervangt .
- Vlag regelmatige uitdrukkingen die veelvoudige genestelde groepen of alternatieven voor eenvoudige patronen gebruiken. Of reguliere expressies die u kunt vervangen door gebruik te maken van afgeleide tekenreeksfuncties.
Berekende logica in metrische stijl in afgeleide gebieden
Deze sectie bespreekt het gebruik van berekende stijllogica op een afgeleid gebied.
Patronen
-
Zuiver rekenkundig op numerieke gebieden binnen een afgeleid gebied (som, aftrekking, afdeling) dat als berekende metrisch kijkt.
accordion Voorbeelden
.
-
Geen gebruik van tekenreeksmanipulatie of classificatie; de logica is puur numeriek.
De diagnose van het Risico: gegevenskwaliteit
-
Governance- en ontwerpvraag: de rekenkunde kan beter worden geplaatst als:
- Een afgeleide metrische waarde van het gebied (als u het afgeleide gebied als bestuurde standaardmetrisch voor alle gebruikers wilt).
- Een berekende metrische waarde in Analysis Workspace (als de berekende metrische waarde analytisch specifiek is).
Aanbevelingen
- Als het rekenkundige resultaat over het algemeen nuttig over gebruikers en projecten is, houd het resultaat als afgeleid metrisch gebied. Zorg ervoor dat het componenttype metrisch is en het formatteren (munt, percentage) wordt gevormd op het niveau van de gegevensmening.
- Als het resultaat niche of analyst-specifiek is, verplaatst u het resultaat naar een berekende metrische waarde en vereenvoudigt u de gegevensweergave.
Te veel gebruik van de volgende of vorige of opeenvolgende functies
Deze sectie bespreekt het over-gebruik van Volgende of Vorige of opeenvolgende functies.
Patronen
- Een afgeleid gebied gebruikt Volgende of Vorige functies veelvoudige tijden (dicht bij de gedocumenteerde grens per-gebied).
- Volgende of Vorige wordt gebruikt om persistentie-als logica (bijvoorbeeld: het dragen van een campagne door:sturen) in plaats van het gebruiken van persistentie van de gegevensmening uit te voeren.
de diagnose van het Risico: gegevenskwaliteit, hoog onderhoud
- Complexiteit en kwetsbaarheid: een zware sequentiële logica is moeilijker te begrijpen en kan breken als sessionisatieregels of het bestellen van wijzigingen.
- De overtolligheid met afmetingspersistentie: de montages van de gegevensmening Persistentie (het model van de Toewijzing) op de afmeting behandelen beter sommige gebruiksgevallen (bijvoorbeeld, Laatste aanrakingskanaal op een zitting).
Aanbevelingen
- Voor patronen die op standaardpersistentie (bijvoorbeeld, dragend een waarde over een zitting of een persoon) lijken, gebruik de 1} montages van de dimensie Persistence {( en Allocation model) in de gegevensmening in plaats van het simuleren van deze patronen met Expiration Volgende of Vorige .
- De reserve Volgende of Vorige voor geavanceerde multi-step weg of het etiketteren van funnel dat de afmetingspersistentie alleen niet kan bereiken (bijvoorbeeld: de aaneenschakeling van de kanaalopeenvolging).
Sessie- en persoonlijke context negeren
Deze sectie bespreekt het negeren van zitting en persoon-vlakke context wanneer het bepalen van een afgeleid gebied.
Patronen
-
Een afgeleid gebied veronderstelt impliciet een bepaald containerniveau (gebeurtenis, zitting, of persoon) maar:
- In het afgeleide veld wordt niet verwezen naar kenmerken op sessie- of persoonniveau.
- De montages van de de meningszitting van gegevens strijden met de voorgenomen logica.
De diagnose van het Risico: De Kwaliteit van gegevens
- Conceptuele afwijking: afgeleide veldsemantiek komt mogelijk niet overeen met het aggregatieniveau dat analisten verwachten (bijvoorbeeld: een op personen gebaseerd veld dat bij elke gebeurtenis kan veranderen).
Aanbevelingen
- Als de logica bedoeld is om zitting-niveau te zijn: verifieer dat zittingsmontages geschikt worden gevormd, en denk na gebruikend zitting-scoped componenten of samenvatting in Analysis Workspace of in een geïntegreerd hulpmiddel BI .
- Als de logica bedoeld is om persoon-niveau te zijn: gebruik profieldatasets of raadplegingsdatasets en verwijs deze datasets binnen afgeleide gebieden.
- Evalueer of een zitting-scoped of persoon-scoped segment in Analysis Workspace het zelfde resultaat eenvoudigweg dan een afgeleid gebied zou bereiken.
Aanraken of naderen van gedocumenteerde functielimieten
In deze sectie worden de implicaties besproken van het aanpassen of naderen van de gedocumenteerde afgeleide functielimieten van het veld.
De Analyse van de Reis van de klant documenten maximumfuncties en exploitanten per afgeleid gebied, met inbegrip van grenzen per functietype.atterns**
- Een afgeleid gebied gebruikt vele Opzoeken , Wiskundige verrichtingen, Gesplitst of andere functies.
- Het aantal exploitanten is dichtbij de gedocumenteerde grenzen (bijvoorbeeld: meer dan 70% - 80% van toegestane aantallen).
de diagnose van het Risico: prestaties, hoog onderhoud
- Schaalbaarheidsrisico: toekomstige toevoegingen kunnen mislukken of onverwacht gedrag vertonen als het veld de functielimiet bereikt.
Aanbevelingen
- Markering proactief wanneer het gebruik een drempel overschrijdt (bijvoorbeeld: > 70% van een functie- of operatorlimiet).
- Splits de logica in veelvoudige afgeleide gebieden die samen worden geketend (bijvoorbeeld: een afgeleid gebied A dat een raadplegingssleutel normaliseert, en een afgeleid gebied B dat de genormaliseerde raadplegingssleutel gebruikt om een etiket te zoeken).
- De externe Prep van Gegevens van het gebruik of een raadplegingsdataset waar bijzonder grote classificaties nodig zijn.
Gegevensweergavespecifieke optimalisatieregels
In deze sectie worden specifieke optimalisatieregels voor gegevensweergave voor afgeleide velden besproken.
Controleer ook de configuratie van de gegevensmening voor elke afgeleide component.
Patronen
- Een afgeleide dimensie heeft standaardattributie (bijvoorbeeld: Laatste aanraking met sessievervaldatum) maar de afgeleide veldnaam impliceert een andere semantische waarde (bijvoorbeeld:
First Campaign of Visit,Original Source). - Een afgeleide dimensie heeft standaard persistentie montages (bijvoorbeeld: Most Recent toewijzing met Session vervaldatum) maar de naam van de afgeleide dimensie impliceert een verschillend semantisch (b.v.,
First Campaign of VisitofOriginal Source).
De diagnose van het Risico: gegevenskwaliteit
- Semantische wanverhouding: het etiket van de dimensie stelt een verschillend toewijzings of vervalgedrag (bijvoorbeeld, Originele toewijzing of Person-level vervaldatum) voor dan wat eigenlijk wordt gevormd.
- Hierdoor neemt het risico toe dat analisten rapporten verkeerd interpreteren of componenten vergelijken die op naam vergelijkbaar lijken maar verschillende toewijzingsmodellen gebruiken.
Aanbevelingen
- Pas het toewijzingsmodel en de vervaldatum op die afmeting aan om naam en gedrag te richten. Een afgeleide velddimensie met de naam
Original Sourcemoet bijvoorbeeld de functie Eerste aanraakkenmerk gebruiken en de vervaldatum ingesteld op Person. - Pas Allocation model en Expiration in de 2} persistentie montages van de dimensie aan om naam en gedrag te richten.
Original Sourcemoet bijvoorbeeld de eigenschap Allocation model to Original instellen met Expiration ingesteld op Person .