Instellingen van subtekenreeksen substring-component-settings
Met de instellingen van de component Substring kunt u meerdere tekenreeksmanipulatiemethoden uitvoeren om de gewenste dimensie-items in rapporten op te halen.
Substring is alleen beschikbaar voor dimensies en is retroactief voor de gegevens waarop het is toegepast. Het is een directe gegevenstransformatie die gebeurt alvorens het filtreren of andere analyseverrichtingen worden toegepast.
Van links/rechts
Neem een deel van een tekenreeks op basis van zijn positie naar het begin of einde van een tekenreeks. De methoden From the Left en From the Right bevatten twee vervolgkeuzelijsten: From (waar de uitvoer begint) en To (waar de uitvoer eindigt).
-
String Start: Het begin van de tekenreeks.
-
String End: Het einde van de tekenreeks.
-
Position: Een statisch aantal tekens van links of rechts, afhankelijk van de methode.
-
String: Identiek aan een teken of reeks tekens om het begin of einde van een tekenreeks aan te geven. In deze vervolgkeuzelijst worden ook extra opties weergegeven:
- Match: De tekenreeks die moet overeenkomen. Als de input geen gelijke met dit gebied heeft, Geen waardeoptieszijn van toepassing.
- Index: De criteria van Match kunnen meerdere keren in een tekenreeks voorkomen. Dit geheel getal bepaalt welke overeenkomst wordt gebruikt om de uitvoer te starten of te beëindigen, afhankelijk van de methode. Een index van
1
vertegenwoordigt bijvoorbeeld de eerste overeenkomst. Als de index hoger is dan het aantal beschikbare gelijken, Geen waardeoptieszijn van toepassing. - Include String: Een selectievakje dat de Match -tekenreeks indien ingeschakeld in de uitvoer opneemt.
-
Length: Een geheel getal dat het aantal tekens opgeeft dat na de startpositie van de uitvoer moet worden opgenomen. Alleen beschikbaar in de vervolgkeuzelijst To .
Scheidingsteken
Gebruik deze methode voor velden die een scheidingsteken gebruiken om meerdere tekenreekswaarden van elkaar te scheiden. U kunt een afzonderlijk element extraheren om als uitvoer te gebruiken of de tekenreeks omzetten in een element in een arrayschema van een object.
-
Criterion: Hoe u de lijst met gescheiden waarden wilt behandelen.
- From the Left: begin vanaf het begin van de lijst met scheidingstekens en tel vooruit.
- From the Right: begin vanaf het einde van de lijst met scheidingstekens en tel terug.
- Convert to array: Behandel deze dimensie alsof het een element in een schema van de objectarray is.
-
Delimiter: Het scheidingsteken dat in het veld wordt gebruikt.
-
Index: Alleen aanwezig als het criterium Van links/rechts is. Het elementnummer alsof het zich in een array bevindt. Als de tekenreeksinvoer bijvoorbeeld
"Fox,Turtle,Rabbit,Wolf"
is met index 3, is de uitvoer"Rabbit"
. Als de index hoger is dan het aantal afgebakende elementen, Geen waardeoptieszijn van toepassing.
URL-parsering
Voor gebruik met velden die URL's bevatten. Met de voorbeeld-URL https://example.com/store/index.html?cid=campaign#cart
zijn de volgende opties beschikbaar:
- Get protocol: Haal het URL-protocol op. Bijvoorbeeld
"https://"
. - Get host: Haal de host van de URL op. Bijvoorbeeld
"example.com"
. - Get path: haal het pad van de URL op. Bijvoorbeeld
"store/index.html"
. - Get query string value: Haal de waarde op uit één queryreeks. Plaats de gewenste parameter voor de querytekenreeks in het veld Query key . Als de bovenstaande URL wordt gebruikt met de query-toets
"cid"
, is de uitvoer"campaign"
. - Get hash value: verwijder de hashwaarde van de URL. Bijvoorbeeld
"cart"
.
Als de input geen geldige URL is of als de gewenste component URL niet aanwezig is, Geen waardeoptieszijn van toepassing.
Verkleinen
Witruimte of speciale tekens uit de tekenreeks bijsnijden.
- Trim whitespaces: Een selectievakje waarmee alle witruimte aan het begin en einde van de tekenreeks wordt verwijderd als deze is ingeschakeld.
- Trim special characters: Een selectievakje waarmee een invoerveld van Special characters wordt weergegeven als dit is ingeschakeld. Alle tekens in dit veld worden uit de uitvoer verwijderd. Multi-bytetekens worden niet ondersteund.
Regex
Pas reguliere expressies toe op een dimensie om de gewenste waarde op te halen.
- Regex: De reguliere-expressieformule.
- Output format: Een optioneel veld waarmee u tekst kunt toevoegen of de volgorde van de uitvoer van de regex-subgroep kunt wijzigen. Als dit veld leeg is, is de tekenreeksuitvoer de geëvalueerde regex-expressie.
- Case sensitive: Een selectievakje waarmee wordt afgedwongen dat de reguliere expressie hoofdlettergevoelig is als deze is ingeschakeld.
Customer Journey Analytics gebruikt een subset van de Perl regex syntaxis. Als de input niet de regelmatige uitdrukking aanpast en Output format leeg is, Geen waardeoptiesvan toepassing zijn. De volgende expressies worden ondersteund:
a
a
.a|b
a
of b
.[abc]
a
, b
of c
.[^abc]
a
, b
of c
.[a-z]
a
- z
.[a-zA-Z0-9]
a
- z
, A
- Z
, of cijfers 0
- 9
.^
$
\A
\z
.
\s
\S
\d
\D
\w
\W
\b
\B
\<
\>
(...)
(?:...)
a?
a
.a*
a
.a+
a
.a{3}
a
.a{3,}
a
.a{3,6}
a
.Plaatsaanduidingen voor uitvoer worden ook ondersteund. U kunt deze reeksen gebruiken in Output format om het even welk aantal tijden en in om het even welke orde om de gewenste koordoutput te bereiken.
$&
$n
$1
geeft bijvoorbeeld als uitvoer de eerste subexpressie.$`
$+
$$
"$"
.