As configurações do componente Substring permitem executar métodos de manipulação de sequência de caracteres para obter os itens de dimensão desejados nos relatórios.
Substring está disponível somente em dimensões e é retroativa aos dados aos quais é aplicada. É uma transformação imediata de dados que ocorre antes da aplicação da filtragem ou de outras operações de análise.
Pegue uma parte de uma string com base em sua posição no início ou no fim de uma string. Da esquerda e Da direita Os métodos do fornecem duas listas suspensas: De (onde a saída começa) e Para (onde a saída termina).
1
representa a primeira correspondência. Se o índice for superior ao número de correspondências disponíveis, Nenhuma opção de valor será aplicada.Use esse método para campos que usam um delimitador para separar vários valores de string. Você pode extrair um elemento individual para usar como saída ou converter a string em um elemento de esquema da matriz de objetos.
"Fox,Turtle,Rabbit,Wolf"
com um índice de 3, a saída é "Rabbit"
. Se o índice for maior que o número de elementos delimitados, Nenhuma opção de valor será aplicada.Para uso com campos que contêm URLs. Usando o URL de exemplo https://example.com/store/index.html?cid=campaign#cart
, as seguintes opções estão disponíveis:
"https://"
."example.com"
."store/index.html"
."cid"
, a saída será "campaign"
."cart"
.Se a entrada não for um URL válido ou se o componente de URL desejado não estiver presente, Nenhuma opção de valor será aplicada.
Cortar espaço em branco ou caracteres especiais da string.
Aplique expressões regulares a uma dimensão para recuperar o valor desejado.
O Customer Journey Analytics usa um subconjunto da sintaxe de regex Perl. Se a entrada não corresponder à expressão regular e a variável Formato de saída estiver em branco, Nenhuma opção de valor será aplicada. As seguintes expressões são suportadas:
Expressão | Descrição |
---|---|
a |
Um caractere único a . |
a|b |
Um caractere único a ou b . |
[abc] |
Um caractere único a , b ou c . |
[^abc] |
Qualquer caractere único exceto a , b ou c . |
[a-z] |
Qualquer caractere único no intervalo de a -z . |
[a-zA-Z0-9] |
Qualquer caractere único no intervalo de a -z , A -Z ou dígitos 0 -9 . |
^ |
Corresponde ao início da linha. |
$ |
Corresponde ao final da linha. |
\A |
Início da sequência. |
\z |
Final da sequência. |
. |
Corresponde a qualquer caractere. |
\s |
Qualquer caractere invisível. |
\S |
Sem caracteres diferentes de invisíveis. |
\d |
Qualquer dígito. |
\D |
Qualquer não dígito. |
\w |
Qualquer letra, número ou sublinhado. |
\W |
Qualquer caractere que não seja da palavra. |
\b |
Qualquer limite da palavra. |
\B |
Qualquer caractere que não seja um limite de palavra. |
\< |
Início da palavra. |
\> |
Fim da palavra. |
(...) |
Capturar tudo delimitado. |
(?:...) |
Captura sem marcação. Impede que a correspondência seja referenciada na string de saída. |
a? |
Zero ou um de a . |
a* |
Zero ou mais de a . |
a+ |
Um ou mais de a . |
a{3} |
Exatamente 3 de a . |
a{3,} |
3 ou mais de a . |
a{3,6} |
Entre 3 e 6 de a . |
Espaços reservados de saída também são permitidos. É possível usar essas sequências no Formato de saída qualquer número de vezes e em qualquer ordem para alcançar a saída da string desejada.
Sequência de espaço reservado de saída | Descrição |
---|---|
$& |
Gera o que correspondeu à expressão inteira. |
$n |
Gera o que correspondeu à subexpressão nth. Por exemplo, o $1 gera a primeira subexpressão. |
$` |
Gera o texto entre o fim da última correspondência encontrada (ou o início do texto se nenhuma correspondência anterior foi encontrada) e o início da correspondência atual. |
$+ |
Gera o que correspondeu à última subexpressão marcada na expressão regular. |
$$ |
Gera o caractere de string "$" . |