Configurações do componente Substring

As configurações do componente Substring permitem executar métodos de manipulação de sequência de caracteres para obter os itens de dimensão desejados nos relatórios.

Configurações de substrings

Substring está disponível somente em dimensões e é retroativa aos dados aos quais é aplicada. É uma transformação imediata de dados que ocorre antes da aplicação da filtragem ou de outras operações de análise.

Da esquerda/direita

Pegue uma parte de uma string com base em sua posição no início ou no fim de uma string. Da esquerda e Da direita Os métodos do fornecem duas listas suspensas: De (onde a saída começa) e Para (onde a saída termina).

  • Início da string: o início da string.

  • Fim da string: o fim da string.

  • Posição: um número estático de caracteres da esquerda ou direita, dependendo do método.

  • String: corresponder a um caractere ou sequência de caracteres para indicar o início ou o fim de uma string. Essa lista suspensa também revela opções adicionais:

    • Corresponder: a string que será correspondida. Se a entrada não tiver correspondência com esse campo, Nenhuma opção de valor será aplicada.
    • Índice: o critério Corresponder pode ser apresentado várias vezes em uma string. Esse número inteiro determina qual correspondência deve iniciar ou finalizar a saída, dependendo do método. Por exemplo, um índice de 1 representa a primeira correspondência. Se o índice for superior ao número de correspondências disponíveis, Nenhuma opção de valor será aplicada.
    • Incluir string: uma caixa de seleção que inclui a string Corresponder na saída, se ativada.
  • Comprimento: um número inteiro que especifica a contagem de caracteres a ser incluída após a posição inicial da saída. Disponível somente sob o Para lista suspensa.

Delimitador

Use esse método para campos que usam um delimitador para separar vários valores de string. Você pode extrair um elemento individual para usar como saída ou converter a string em um elemento de esquema da matriz de objetos.

  • Critério: como você deseja tratar a lista delimitada de valores.

    • Da Esquerda: comece a partir do início da lista delimitada e conte para a frente.
    • Da direita: comece no final da lista delimitada e conte para trás.
    • Converter em matriz: trate essa dimensão como se fosse um elemento de esquema da matriz de objetos.
  • Delimitador: o delimitador usado pelo campo.

  • Índice: presente somente se o critério for Da esquerda/direita. O número do elemento como se ele estivesse em uma matriz. Por exemplo, se a entrada da string for "Fox,Turtle,Rabbit,Wolf" com um índice de 3, a saída é "Rabbit". Se o índice for maior que o número de elementos delimitados, Nenhuma opção de valor será aplicada.

Análise de URL

Para uso com campos que contêm URLs. Usando o URL de exemplo https://example.com/store/index.html?cid=campaign#cart, as seguintes opções estão disponíveis:

  • Obter protocolo: obtenha o protocolo do URL. Por exemplo, "https://".
  • Obter host: obtenha o host do URL. Por exemplo, "example.com".
  • Obter caminho: obtenha o caminho do URL. Por exemplo, "store/index.html".
  • Obter valor da string de consulta: obtenha o valor de uma única string de consulta. Coloque o parâmetro da string de consulta desejado o campo Chave de consulta. Se o URL acima for usado com a chave de consulta "cid", a saída será "campaign".
  • Obter valor de hash: obtenha o valor de hash do URL. Por exemplo, "cart".

Se a entrada não for um URL válido ou se o componente de URL desejado não estiver presente, Nenhuma opção de valor será aplicada.

Aparar

Cortar espaço em branco ou caracteres especiais da string.

  • Aparar espaços em branco: uma caixa de seleção que remove todos os espaços em branco no início e no fim da cadeia de caracteres, se ativada.
  • Aparar caracteres especiais: uma caixa de seleção que revela um campo de entrada Caracteres especiais, se ativado. Todos os caracteres neste campo são removidos da saída. Caracteres multibyte não são aceitos.

Regex

Aplique expressões regulares a uma dimensão para recuperar o valor desejado.

  • Regex: a fórmula da expressão regular.
  • Formato de saída: um campo opcional que permite adicionar texto ou reordenar a saída do subgrupo regex. Se esse campo estiver em branco, a saída da string será a expressão regex avaliada.
  • Diferenciação de maiúsculas e minúsculas: uma caixa de seleção que força a expressão regular a diferenciar maiúsculas de minúsculas, se estiver ativada.

O Customer Journey Analytics usa um subconjunto da sintaxe de regex Perl. Se a entrada não corresponder à expressão regular e a variável Formato de saída estiver em branco, Nenhuma opção de valor será aplicada. As seguintes expressões são suportadas:

Expressão
Descrição
a
Um caractere único a.
a|b
Um caractere único a ou b.
[abc]
Um caractere único a, b ou c.
[^abc]
Qualquer caractere único exceto a, b ou c.
[a-z]
Qualquer caractere único no intervalo de a-z.
[a-zA-Z0-9]
Qualquer caractere único no intervalo de a-z, A-Z ou dígitos 0-9.
^
Corresponde ao início da linha.
$
Corresponde ao final da linha.
\A
Início da sequência.
\z
Final da sequência.
.
Corresponde a qualquer caractere.
\s
Qualquer caractere invisível.
\S
Sem caracteres diferentes de invisíveis.
\d
Qualquer dígito.
\D
Qualquer não dígito.
\w
Qualquer letra, número ou sublinhado.
\W
Qualquer caractere que não seja da palavra.
\b
Qualquer limite da palavra.
\B
Qualquer caractere que não seja um limite de palavra.
\<
Início da palavra.
\>
Fim da palavra.
(...)
Capturar tudo delimitado.
(?:...)
Captura sem marcação. Impede que a correspondência seja referenciada na string de saída.
a?
Zero ou um de a.
a*
Zero ou mais de a.
a+
Um ou mais de a.
a{3}
Exatamente 3 de a.
a{3,}
3 ou mais de a.
a{3,6}
Entre 3 e 6 de a.

Espaços reservados de saída também são permitidos. É possível usar essas sequências no Formato de saída qualquer número de vezes e em qualquer ordem para alcançar a saída da string desejada.

Sequência de espaço reservado de saída
Descrição
$&
Gera o que correspondeu à expressão inteira.
$n
Gera o que correspondeu à subexpressão nth. Por exemplo, o $1 gera a primeira subexpressão.
$`
Gera o texto entre o fim da última correspondência encontrada (ou o início do texto se nenhuma correspondência anterior foi encontrada) e o início da correspondência atual.
$+
Gera o que correspondeu à última subexpressão marcada na expressão regular.
$$
Gera o caractere de string "$".
recommendation-more-help
080e5213-7aa2-40d6-9dba-18945e892f79