Sobre Palavras e Idioma

Você pode usar Words & Language para determinar como os termos de pesquisa são correspondidos ao conteúdo das páginas da Web.

Uso de palavras e idiomas

Antes de os efeitos das Words & Language configurações estarem disponíveis para os visitantes do site, incluindo quaisquer alterações feitas nessas configurações, você deve gerar novamente o índice do site. A regeneração, diferentemente da indexação, não envolve o rastreamento de páginas da Web e leva apenas alguns segundos.

Configurar a correspondência entre os termos de pesquisa e o conteúdo da Web

Você pode usar Palavras e idiomas para determinar como a pesquisa/comercialização do site corresponde os termos de pesquisa ao conteúdo de suas páginas da Web.

Para configurar a correspondência dos termos de pesquisa com o conteúdo da Web

  1. No menu do produto, clique em Linguistics > Words & Language.

  2. Na Words & Languages página, defina as opções desejadas.

    Opção

    Descrição

    Uso de maiúsculas e minúsculas

    Não selecionado por padrão.

    Determina se letras maiúsculas são diferenciadas das letras minúsculas. Por exemplo, quando selecionado, "Êxito" é diferenciado de "bem-sucedido", e os resultados da pesquisa podem variar entre os dois.

    Sensibilidade diacrítica

    Selecionado por padrão.

    Determina se as palavras que contêm caracteres diacríticos são distintas das palavras que não o fazem. Por exemplo, quando selecionada, a "pagina" é destacada do "início". Desmarque essa opção se você tiver um site que use idiomas diferentes do inglês.

    Números

    Selecionado por padrão.

    Determina se as palavras que contêm dígitos são indexadas.

    Ignorar apóstrofos

    Não selecionado por padrão.

    Os apóstrofos são removidos das consultas. Por exemplo, uma pesquisa por "Árvores" retornaria os mesmos resultados que uma pesquisa por "Árvores".

    Ignorar hífens

    Não selecionado por padrão.

    Os hífens são removidos das consultas. Por exemplo, uma busca por "sinal azul" retornaria os mesmos resultados que uma busca por "bluebell".

    Correspondência alfanumérica parcial

    Não selecionado por padrão.

    Quando selecionada, essa opção permite dividir tokens em transições alfabéticas-numéricas para permitir correspondências de texto livre em tokens de parte ou de produto.

    Por exemplo, suponha que você tenha um identificador de produto de 910XT no conteúdo do corpo de uma ou mais páginas em um site. Quando essa opção não está selecionada, o Adobe Search&Promote encontra correspondências para esse identificador de produto ao pesquisar por 910XT . Além disso, com a opção Pesquisar Concat-Div-Enable ativada, o Adobe Search&Promote também encontraria 910 XT . No entanto, não encontraria casos de 910 ou XT exclusivamente.

    Quando você seleciona Correspondência alfanumérica parcial , o indexador divide esses tokens alfanuméricos mistos em vários tokens. Por exemplo, um identificador de produto como XYZ123 é indexado em três tokens: XYZ123 , XYZ , e 123 . Essa funcionalidade permite a correspondência de texto livre em tempo de pesquisa em qualquer uma dessas variantes.

    Em outro exemplo, suponha que você tenha o identificador de produto AB910XT . Se você selecionar Correspondência alfanumérica Parcial e a opção Pesquisar Concat-Div-Enable estiver ativada, o Adobe Search&Promote o indexará como AB910XT , AB, 910, e XT. Em seguida, quando um usuário pesquisa por 910XT , por exemplo, a pesquisa é expandida para também localizar instâncias de 910XT , 910 ou XT .

    Observação: Por padrão, a opção Pesquisar Concat-Div-Enable não está ativada. Entre em contato com o suporte técnico para ativar o recurso para uso.

    Observação: A Correspondência alfanumérica parcial é aplicada globalmente a todos os campos indexados. No entanto, afeta apenas a correspondência de texto livre; não afeta a correspondência exata nem a correspondência de intervalo.

    Correspondência semelhante a som

    Selecionado por padrão.

    Palavras que soam iguais são correspondidas como "saúde" e "saúde". Esse recurso permite que o cliente pesquise facilmente, apesar de uma palavra ter sido escrita incorretamente.

    Formulários do Word Alternativo

    O padrão é Formulários do Word alternativospadrão.

    É possível selecionar uma das seguintes opções na lista suspensa Formulários do Word alternativos:

    • None

      Nenhuma forma de texto de origem ou alternativa é aplicada durante a indexação.

    • Formulários do Word Alternativo Padrão

      A depuração é feita automaticamente durante a indexação.

    • Dicionário de domínio

      Qualquer dicionário de domínio definido como um dicionário de origem é usado como uma fonte de formulários de palavras alternativas.

      Consulte Sobre dicionários .

      Consulte Configurar um dicionário como um dicionário de origem .

    Se a origem de frases estiver ativada no Adobe Search&Promote , esteja ciente de que formulários de palavras alternativas também ocorrem dentro de frases.

    Consulte Search&Promote 8.15.0 Release Notes (19/6/2014) .

    Idioma

    O padrão é inglês (Estados Unidos).

    O idioma selecionado garante que os valores numéricos e de data sejam analisados de acordo com as convenções usadas na parte selecionada do mundo.

    Quando Formulários do Word alternativos estiver definido como Padrão de formulários do Word alternativos ou como Dicionário de domínio, os formulários do Word e as terminações do texto serão alterados de acordo com as regras linguísticas do idioma selecionado.

    Por padrão, a configuração Idioma não é usada para determinar o idioma das páginas lidas do site. O idioma de uma página de leitura é determinado a partir de seus cabeçalhos HTTP ou de métricas dentro da própria página. Seu site pode conter páginas em vários idiomas diferentes. Cada página é lida e indexada corretamente, independentemente do idioma selecionado aqui.

    Se você usar uma codificação de conjunto de caracteres Unicode, como UTF-8, para algumas páginas do seu site, certifique-se de que o idioma de cada uma dessas páginas esteja especificado corretamente. Se os cabeçalhos HTTP ou as métricas apropriadas não existirem para seus documentos Unicode, você poderá usar Configurações > Metadados > Injeções para especificar o idioma apropriado.

    Marque Aplicar a documentos sem idioma especificado? para usar a configuração Idioma para páginas lidas de seu site que não têm configuração explícita. Use essa configuração quando apenas alguns documentos não tiverem configurações de idioma. Use Configurações > Metadados > Injeções se nenhum dos seus documentos tiver configurações de idioma ou se o conjunto de documentos afetados for uma lista bem conhecida e gerenciável pequena.

    Consulte Sobre Injeções .

    Usar Decompounder?

    Observação: Este recurso é usado apenas para dinamarquês e alemão. Além disso, esse recurso não é ativado por padrão. Entre em contato com o suporte técnico para ativar o recurso para uso. Depois de habilitado, o Decompounder Usar? só será exibida na interface do usuário se você selecionar dinamarquês ou alemão na lista suspensa Idioma descrita anteriormente nesta tabela.

    Quando você seleciona Usar decompounder? , o serviço detalha as palavras compostas em dinamarquês ou alemão, que permitem a indexação de palavras do componente junto com as palavras compostas originais.

    Para ver como esse recurso funciona, insira palavras no campo de texto e clique em Testar .

  3. Clique em Save Settings.

  4. Para visualizar os resultados de suas alterações, clique em regenerate your staged site index para recriar o índice de site preparado.

  5. (Opcional) Execute um dos procedimentos a seguir:

Nesta página