単語と言語について

Words & Languageを使って、検索用語とWebページのコンテンツとの一致方法を判断できます。

単語と言語を使用

Words & Language設定の効果をサイト訪問者が利用できるようにする前に、その設定に対する変更を含めて、サイトインデックスを再生成する必要があります。 インデックス作成とは異なり、再生成を行うと、Webページのクロールは行われず、数秒で済みます。

検索用語とWebコンテンツとの一致方法の設定

単語と言語を使用して、サイト検索とマーチャンダイジングが検索用語とWebページのコンテンツをどのように一致させるかを判断できます。

検索用語とWebコンテンツとの一致方法を設定するには

  1. 製品メニューで、Linguistics/Words & Language​をクリックします。

  2. Words & Languagesページで、必要なオプションを設定します。

    オプション

    説明

    大文字と小文字の区別

    デフォルトでは選択されていません。

    大文字と小文字を区別するかどうかを指定します。 例えば、「成功」と「成功」は「成功」と区別され、検索結果はこの2つの間で異なる場合があります。

    読み分け感度

    デフォルトで選択済み.

    読み分け符号を含む単語を含まない単語と区別するかどうかを指定します。 例えば、選択すると、「pagina」は「pagina」と区別されます。 英語以外の言語を使用するWebサイトがある場合は、このオプションの選択を解除します。

    数値

    デフォルトで選択済み.

    桁数を含む単語をインデックス化するかどうかを指定します。

    アポストロフィを無視

    デフォルトでは選択されていません。

    アポストロフィはクエリから削除されます。 例えば、「Tree's」という検索を行うと、「Trees」という検索と同じ結果が返されます。

    ハイフンを無視

    デフォルトでは選択されていません。

    ハイフンはクエリから削除されます。 例えば、「blue-bell」という検索を行うと、「bluebell」という検索と同じ結果が返されます。

    英数字の部分一致

    デフォルトでは選択されていません。

    このオプションを選択すると、アルファベット順の数値トランジションにトークンを分割して、部品や製品のトークンに対するフリーテキストの一致を許可できます。

    例えば、Webサイト上の1つ以上のページの本文コンテンツに 910XT の製品識別子があるとします。 このオプションが選択されていない場合、AdobeSearch&Promoteは、 910XT を検索する際に、この製品識別子に対する一致を検索します。 そして、 Search Concat-Div-Enable をオンにすると、AdobeSearch&Promote 910 XT を見つけ出します。 しかし、 910 XT のインスタンスは排他的に見つかりません。

    英数字の部分一致」を選択すると、インデクサーはこれらの英数字の混合トークンを複数のトークンに分割します。 例えば、 XYZ123 などの製品識別子は、次の3つのトークンにインデックス化されます。 XYZ123 XYZ 、および 123 。 この機能により、これらのバリアントのいずれかに対して検索時のフリーテキストの一致が可能になります。

    別の例では、製品識別子 AB910XT があるとします。 「部分的な英数字の一致 に対して検索コンカット —Div-Enable を有効にすると、AdobeSearch&Promote AB910XT , AB 910 XT 。 次に、ユーザが 910XT を検索すると、例えば、 910XT 910 、または XT のインスタンスも検索できるように拡張する。

    注意: 検索コンカット —Div-Enable は、デフォルトでは有効になっていません。 お使いの機能をアクティブにするには、テクニカルサポートにお問い合わせください。

    注意: 英数字の部分一致は、インデックス付きのすべてのフィールドにグローバルに適用されます。 ただし、これはフリーテキストの一致にのみ影響します。完全一致や範囲の一致には影響しません。

    音に似たマッチング

    デフォルトで選択済み.

    同じ音の単語は、「health」や「helth」のように一致します。 この機能を使用すると、ユーザーは単語のスペルが誤っていても簡単に検索できます。

    代替語Forms

    初期設定はデフォルトの代替単語Formsです。

    「代替ワードForms」ドロップダウンリストでは、次のオプションから選択できます。

    • None

      インデックスの作成中に、ステミングや代替の単語フォームは適用されません。

    • 既定の代替単語Forms

      ステミングはインデックス作成中に自動的に行われます。

    • ドメインディクショナリ

      ステミングディクショナリとして設定したドメインディクショナリは、代替単語フォームのソースとして使用されます。

      辞書についてを参照してください。

      ステミングディクショナリとしてのディクショナリの設定を参照してください。

    AdobeSearch&Promoteでフレーズステミングが有効な場合は、代替単語フォームがフレーズ内でも発生することに注意してください。

    Search&Promote8.15.0リリースノート(2014年6月19日)を参照してください。

    言語

    初期設定は英語(米国)です。

    選択した言語により、日付と数値は、世界の選択した部分で使用される規則に従って解析されます。

    代替ワードFormsデフォルトの代替ワードFormsまたはドメインディクショナリに設定されている場合、選択した言語の言語規則に従って、単語の形式と単語の終わりが変わります。

    デフォルトでは、Webサイトから読み取るページの言語は、「言語」設定では決定されません。 読み取りページの言語は、そのHTTPヘッダーから、またはページ自体のメタタグから判別されます。 Webサイトには、様々な言語のページを含めることができます。 ここで選択する言語に関係なく、各ページは正しく読み取りおよびインデックス付けされます。

    Webサイトの一部のページでUTF-8などのUnicode文字セットエンコーディングを使用する場合は、各ページの言語が正しく指定されていることを確認してください。 適切なHTTPドキュメントまたはメタタグがUnicodeヘッダーに存在しない場合は、設定 > メタデータ > インジェクションを使用して、適切な言語を指定できます。

    [ドキュメントに適用しますか? を使用して、Webサイトから読み取ったページで明示的な設定がないページに対して「言語」設定を使用する場合。ドキュメントの一部ののみに言語設定がない場合に、この設定を使用します。 設定 > メタデータ > インジェクションを使用します(ドキュメントのnoneのいずれかに言語設定がある場合、または影響を受けるドキュメントのセットがよく知られていて、管理性に優れています)。

    インジェクションについてを参照してください。

    分解装置を使用しますか?

    注意: この機能は、デンマーク語とドイツ語でのみ使用されます。 また、この機能はデフォルトでは有効になっていません。 お使いの機能をアクティブにするには、テクニカルサポートにお問い合わせください。 有効にした後、Decompounderを使用しますか? 」オプションは、この表で前述した「 言語」 ドロップダウンリストから「デンマーク語」 または「 ドイツ語」を選択した場合にのみ、ユーザーインターフェイスに表示されます。

    「解凍ツールを使用しますか?」 を使用する場合、サービスはデンマーク語またはドイツ語の複合語を分類し、元の複合語と共にコンポーネント語をインデックス化できます。

    この機能の動作を確認するには、テキストフィールドに単語を入力し、[テスト]をクリックします。

  3. クリック Save Settings.

  4. 変更の結果をプレビューするには、regenerate your staged site index​をクリックして、ステージングされたWebサイトのインデックスを再構築します。

  5. (オプション)次のいずれかの操作を行います。

このページ