増分インデックスについて

増分インデックスを使用すると、頻繁に変更されるページの集まりなど、ライブWebサイトやステージングされたWebサイトの「断片」のインデックスを作成できます。

増分インデックスの使用

増分インデックスの実行に要する時間は数秒で、完全なインデックス作成までに数時間かかる大容量Webサイトで役立ちます。

増分インデックスを生成すると、インデックス作成プロセス中の開始時間、経過時間、エラーなどのステータス情報が表示されます。 最後のインデックスの状態に関する情報も表示されます。

増分インデックス作成プロセスは、いつでも停止または再開できます。

新しい増分インデックスが本番用Webサイトに作成される間、ユーザーは最後の増分インデックスを使用してサイトを検索し続けることができます。

ステージングされたWebサイトの増分インデックスの設定

WebサイトのURLとURLマスクを指定することで、インクリメンタルインデックスに含めるWebサイトページを設定できます。

ステージングされたWebサイトの増分インデックスを構成するには

  1. 製品メニューで、Index/Incremental Index/Configuration​をクリックします。

  2. Incremental Index Configuration​ページで、様々なフィールドを使用して、インデックスを作成するページを指定します。

    フィールド

    説明

    または追加URLの更新

    URLを指定します。

    検索ロボットは、最後にインデックスを作成した後に変更された、指定したドキュメントのみをインデックス化します。

    また、検索ロボットは、指定したドキュメント内のリンクに従い、変更されたドキュメントのみをインデックス化します。

    次の例のように、このフィールドにはドキュメントURLのみを含め、マスクは含めません。

    https://www.mydomain.com/products/new.html

    URLで使用できるキーワードは次のとおりです。

    • noindex

      指定したURLと一致するページ上のテキストのインデックスを作成せず、そのページのリンクに従う場合は、 次の例のように、URLの後に noindex が続きます。

      https://www.mydomain.com/products/new.html noindex

      必ず別の noindex をURLからスペースで囲み、コンマは有効な区切り文字ではありません。

    • nofollow

      指定したURLと一致するが、ページのリンクに従わないページ上のテキストのインデックスを作成する場合は、 次の例のように、URLの後に nofollow が続きます。

      https://www.mydomain.com/products/new.html nofollow

      必ず別の nofollow をURLからスペースで囲み、コンマは有効な区切り文字ではありません。

    URLマスクの検索と更新

    単純なURLマスク(フルパス、部分パス、ワイルドカードまたは正規式を使用するパス)を指定します。

    検索ロボットは、一致するすべてのドキュメントを検索し、最後にインデックスを作成した後に変更されたドキュメントのみをインデックス化します。

    また、検索ロボットは、一致するドキュメント内のリンクに従い、変更されたページのみをインデックス化します。 次に例を示します。

    https://www.mydomain.com/products/household/*.html

    次の例のように、正規式も使用できます。

    regexp ^https://www\.mydomain\.com/products/household/.*\.html$

    正規式」を参照してください。

    また、 nofollow noindex を参照してくだ追加さい。

    URLマスクを含める/除外する

    単純なURLマスクを含めるまたは除外する、フルパス、部分パス、ワイルドカードまたは正規式を使用するパスを指定します。

    検索ロボットは、指定されたマスクの種類に基づいて、ドキュメントのインデックス(「include」)を作成するか、無視(「exclude」)を作成します。

    サイトのインデックス付けを行う場合は、表示順に指示に従います。 例えば、次のリストのマスクを使用できます。

    include https://www.mydomain.com/products/household/lightbulbs*.html

    exclude https://www.mydomain.com/products/

    ページのインデックス lightbulbs1.html lightbulbs2.html . ただし、productsディレクトリにリストされている他のページのインデックスは作成されません。

    最初に表示されるURLマスクは、リストの後ろに表示されるURLマスクよりも常に優先されます。 また、検索ロボットが「含むマスク」と「除外するマスク」の両方に一致するドキュメントを検出すると、最初に表示されるマスクが優先されます。

    また、 nofollow noindex を参照してくだ追加さい。

    URLマスクについてを参照してください。

    日付マスクを含める/除外する

    単純な日付マスクを含めるまたは除外する、フルパス、部分パス、ワイルドカードまたは正規式を使用するパスを指定します。

    検索ロボットは、URLとドキュメント日の両方に基づいて、ドキュメントの検索とインデックス(「include」)または無視(「exclude」)を行います。

    次の種類の日付マスクを使用できます。

    • include-days NNN

      検索ロボットは、指定したURLマスクに一致し、NNN日以上経過しているすべてのドキュメントのインデックスを作成します。

      URLマスクの後には、次のキーワードを1つ以上追加できます。

      • nofollow
      • noindex
      • server-date

      例えば、次のマスクは、/archive/supportフォルダー内の0日以上前のドキュメントをすべて含めます。

      include-days 0 https://www.mydomain.com/archive/support/

    • include-date YYYY-MM-DD

      検索ロボットは、指定したURLマスクに一致し、YYYY-MM-DD日付より古い、または古いすべてのドキュメントのインデックスを作成します。

      URLマスクの後には、次のキーワードを1つ以上追加できます。

      • nofollow
      • noindex
      • server-date

      次のマスクの例には、2011年7月25日以前の/archive/フォルダー内のすべてのドキュメントが含まれています。

      include-date 2011-07-25 https://www.mydomain.com/archive/

    • exclude-days NNN

      指定したURLマスクに一致し、NNN日以上経過しているすべてのドキュメントのインデックス作成を無効にします。

      オプションで、URLマスクをキーワードでフォローできます server-date .

      次のマスクの例では、90日前以前のPDFファイルをすべてインデックスから除外します。

      exclude-days 90 *.pdf

    • exclude-date YYYY-MM-DD

      指定したURLマスクに一致し、YYYY-MM-DDより古い、または古いすべてのドキュメントのインデックス作成を無効にします。

      オプションで、URLマスクをキーワードでフォローできます server-date .

      次のマスクの例では、2004年4月23日以前の/archive/フォルダー内のすべてのドキュメントーが除外されます。

      exclude-date 2004-04-23 https://www.mydomain.com/archive/

    日付マスクについてを参照してください。

    URLの削除

    URLを指定します。

    検索ロボットは、検索インデックスから指定されたドキュメントを検索し削除します。 指定したページが既に検索インデックスに含まれている場合、ロボットはそのページを削除してから、他のページを追加または更新します。

    このフィールドには、ドキュメントURLのみを含め、マスクは含めないでください。

    URLマスクの検索と削除

    単純なURLマスク(フルパス、部分パス、ワイルドカードまたは正規式を使用するURLマスク)を指定します。

    指定したURLマスクが検索インデックス内のページと一致する場合、検索ロボットはページを削除してから、他のページを追加または更新します。 次に例を示します。

    https://www.mydomain.com/products/1998/household/*

    次の例のように、正規式も使用できます。

    regexp ^https://www\.mydomain\.com/products/199[567]/.*$

    正規式」を参照してください。

  3. クリック Save Changes.

  4. (オプション)次のいずれかの操作を行います。

ライブWebサイトの増分インデックススケジュールの設定

増分インデックスの頻度と、増分インデックスのクロールと更新に使用する基準時間を選択できます。

選択する時刻は、「アカウントの設定」で設定したタイムゾーンに応じてローカルに設定されます。

アカウント設定の指定」を参照してください。

多くの場合、Webサーバーは、深夜にメンテナンスのためにダウンする予定です。 スケジュールされたインデックス時間中にサーバーがダウンした場合、インデックス作成プロセスは失敗します。 Webサーバーが利用可能な時間帯を選択していることを確認してください。

インデックススケジュールは、ライブインデックスにのみ適用されます。ステージングされたインデックスはスケジュールできません。

ライブWebサイトのインクリメンタルインデックススケジュールを設定するには

  1. 製品メニューで、Index/Incremental Index/Live Schedule​をクリックします。
  2. Incremental Index Schedule​ページの​Incrementally Index​ドロップダウンリストで、インデックス作成頻度を時間単位または分単位で選択します。
  3. Base Time​ドロップダウンリストで、新しい増分インデックスを再生成する開始時間を選択します。
  4. クリック Save Changes.

ライブWebサイトまたはステージWebサイトの増分インデックスの実行

増分インデックスを使用すると、頻繁に変更されるページの集まりなど、ライブWebサイトやステージングされたWebサイトの「断片」のインデックスを作成できます。

ライブWebサイトまたはステージングされたWebサイトの増分インデックスを実行するには

  1. 製品メニューで、次のいずれかの操作を行います。

    • Index/Incremental Index/Live Index​をクリックします。

    • Index/Incremental Index/Staged Index​をクリックします。

  2. クリック Incremental Index Now.

  3. (オプション)インデックス作成エラーが発生した場合は、View Errors​をクリックして関連するログを表示します。

ライブWebサイトまたはステージWebサイトの増分インデックスログの表示

ライブ増分インデックスまたはステージ増分インデックスが完了した場合、関連するログを表示して、発生したエラーのトラブルシューティングを行うことができます。

ログをエクスポートしたり、保存したりすることはできません。 ログは、新しいインデックスが発生するまで表示可能です。

ライブWebサイトまたはステージングされたWebサイトの増分インデックスログを表示するには

  1. 製品メニューで、次のいずれかの操作を行います。

    • Index/Incremental Index/Live Log​をクリックします。

    • Index/Incremental Index/Staged Log​をクリックします。

  2. ログページの上部または下部で、次のいずれかの操作を行います。

    • FirstPrevNextLast、または​Go to line​のナビゲーションオプションを使用してログ内を移動します。

    • 表示オプション​Errors onlyWrap line、または​Show​を使用して、表示内容を絞り込みます。

このページ