増分インデックスについて

増分インデックスを使用すると、頻繁に変更されるページの集まりなど、ライブWebサイトやステージングされたWebサイトの「断片」のインデックスを作成できます。

増分インデックスの使用

増分インデックスの実行に要する時間は数秒で、完全なインデックス作成までに数時間かかる大容量Webサイトで役立ちます。

増分インデックスを生成すると、インデックス作成プロセス中の開始時間、経過時間、エラーなどのステータス情報が表示されます。 最後のインデックスの状態に関する情報も表示されます。

増分インデックス作成プロセスは、いつでも停止または再開できます。

新しい増分インデックスが本番用Webサイトに作成される間、ユーザーは最後の増分インデックスを使用してサイトを検索し続けることができます。

ステージングされたWebサイトの増分インデックスの設定

WebサイトのURLとURLマスクを指定することで、インクリメンタルインデックスに含めるWebサイトページを設定できます。

ステージングされたWebサイトの増分インデックスを構成するには

  1. 製品メニューで、/をクリックし IndexIncremental IndexConfiguration

  2. ページ上で、様々なフィールドを使用して、インデックスを作成するページを指定します。 Incremental Index Configuration

    フィールド

    説明

    または追加URLの更新

    URLを指定します。

    検索ロボットは、最後にインデックスを作成した後に変更された、指定したドキュメントのみをインデックス化します。

    また、検索ロボットは、指定したドキュメント内のリンクに従い、変更されたドキュメントのみをインデックス化します。

    次の例のように、このフィールドにはドキュメントURLのみを含め、マスクは含めません。

    https://www.mydomain.com/products/new.html

    URLで使用できるキーワードは次のとおりです。

    • noindex

      指定したURLと一致するページ上のテキストのインデックスを作成せず、そのページのリンクに従う場合は、次の例のようにURLの noindex 後にを追加します。

      https://www.mydomain.com/products/new.html noindex

      URLとURLは必ずスペース noindex で区切ってください。コンマは有効な区切り文字ではありません。

    • nofollow

      指定したURLと一致するが、ページのリンクに従わないページ上のテキストのインデックスを作成する場合は、次の例のように、URLの nofollow 後にを追加します。

      https://www.mydomain.com/products/new.html nofollow

      URLとURLは必ずスペース nofollow で区切ってください。コンマは有効な区切り文字ではありません。

    URLマスクの検索と更新

    単純なURLマスク(フルパス、部分パス、ワイルドカードまたは正規式を使用するパス)を指定します。

    検索ロボットは、一致するすべてのドキュメントを検索し、最後にインデックスを作成した後に変更されたドキュメントのみをインデックス化します。

    また、検索ロボットは、一致するドキュメント内のリンクに従い、変更されたページのみをインデックス化します。 次に例を示します。

    https://www.mydomain.com/products/household/*.html

    次の例のように、正規式も使用できます。

    regexp ^https://www\.mydomain\.com/products/household/.*\.html$

    詳しくは、 正規式を参照してください

    また、上記の「URLのキーワード nofollow と、URLの追加更新」の説明に従ってキーワードを使用することも noindex ます。

    URLマスクを含める/除外する

    単純なURLマスクを含めるまたは除外する、フルパス、部分パス、ワイルドカードまたは正規式を使用するパスを指定します。

    検索ロボットは、指定されたマスクの種類に基づいて、ドキュメントのインデックス(「include」)を作成するか、無視(「exclude」)を作成します。

    サイトのインデックス付けを行う場合は、表示順に指示に従います。 例えば、次のリストのマスクを使用できます。

    include https://www.mydomain.com/products/household/lightbulbs*.html

    exclude https://www.mydomain.com/products/

    は、ページ lightbulbs1.html とのインデックス lightbulbs2.html です。 ただし、productsディレクトリにリストされている他のページのインデックスは作成されません。

    最初に表示されるURLマスクは、リストの後ろに表示されるURLマスクよりも常に優先されます。 また、検索ロボットが「含むマスク」と「除外するマスク」の両方に一致するドキュメントを検出すると、最初に表示されるマスクが優先されます。

    また、上記の「URLのキーワード nofollow と、URLの追加更新」の説明に従ってキーワードを使用することも noindex ます。

    URLマスク についてを参照してください

    日付マスクを含める/除外する

    単純な日付マスクを含めるまたは除外する、フルパス、部分パス、ワイルドカードまたは正規式を使用するパスを指定します。

    検索ロボットは、URLとドキュメント日の両方に基づいて、ドキュメントの検索とインデックス(「include」)または無視(「exclude」)を行います。

    次の種類の日付マスクを使用できます。

    • include-days NNN

      検索ロボットは、指定したURLマスクに一致し、NNN日以上経過しているすべてのドキュメントのインデックスを作成します。

      URLマスクの後には、次のキーワードを1つ以上追加できます。

      • nofollow
      • noindex
      • server-date

      例えば、次のマスクは、/archive/supportフォルダー内の0日以上前のドキュメントをすべて含めます。

      include-days 0 https://www.mydomain.com/archive/support/

    • include-date YYYY-MM-DD

      検索ロボットは、指定したURLマスクに一致し、YYYY-MM-DD日付より古い、または古いすべてのドキュメントのインデックスを作成します。

      URLマスクの後には、次のキーワードを1つ以上追加できます。

      • nofollow
      • noindex
      • server-date

      次のマスクの例には、2011年7月25日以前の/archive/フォルダー内のすべてのドキュメントが含まれています。

      include-date 2011-07-25 https://www.mydomain.com/archive/

    • exclude-days NNN

      指定したURLマスクに一致し、NNN日以上経過しているすべてのドキュメントのインデックス作成を無効にします。

      オプションで、URLマスクをキーワードでフォローでき server-date ます。

      次のマスクの例では、90日前以前のPDFファイルをすべてインデックスから除外します。

      exclude-days 90 *.pdf

    • exclude-date YYYY-MM-DD

      指定したURLマスクに一致し、YYYY-MM-DDより古い、または古いすべてのドキュメントのインデックス作成を無効にします。

      オプションで、URLマスクをキーワードでフォローでき server-date ます。

      次のマスクの例では、2004年4月23日以前の/archive/フォルダー内のすべてのドキュメントーが除外されます。

      exclude-date 2004-04-23 https://www.mydomain.com/archive/

    日付マスク についてを参照してください

    URLの削除

    URLを指定します。

    検索ロボットは、検索インデックスから指定されたドキュメントを検索し削除します。 指定したページが既に検索インデックスに含まれている場合、ロボットはそのページを削除してから、他のページを追加または更新します。

    このフィールドには、ドキュメントURLのみを含め、マスクは含めないでください。

    URLマスクの検索と削除

    単純なURLマスク(フルパス、部分パス、ワイルドカードまたは正規式を使用するURLマスク)を指定します。

    指定したURLマスクが検索インデックス内のページと一致する場合、検索ロボットはページを削除してから、他のページを追加または更新します。 次に例を示します。

    https://www.mydomain.com/products/1998/household/*

    次の例のように、正規式も使用できます。

    regexp ^https://www\.mydomain\.com/products/199[567]/.*$

    詳しくは、 正規式を参照してください

  3. クリック Save Changes.

  4. (オプション)次のいずれかの操作を行います。

ライブWebサイトのインクリメンタルインデックススケジュールの設定

増分インデックスの頻度と、増分インデックスのクロールと更新に使用する基準時間を選択できます。

選択する時刻は、「アカウントの設定」で設定したタイムゾーンに応じてローカルに設定されます。

「アカウント設定の 指定」を参照してください。

多くの場合、Webサーバーは、深夜にメンテナンスのためにダウンする予定です。 スケジュールされたインデックス時間中にサーバーがダウンした場合、インデックス作成プロセスは失敗します。 Webサーバーが利用可能な時間帯を選択していることを確認してください。

インデックススケジュールは、ライブインデックスにのみ適用されます。ステージングされたインデックスはスケジュールできません。

ライブWebサイトのインクリメンタルインデックススケジュールを設定するには

  1. 製品メニューで、/をクリックし IndexIncremental IndexLive Schedule
  2. [ページ内]のドロップダウン Incremental Index ScheduleIncrementally Index リストで、インデックス作成頻度を時間単位または分単位で選択します。
  3. ドロップダウンリストで、新しい増分インデックスを再生成する開始時間を選択します。 Base Time
  4. クリック Save Changes.

ライブWebサイトまたはステージ化されたWebサイトの増分インデックスの実行

増分インデックスを使用すると、頻繁に変更されるページの集まりなど、ライブWebサイトやステージングされたWebサイトの「断片」のインデックスを作成できます。

ライブWebサイトまたはステージングされたWebサイトの増分インデックスを実行するには

  1. 製品メニューで、次のいずれかの操作を行います。

    • Click Index > Incremental Index > Live Index.

    • Click Index > Incremental Index > Staged Index.

  2. クリック Incremental Index Now.

  3. (オプション)インデックス作成エラーが発生した場合は、をクリックして関連するログ View Errors を表示します。

ライブWebサイトまたはステージングされたWebサイトの増分インデックスログの表示

ライブ増分インデックスまたはステージ増分インデックスが完了した場合、関連するログを表示して、発生したエラーのトラブルシューティングを行うことができます。

ログをエクスポートしたり、保存したりすることはできません。 ログは、新しいインデックスが発生するまで表示可能です。

ライブWebサイトまたはステージングされたWebサイトの増分インデックスログを表示するには

  1. 製品メニューで、次のいずれかの操作を行います。

    • Click Index > Incremental Index > Live Log.

    • Click Index > Incremental Index > Staged Log.

  2. ログページの上部または下部で、次のいずれかの操作を行います。

    • ナビゲーションオプション First、、、、 Prev​またはを使用して、ログ内 NextLastGo to line を移動します。

    • 表示オプション Errors onlyWrap line​または Show を使用して、表示内容を調整します。

このページ