クロールメニューについて

クロールメニューの設定日、URLマスク、パスワード、コンテンツタイプ、接続、フォーム定義、URL入力ポイントを使用します。

URL入力ポイントについて

ほとんどのWebサイトには、顧客が最初に訪問する主なエントリーポイント(ホームページ)が1つあります。 このメインエントリポイントは、検索ロボットがインデックスのクロールを開始する際のURLアドレスです。 ただし、Webサイトに複数のドメインまたはサブドメインがある場合、またはサイトの一部がプライマリエントリポイントからリンクされていない場合は、「URL入力ポイント」を使用してエントリポイントを追加できます。

指定した各URLエントリポイントより下のWebサイトページには、すべてインデックスが作成されます。 URLエントリポイントとマスクを組み合わせて、Webサイトのどの部分にインデックスを付けるかを厳密に制御できます。 URL入力ポイント設定の効果がユーザーに表示されるようにするには、Webサイトのインデックスを再構築する必要があります。

メインエントリポイントは、通常、インデックスを作成して検索するWebサイトのURLです。 このメインエントリポイントは、「アカウントの設定」で設定します。

アカウント設定の指定」を参照してください。

メインURLエントリポイントを指定した後、必要に応じて、クロールする追加のエントリポイントを順番に指定できます。 多くの場合、メインエントリポイントの下のページからリンクされていないWebページに対して、追加のエントリポイントを指定します。 次の例のように、Webサイトが複数のドメインにまたがる場合は、追加のエントリポイントを指定します。

https://www.domain.com/

https://www.domain.com/not_linked/but_search_me_too/

https://more.domain.com/

各エントリポイントを次の表に示す、1つ以上のスペースで区切られたキーワードで修飾します。 これらのキーワードは、ページのインデックス作成方法に影響を与えます。

重要:特定のキーワードをエントリポイントから、およびスペースで相互に区切るようにしてください。コンマは有効な区切り文字ではありません。

キーワード

説明

noindex

エントリポイントページのテキストのインデックスを作成しないが、そのページのリンクをたどる必要がある場合は、 noindex を入力ポイントの後に挿入します。

次の例のように、キーワードをエントリポイントからスペースで区切ります。

https://www.my-additional-domain.com/more_pages/main.html noindex

このキーワードは、 content="noindex" )を <head> ... エントリポイントページの </head> タグ。

nofollow

エントリポイントページのテキストのインデックスを作成する際に、そのページのリンクをたどる必要がない場合は、 nofollow を入力ポイントの後に挿入します。

次の例のように、キーワードをエントリポイントからスペースで区切ります。

https://www.domain.com/not_linked/directory_listing&nbsp;nofollow

このキーワードは、 content="nofollow" <head> ... エントリポイントページの </head> タグ。

form

エントリポイントがログインページの場合、 form は、通常、検索ロボットがログインフォームを送信し、適切なcookieを受け取った後でWebサイトをクロールできるようにするために使用されます。 「form」キーワードを使用する場合、エントリポイントページのインデックスは作成されず、検索ロボットはエントリポイントページをクロール済みとしてマークしません。 使用する nofollow を返します。

コンテンツタイプについて」も参照してください。

インデックスコネクタについても参照してください。

インデックスを作成する複数のURLエントリポイントの追加

Webサイトに複数のドメインまたはサブドメインがあり、それらをクロールする場合は、URL入力ポイントを使用してURLを追加できます。

WebサイトのメインURLエントリポイントを設定するには、「アカウントの設定」を使用します。

アカウント設定の指定」を参照してください。

インデックスを作成する複数のURLエントリポイントを追加するには

  1. 製品メニューで、Settings/Crawling/URL Entrypoints​をクリックします。

  2. URL EntrypointsページのEntrypointsフィールドに、1行に1つのURLアドレスを入力します。

  3. (オプション)Add Index Connector Configurations​ドロップダウンリストで、インデックス作成のエントリポイントとして追加するインデックスコネクタを選択します。

    このドロップダウンリストは、1つ以上のインデックスコネクタ定義を以前に追加した場合にのみ使用できます。

    インデックスコネクタ定義の追加」を参照してください。

  4. クリック Save Changes.

  5. (オプション)次のいずれかの操作を行います。

URLマスクについて

URLマスクは、検索ロボットがインデックスを付けたかインデックスを付けなかったかをWebサイトのドキュメントで判断するパターンです。

URLマスクの結果がユーザーに表示されるように、サイトインデックスを再構築してください。

ステージングされたWebサイトの増分インデックスの設定」を参照してください。

使用できるURLマスクは次の2種類です。

  • URLマスクを含める
  • URLマスクの除外

URLマスクを含めると、検索ロボットはマスクのパターンに一致するドキュメントをインデックス付けするように指示されます。

URLマスクを除外すると、検索ロボットは一致するドキュメントのインデックスを作成するように指示します。

検索ロボットは、リンクからWebサイト内のリンクに移動する際、URLに遭遇し、それらのURLに一致するマスクを探します。 最初の一致によって、そのURLをインデックスに含めるか、除外するかが決まります。 検出されたURLに一致するマスクがない場合、そのURLはインデックスから破棄されます。

エントリポイントURLに対するURLマスクを含めるは、URLが自動的に生成されます。 この動作により、Webサイトで遭遇するすべてのドキュメントのインデックスが作成されます。 また、ウェブサイトから「離脱」するリンクが便利になくなります。 例えば、インデックス付きのページがhttps://www.yahoo.comにリンクしている場合、検索ロボットはそのURLのインデックスを作成しません。これは、エントリポイントURLによって自動的に生成されるインクルードマスクと一致しないためです。

指定する各URLマスクは、別々の行に記述する必要があります。

マスクは、次のいずれかを指定できます。

  • https://www.mydomain.com/products.htmlのようなフルパス。

  • https://www.mydomain.com/productsのような部分的なパス。

  • https://www.mydomain.com/*.htmlのようにワイルドカードを使用するURL。

  • 正規式(上級ユーザー用)

    マスクを正規式にするには、マスクタイプ(excludeまたはinclude)とURLマスクの間にキーワードregexpを挿入します。

以下に、単純な除外URLマスクの例を示します。

exclude https://www.mydomain.com/photos

この例は除外URLマスクなので、パターンに一致するドキュメントのインデックスは作成されません。 このパターンは、検出されたアイテム(ファイルとフォルダーの両方)と一致するので、https://www.mydomain.com/photos.htmlhttps://www.mydomain.com/photos/index.html(両方とも除外URLと一致)のインデックスは作成されません。 /photos/フォルダー内のファイルのみを一致させるには、次の例のように、URLマスクの末尾にスラッシュを含める必要があります。

exclude https://www.mydomain.com/photos/

次の除外マスクの例では、ワイルドカードを使用しています。 これは、「.pdf」拡張子を持つファイルを見過ごすよう検索ロボットに指示します。 検索ロボットは、これらのファイルをインデックスに追加しません。

exclude *.pdf

単純なインクルードURLマスクは次のとおりです。

include https://www.mydomain.com/news/

URLエントリポイントから一連のリンクを介してリンクされたドキュメント、またはURLエントリポイント自体として使用されたエントリのみがインデックス化されます。 ドキュメントのURLを「URLを含む」マスクとしてリストするだけで、リンクされていないドキュメントのインデックスは作成されません。 インデックスにリンクされていないドキュメントを追加するには、URL入力ポイント機能を使用します。

URL入力ポイントについてを参照してください。

マスクを含めると、マスクを除外すると機能します。 「URLを除外」マスクを作成し、「URLを含む」マスクを使用して除外されたページを1つ以上含めることで、Webサイトの大部分をインデックス作成から除外できます。 例えば、エントリポイントURLが次のような場合、

https://www.mydomain.com/photos/

検索ロボットは、/photos/summer//photos/spring//photos/fall/の下のすべてのページをクロールしてインデックス化します(photosフォルダーから各ディレクトリに少なくとも1ページへのリンクがあると仮定)。 この動作は、リンクパスによって、検索ロボットが/summer//spring//fall/内のドキュメントを見つけ、フォルダーとフォルダーURLが、エントリポイントURLによって自動的に生成されるインクルードマスクと一致するために発生します。

次の例のように、/fall/フォルダー内の除外URLマスクを含むすべてのページを除外するように選択できます。

exclude https://www.mydomain.com/photos/fall/

または、次のURLマスクを使用して、インデックスの一部として選択的に/photos/fall/redleaves4.htmlのみを含めます。

include https://www.mydomain.com/photos/fall/redleaves4.html

上記の2つのマスクの例が意図したとおりに機能するため、次のように、「include mask」が最初に表示されます。

include https://www.mydomain.com/photos/fall/redleaves4.html 
exclude https://www.mydomain.com/photos/fall/

検索ロボットは指定された順番に従うので、最初に/photos/fall/redleaves4.htmlを含み、次に/fallフォルダー内の残りのファイルを除外します。

手順が次のとおり逆の方法で指定されている場合:

exclude https://www.mydomain.com/photos/fall/ 
include https://www.mydomain.com/photos/fall/redleaves4.html

その場合、マスクが含めるように指定しても、/photos/fall/redleaves4.htmlは含められません。

最初に表示されるURLマスクは、マスク設定の後で表示されるURLマスクよりも常に優先されます。 また、検索ロボットが「URLを含む」マスクと「URLを除外」マスクに一致するページを検出した場合は、最初に表示されるマスクが常に優先されます。

ステージングされたWebサイトの増分インデックスの設定」を参照してください。

URLマスクを使用したキーワードの使用について

各インクルードマスクを1つ以上のスペースで区切られたキーワードで修飾でき、一致したページのインデックス作成に影響を与えます。

マスクとキーワードの区切り文字としてコンマは無効です。スペースのみを使用できます。

キーワード

説明

noindex

URLマスクと一致するページのテキストのインデックスを作成せず、一致したページのリンクに従う場合は、 noindex をインクルードURLマスクの後に挿入します。 次の例のように、キーワードとマスクは必ずスペースで区切ってください。

include&nbsp;*.swf&nbsp;noindex

上記の例では、検索ロボットが .swf 拡張子を持ちますが、これらのファイルに含まれるすべてのテキストのインデックス作成を無効にします。

Folio Builder noindex キーワードは、 content="noindex" ~ 一致したページの <head>...</head> タグ。

nofollow

URLマスクと一致するページのテキストにインデックスを付けるが、一致するページのリンクに従わない場合は、 nofollow をインクルードURLマスクの後に挿入します。 次の例のように、キーワードとマスクは必ずスペースで区切ってください。

include&nbsp;https://www.mydomain.com/photos&nbsp;nofollow

Folio Builder nofollow キーワードは、 content="nofollow" ~ 一致したページの <head>...</head> タグ。

regexp

含めるマスクと除外するマスクの両方に使用します。

先頭に regexp は正規式として扱われます。 検索ロボットが除外正規式URLマスクに一致するドキュメントを検出した場合、それらのドキュメントのインデックスは作成されません。 検索ロボットが「含む正規式のURLマスク」に一致するドキュメントを検出すると、それらのドキュメントのインデックスが作成されます。 例えば、次のURLマスクがあるとします。

exclude&nbsp;regexp&nbsp;^.*/products/.*\.html$

検索ロボットは、 https://www.mydomain.com/products/page1.html

次の除外正規式URLマスクがある場合:

exclude&nbsp;regexp&nbsp;^.*\?..*$

検索ロボットは、 https://www.mydomain.com/cgi/prog/?arg1=val1&arg2=val2 .

正規式URLマスクを含む次の場合:

include&nbsp;regexp&nbsp;^.*\.swf$&nbsp;noindex

検索ロボットは、「.swf」拡張子を持つファイルからのすべてのリンクに従います。 Folio Builder noindex キーワードは、一致したファイルのテキストのインデックスが作成されないことを示します。

正規式を参照してください。

Webサイトのインデックス部分へのURLマスクの追加(インデックス部分の追加)

URL Masksを使用して、Webサイトのどの部分をクロールしてインデックスを作成するか、または作成しないかを定義できます。

「URLマスクをテスト」フィールドを使用して、インデックス作成後にドキュメントが含まれているかどうかをテストします。

URLマスクの結果がユーザーに表示されるように、サイトインデックスを再構築してください。

ステージングされたWebサイトの増分インデックスの設定」を参照してください。

Webサイトのインデックス部分にURLマスクを追加するか、インデックス部分に追加しないかを指定するには

  1. 製品メニューで、Settings/Crawling/URL Masks​をクリックします。

  2. (オプション)URL Masksページの​Test URL Masks​フィールドに、WebサイトのテストURLマスクを入力し、Test​をクリックします。

  3. URL Masksフィールドにincludeと入力するか(クロールしてインデックスを作成するWebサイトを追加する場合)、excludeと入力し(Webサイトのクロールおよびインデックスの作成をブロックする場合)、URLマスクアドレスを入力します。

    1行につき1つのURLマスクアドレスを入力します。 例:

    include https://www.mycompany.com/summer 
    include https://www.mycompany.com/spring 
    exclude regexp .*\.xml 
    exclude https://www.mycompany.com/fall
    
  4. クリック Save Changes.

  5. (オプション)次のいずれかの操作を行います。

日付マスクについて

日付マスクを使用すると、ファイルの年齢に基づいて検索結果にファイルを含めたり、除外したりできます。

URLマスクの結果がユーザーに表示されるように、サイトインデックスを再構築してください。

ステージングされたWebサイトの増分インデックスの設定」を参照してください。

使用できる日付マスクは次の2種類です。

  • 日付マスクを含める(「include-days」と「include-date」)

    指定した日付以前の日付付けマスクインデックスファイルを含めます。

  • 日付マスクを除外(「exclude-days」と「exclude-date」)

    指定した日付以前の日付の付いた日付マスクインデックスファイルを除外します。

デフォルトでは、ファイルの日付はメタタグ情報から決定されます。 Metaタグが見つからない場合は、検索ロボットがファイルをダウンロードした際にサーバから受け取ったHTTPヘッダからファイルの日付が決定されます。

指定する各日付マスクは、別々の行に記述する必要があります。

マスクは、次のいずれかを指定できます。

  • https://www.mydomain.com/products.htmlのような完全なパス
  • https://www.mydomain.com/productsのような部分的なパス
  • ワイルドカードを使用するURL https://www.mydomain.com/*.html
  • 正規式。 マスクを正規式にするには、URLの前にキーワードregexpを挿入します。

「日付を含む」と「除外する」の両方の日付マスクでは、次の2つの方法のいずれかで日付を指定できます。 マスクは、一致するファイルが指定した日付以前に作成された場合にのみ適用されます。

  1. 日数。 例えば、日付マスクが次のような場合、

    exclude-days 30 https://www.mydomain.com/docs/archive/)
    

    指定した日数がカウントバックされます。 ファイルの日付が指定日以前の場合は、マスクが適用されます。

  2. YYYY-MM-DDの形式を使用した実際の日付。 例えば、日付マスクが次のような場合、

    include-date 2011-02-15 https://www.mydomain.com/docs/archive/)
    

    一致したドキュメントの日付が指定した日付以前の場合は、日付マスクが適用されます。

以下に、単純な除外日付マスクの例を示します。

exclude-days 90 https://www.mydomain.com/docs/archive

これは除外日付マスクなので、パターンと一致するファイルはインデックス化されず、90日以上経過しています。 ドキュメントを除外すると、テキストのインデックスは作成されず、そのファイルからのリンクも追跡されません。 ファイルは事実上無視されます。 この例では、ファイルとフォルダーの両方が、指定したURLパターンと一致する場合があります。 https://www.mydomain.com/docs/archive.htmlhttps://www.mydomain.com/docs/archive/index.htmlの両方がパターンと一致し、90日以上前の場合はインデックス化されません。 /docs/archive/フォルダー内のファイルのみを一致させるには、日付マスクの末尾に次のようなスラッシュを含める必要があります。

exclude-days 90 https://www.mydomain.com/docs/archive/

日付マスクはワイルドカードでも使用できます。 次の除外マスクは、2011-02-15以前の拡張子「.pdf」を持つファイルを検索ロボットに見過ごすよう指示します。 検索ロボットは、一致するファイルをインデックスに追加しません。

exclude-date 2011-02-15 *.pdf

「インクルード」の日付マスクの外観は似ていますが、一致したファイルのみがインデックスに追加されます。 次のインクルード日付マスクの例は、Webサイトの/docs/archive/manual/領域にある古いファイル(0日以上)のテキストのインデックスを作成するよう検索ロボットに指示します。

include-days 0 https://www.mydomain.com/docs/archive/manual/

マスクを含めると、マスクを除外すると機能します。 例えば、除外日付マスクを作成し、除外するページのうち1つ以上をURLマスクを含むページに含めることで、Webサイトの大部分をインデックス作成から除外できます。 エントリポイントURLが次の場合:

https://www.mydomain.com/archive/

検索ロボットは、/archive/summer//archive/spring//archive/fall/の下のすべてのページをクロールしてインデックスを作成します(archiveフォルダーから各フォルダーに少なくとも1ページへのリンクがあると仮定)。 この動作は、リンクパスによって、検索ロボットが/summer//spring//fall/の各フォルダー内のファイルを「見つけ」、フォルダーURLが入力ポイントURLによって自動的に生成されたインクルードマスクと一致するために発生します。

URL入力ポイントについてを参照してください。

アカウント設定の指定」を参照してください。

/fall/フォルダー内の90日以上経過したページをすべて除外し、次のように日付マスクを除外します。

exclude-days 90 https://www.mydomain.com/archive/fall/

/archive/fall/index.htmlのみ(古いファイルとは関係なく、0日以上前のファイルはすべて一致)を、次の日付マスクを使用してインデックスの一部として選択的に含めることができます。

include-days 0 https://www.mydomain.com/archive/fall/index.html

上記の2つのマスクの例を意図したとおりに機能させるには、まず次のように「マスクを含める」をリストする必要があります。

include-days 0 https://www.mydomain.com/archive/fall/index.html 
exclude-days 90 https://www.mydomain.com/archive/fall/

検索ロボットは指定された順序に従うので、検索ロボットはまず/archive/fall/index.htmlを含み、次に/fallフォルダー内の残りのファイルを除外します。

手順が次のとおり逆の方法で指定されている場合:

exclude-days 90 https://www.mydomain.com/archive/fall/ 
include-days 0 https://www.mydomain.com/archive/fall/index.html 

その場合、マスクが指定する必要があるとしても、/archive/fall/index.htmlは含まれません。 最初に表示される日付マスクは、マスク設定の後で表示される日付マスクよりも常に優先されます。 また、検索ロボットが「日付を含む」マスクと「日付を除外する」マスクの両方に一致するページを検出した場合は、最初に表示されるマスクが常に優先されます。

ステージングされたWebサイトの増分インデックスの設定」を参照してください。

日付マスクを使用したキーワードの使用について

各インクルードマスクを1つ以上のスペースで区切られたキーワードで修飾でき、一致したページのインデックス作成に影響を与えます。

マスクとキーワードの区切り文字としてコンマは無効です。スペースのみを使用できます。

キーワード

説明

noindex

「マスクを含む」で指定した日付以前のページのテキストのインデックスを作成しない場合は、 noindex は、次のように日付マスクを含める:

include-days&nbsp;10&nbsp;*.swf&nbsp;noindex

キーワードとマスクは必ずスペースで区切ってください。

上記の例では、10日以上前の「.swf」拡張子を持つファイルのリンクは、すべて検索ロボットに従うように指定しています。 ただし、これらのファイルに含まれるすべてのテキストのインデックス作成は無効になります。

古いファイルのテキストは、インデックスが作成されていないが、それらのファイルのすべてのリンクをたどるようにしてください。 このような場合は、除外日付マスクを使用する代わりに、「noindex」キーワードを含む日付マスクを使用します。

nofollow

インデックスマスクで指定された日付以前のページのテキストの日付をインデックス化する場合、一致したページのリンクに従わないようにするには、 nofollow は、次のように日付マスクを含める:

include-days&nbsp;8&nbsp;https://www.mydomain.com/photos&nbsp;nofollow

キーワードとマスクは必ずスペースで区切ってください。

Folio Builder nofollow キーワードは、 content="nofollow" ~ 一致したページの <head>...</head> タグ。

server-date

含めるマスクと除外するマスクの両方に使用します。

検索ロボットは通常、日付マスクをチェックする前にすべてのファイルをダウンロードして解析します。 この動作は、一部のファイルタイプではファイル自体に日付を指定できるためです。 例えば、HTMLドキュメントには、ファイルの日付を設定するメタタグを含めることができます。

日付に基づいて多数のファイルを除外し、不要な読み込みをサーバーに行いたくない場合は、 server-date を日付マスクのURLの後に挿入します。

このキーワードは、各ファイルを解析する代わりに、サーバから返されたファイルの日付を信頼するように検索ロボットに指示します。 例えば、次の除外日付マスクでは、ドキュメントが90日以上前の場合、HTTPヘッダー内のサーバーから返された日付に従って、URLに一致するページが無視されます。

exclude-days&nbsp;90&nbsp;https://www.mydomain.com/docs/archive&nbsp;server-date

サーバーから返される日付が90日以上前の場合、 server-date は、除外されたドキュメントをサーバーからダウンロードしないことを指定します。 その結果、ドキュメントのインデックス作成に要する時間が短縮され、サーバへの負荷が軽減されます。 If server-date が指定されていない場合、検索ロボットはHTTPヘッダ内のサーバから返される日付を無視します。 代わりに、各ファイルがダウンロードされ、日付が指定されているかどうかを確認します。 ファイルに日付が指定されていない場合、検索ロボットはサーバから返された日付を使用します。

次を使用しないでください。 server-date を指定します。

regexp

含めるマスクと除外するマスクの両方に使用します。

前に regexp は正規式として扱われます。

検索ロボットは、除外正規式の日付マスクに一致するファイルを検出した場合、それらのファイルのインデックス付けを行いません。

検索ロボットは、「含む」正規式の日付マスクに一致するファイルを検出すると、それらのドキュメントのインデックスを作成します。

例えば、次の日付マスクがあるとします。

exclude-days&nbsp;180&nbsp;regexp&nbsp;.*archive.*

マスクは、180日以上前の一致するファイルを検索ロボットに除外するように指示します。 つまり、URLに「archive」という語を含むファイルです。

正規式を参照してください。

Webサイトのインデックス部分に日付マスクを追加する、またはWebサイトのインデックス部分に追加しない

日付マスクを使用すると、ファイルの保存期間に基づいて顧客の検索結果にファイルを含めたり、除外したりできます。

Test Date​フィールドと​Test URL​フィールドを使用して、インデックス作成後にファイルが含まれているかどうかをテストします。

URLマスクの結果がユーザーに表示されるように、サイトインデックスを再構築してください。

ステージングされたWebサイトの増分インデックスの設定」を参照してください。

Webサイトのインデックス部分に日付マスクを追加するには、またはインデックス部分に追加しないには

  1. 製品メニューで、Settings/Crawling/Date Masks​をクリックします。

  2. (オプション)Date Masksページの​Test Date​フィールドに、YYYY-MM-DD形式の日付を入力します(例:2011-07-25)。「Test URL」フィールドに、webサイトのURLマスクを入力し、「Test」をクリックします。

  3. Date Masksフィールドに、1行に1つの日付マスクアドレスを入力します。

  4. クリック Save Changes.

  5. (オプション)次のいずれかの操作を行います。

パスワードについて

WebサイトのHTTP基本認証で保護されている部分にアクセスするには、1つ以上のパスワードを追加します。

パスワード設定の効果がユーザーに表示される前に、サイトインデックスを作成し直す必要があります。

ステージングされたWebサイトの増分インデックスの設定」を参照してください。

Passwordsページで、1行に各パスワードを入力します。 パスワードは、次の例のように、URLまたは領域、ユーザー名、パスワードで構成されます。

https://www.mydomain.com/ myname mypassword

上のようなURLパスを使用する代わりに、領域を指定することもできます。

使用する正しい領域を決定するには、パスワードで保護されたWebページをブラウザーで開き、「Enter Network Password」ダイアログ・ボックスを確認します。

領域名は、この場合は「My Site Realm」です。

上記の領域名を使用したパスワードは、次のようになります。

My Site Realm myusername mypassword

Webサイトに複数のレルムがある場合、次の例のように、各レルムのユーザー名とパスワードを別々の行に入力して、複数のパスワードを作成できます。

Realm1 name1 password1 
Realm2 name2 password2 
Realm3 name3 password3

URLまたはレルムを含むパスワードを組み合わせて、パスワードリストを次のように指定できます。

Realm1 name1 password1 
https://www.mysite.com/path1/path2 name2 password2 
Realm3 name3 password3 
Realm4 name4 password4 
https://www.mysite.com/path1/path5 name5 password5 
https://www.mysite.com/path6 name6 password6

上記のリストでは、サーバーの認証要求と一致する領域またはURLを含む最初のパスワードが使用されます。 https://www.mysite.com/path1/path2/index.htmlのファイルがRealm3にある場合でも、例えばname2password2は、URLで定義されるパスワードが領域で定義されるパスワードの上に表示されるので使用されます。

Webサイトの認証が必要な領域にアクセスするためのパスワードの追加

「パスワード」を使用すると、クロールやインデックス作成の目的で、Webサイトのパスワードで保護された領域にアクセスできます。

パスワードの影響がユーザーに表示される前に、サイトインデックスを必ず作成し直してください

ステージングされたWebサイトの増分インデックスの設定」を参照してください。

Webサイトの認証が必要な領域にアクセスするためのパスワードを追加するには

  1. 製品メニューで、Settings/Crawling/Passwords​をクリックします。

  2. Passwordsページの​Passwords​フィールドに、領域またはURLと、それに関連するユーザー名、パスワードをスペースで区切って入力します。

    領域パスワードとURLパスワードを別々の行に示す例:

    Realm1 name1 password1 
    https://www.mysite.com/path1/path2 name2 password2
    

    1行に1つのパスワードのみを追加します。

  3. クリック Save Changes.

  4. (オプション)次のいずれかの操作を行います。

コンテンツタイプについて

Content Typesを使用して、このアカウントのクロールおよびインデックスを作成するファイルの種類を選択できます。

クロールおよびインデックス作成できるコンテンツタイプには、PDFドキュメント、テキストドキュメント、AdobeFlashムービー、Word、Excel、PowerpointなどのMicrosoft Officeアプリケーションのファイル、MP3ファイルのテキストが含まれます。 選択したコンテンツタイプ内のテキストは、Webサイト上の他のすべてのテキストと共に検索されます。

ユーザーに対してコンテンツタイプ設定の効果が表示される前に、サイトインデックスを作成し直す必要があります。

ステージングされたWebサイトの増分インデックスの設定」を参照してください。

MP3音楽ファイルのインデックス付けについて

Content Typesページで​Text in MP3 Music Files​オプションを選択した場合、MP3ファイルは、2つの方法のいずれかでクロールされ、インデックスが作成されます。 最初に、最も一般的な方法は、次のように、HTMLファイル内のアンカーhrefタグを使用する方法です。

<a href="MP3-file-URL"></a>

2つ目の方法は、MP3ファイルのURLをURL入力ポイントとして入力する方法です。

URL入力ポイントについてを参照してください。

MP3ファイルは、そのMIMEタイプ「audio/mpeg」で認識されます。

MP3ミュージックファイルは、通常、少量のテキストしか含まない場合でも、非常に大きなサイズになる可能性があることに注意してください。 例えば、MP3ファイルには、アルバム名、アーティスト名、曲のタイトル、曲のジャンル、リリース年度、コメントなどを任意で保存できます。 この情報は、ファイルの最後(TAGと呼ばれる場所)に保存されます。 TAG情報を含むMP3ファイルのインデックスは、次のように作成されます。

  • 曲のタイトルは、HTMLページのタイトルのように扱われます。
  • コメントは、HTMLページに対して定義された説明と同様に扱われます。
  • ジャンルは、HTMLページに対して定義されたキーワードと同様に扱われます。
  • アーティスト名、アルバム名およびリリース年は、HTMLページの本文と同様に扱われます。

Webサイト上でクロールおよびインデックスが作成された各MP3ファイルは、1ページとしてカウントされます。

Webサイトに大きなMP3ファイルが多数ある場合は、アカウントのインデックス付けバイト制限を超える可能性があります。 この場合は、Content Typesページの​Text in MP3 Music Files​の選択を解除して、Webサイト上のすべてのMP3ファイルがインデックス付けされないようにすることができます。

Webサイト上の特定のMP3ファイルのインデックス作成を禁止する必要がある場合は、次のいずれかを実行できます。

  • MP3ファイルにリンクするアンカータグを<nofollow>タグと</nofollow>タグで囲みます。 検索ロボットは、これらのタグ間のリンクをたどりません。

  • 除外マ追加スクとしてのMP3ファイルのURLです。

    URLマスクについてを参照してください。

クロールするコンテンツタイプとインデックスを選択

Content Typesを使用して、このアカウントのクロールおよびインデックスを作成するファイルの種類を選択できます。

クロールおよびインデックス作成できるコンテンツタイプには、PDFドキュメント、テキストドキュメント、AdobeFlashムービー、Word、Excel、PowerpointなどのMicrosoft Officeアプリケーションのファイル、MP3ファイルのテキストが含まれます。 選択したコンテンツタイプ内のテキストは、Webサイト上の他のすべてのテキストと共に検索されます。

ユーザーに対してコンテンツタイプ設定の効果が表示される前に、サイトインデックスを作成し直す必要があります。

ステージングされたWebサイトの増分インデックスの設定」を参照してください。

中国語、日本語または韓国語のMP3ファイルをクロールしてインデックスを作成するには、次の手順を実行します。 次に、Settings > Metadata > Injections​で、MP3ファイルのエンコードに使用する文字セットを指定します。

インジェクションについてを参照してください。

クロールおよびインデックスを作成するコンテンツタイプを選択するには

  1. 製品メニューで、Settings/Crawling/Content Types​をクリックします。

  2. Content Typesページで、Webサイト上のクロールおよびインデックスを作成するファイルタイプを確認します。

  3. クリック Save Changes.

  4. (オプション)次のいずれかの操作を行います。

接続について

「接続」を使用すると、検索ロボットがWebサイトのインデックス作成に使用するHTTP接続を10個まで追加できます。

接続数を増やすと、クロールとインデックスの完了に要する時間が大幅に短縮されます。 ただし、接続を追加するたびに、サーバーの負荷が増えることに注意してください。

インデックス作成速度を上げるための接続の追加

「接続」を使用すると、Webサイトのインデックス作成に要する時間を短縮できます。クローラーで使用するHTTP接続の同時数を増やすことができます。 10個までの接続を追加できます。

接続が追加されるたびに、サーバーに負荷がかかることに注意してください。

接続を追加してインデックス作成速度を上げるには

  1. 製品メニューで、Settings/Crawling/Connections​をクリックします。

  2. Parallel Indexing Connectionsページの​Number of Connections​フィールドに、追加する接続数(1 ~ 10)を入力します。

  3. クリック Save Changes.

  4. (オプション)次のいずれかの操作を行います。

フォーム送信について

フォームの送信を使用すると、Webサイト上のフォームを認識して処理するのに役立ちます。

Webサイトのクロールおよびインデックス作成中に、検出された各フォームが、追加したフォーム定義と比較されます。 フォームがフォーム定義と一致する場合は、インデックス作成のためにフォームが送信されます。 フォームが複数の定義と一致する場合は、一致する定義ごとに1回フォームが送信されます。

Webサイト上のフォームのインデックス作成用のフォーム定義の追加

Form Submissionを使用すると、Webサイトで認識されるフォームを処理してインデックスを作成できます。

変更の結果がユーザーに表示されるように、サイトインデックスを必ず再構築してください。

ステージングされたWebサイトの増分インデックスの設定」を参照してください。

Webサイト上のフォームのインデックス作成用のフォーム定義を追加するには

  1. 製品メニューで、Settings/Crawling/Form Submission​をクリックします。

  2. Form Submissionページで、Add New Form​をクリックします。

  3. Add Form Definitionページで、Form RecognitionとForm Submissionのオプションを設定します。

    Form DefinitionページのForm Recognitionセクションにある5つのオプションは、処理可能なWebページ内のフォームを識別するために使用されます。

    Form Submissionセクションの3つのオプションは、フォームと共にWebサーバーに送信されるパラメーターと値を指定するために使用されます。

    1行につき1つの認識または送信パラメータを入力します。 各パラメーターには、名前と値を含める必要があります。

    オプション

    説明

    フォーム認識

    ページURLマスク

    フォームを含むWebページを識別します。 単一のページに表示されるフォームを識別するには、次の例のようにそのページのURLを入力します。

    https://www.mydomain.com/login.html

    複数のページに表示されるフォームを識別するには、ページの説明にワイルドカードを使用するURLマスクを指定します。 例えば、 https://www.mydomain.com/register/ の下にあるASPページで発生したフォームを識別するには、次のように指定します。

    https://www.mydomain.com/register/*.asp&nbsp;

    また、正規式を使用して複数のページを識別することもできます。 単に 次の例のように、URLマスクの前の regexp キーワード:

    regexp&nbsp;^https://www\.mydomain\.com/.*/login\.html$

    アクションURLマスク

    Folio Builderの <form> タグ。

    ページのURLマスクと同様に、アクションのURLマスクは、単一のURL、ワイルドカードを含むURLまたは正規式の形式にすることができます。

    URLマスクは、次のいずれかになります。

    • 次のようなフルパス。 https://www.mydomain.com/products.html
    • 次のような部分的なパスです。 https://www.mydomain.com/products
    • 以下のようなワイルドカードを使用するURL。 https://www.mydomain.com/*.html
    • 次のような正規式。 regexp&nbsp^https://www\.mydomain\.com/.*/login\.html$

    URLマスクまたはアクションURLマスクで識別されるページのテキストのインデックスを作成しない場合、またはこれらのページにリンクを追跡したくない場合、 noindex nofollow キーワード。 URLマスクまたは入力ポイントを使用して、これらのキーワードをマスクに追加できます。

    URL入力ポイントについてを参照してください。

    URLマスクについてを参照してください。

    フォーム名マスク

    フォームが webページの <form> タグにname属性が含まれています。

    単純な名前( login_form )、ワイルドカード( form* )または正規式( regexp ^.*authorize.*$ )。

    通常、フォームにはname属性がないので、このフィールドは空のままにしておくことができます。

    フォームIDマスク

    フォームが webページの <form> タグにid属性が含まれています。

    単純な名前( login_form )、ワイルドカード( form* )または正規式( regexp ^.*authorize.*$ )。

    通常、フォームにはname属性がないので、このフィールドは空のままにしておくことができます。

    パラメーター

    名前付きパラメーターまたは名前付きパラメーターを含むフォーム、または含まないフォームを特定の値で識別します。

    例えば、rick_brough@mydomain.comにプリセットされ、パスワードパラメーターは含まれ、名称パラメーターは含まれない電子メールパラメーターを含むフォームを識別するには、次のパラメーター設定を1行に1つずつ指定します。

    email=rick_brough@mydomain.com password not first-name

    フォーム送信

    アクションURLを上書き

    フォーム送信のターゲットが、フォームのアクション属性で指定されたものと異なる場合に指定します。

    例えば、フォーム内のURL値とは異なるURL値を構成するJavaScript関数を使用してフォームが送信される場合に、このオプションを使用できます。

    Overrideメソッド

    フォーム送信のターゲットがフォームのaction属性で使用されているものと異なる場合、およびJavaScriptの送信によってメソッドが変更された場合に指定します。

    すべてのフォームパラメーターのデフォルト値( <input> タグ(非表示フィールドを含む)、デフォルト <option> <select> タグと、 <textarea>...</textarea> タグ)は、Webページから読み取られます。 ただし、フォーム送信セクションのパラメーターフィールドに指定されているパラメーターは、すべてデフォルトのフォームに置き換えられます。

    パラメーター

    フォーム送信パラメーターに not キーワード。

    パラメーターのプレフィックスに not の場合、フォーム送信の一部として送信されません。 この動作は、送信する必要があるチェックボックスの選択を解除した場合に役立ちます。

    例えば、次のパラメーターを送信するとします。

    • 値を含む電子メールパラメーター nobody@mydomain.com
    • 値を持つパスワードパラメーター tryme
    • mycheckboxパラメーターの選択が解除されている。
    • その他 <form> パラメーターをデフォルト値として

    フォーム送信パラメーターは次のようになります。

    email=nobody@mydomain.com password=tryme not mycheckbox

    メソッドの属性 Webページの <form> タグは、GET方式またはPOST方式を使用して、データをサーバーに送信するかどうかを決定するために使用されます。

    Folio Builder <form> タグにmethod属性が含まれていない場合、フォームはGETメソッドを使用して送信されます。

  4. クリック Add.

  5. (オプション)次のいずれかの操作を行います。

フォーム定義の編集

Webサイト上のフォームが変更された場合や、定義を変更する必要が生じた場合は、既存のフォーム定義を編集できます。

Form Submissionページには、フォーム定義に対して行った変更を元に戻すHistory機能がないことに注意してください。

変更の結果がユーザーに表示されるように、サイトインデックスを必ず再構築してください。

ステージングされたWebサイトの増分インデックスの設定」を参照してください。

フォーム定義を編集するには

  1. 製品メニューで、Settings/Crawling/Form Submission​をクリックします。

  2. Form Submissionページで、更新するフォーム定義の右側の​Edit​をクリックします。

  3. Edit Form Definitionページで、Form RecognitionとForm Submissionのオプションを設定します。

    Webサイトでのフォームのインデックス作成に使用するフォーム定義の追加のオプションの表を参照してください。

  4. クリック Save Changes.

  5. (オプション)次のいずれかの操作を行います。

フォーム定義の削除

Webサイトにフォームが存在しなくなった場合や、特定のフォームを処理してインデックスを作成したくない場合は、既存のフォーム定義を削除できます。

Form Submissionページには、フォーム定義に対して行った変更を元に戻すHistory機能がないことに注意してください。

変更の結果がユーザーに表示されるように、サイトインデックスを必ず再構築してください。

ステージングされたWebサイトの増分インデックスの設定」を参照してください。

フォーム定義を削除するには

  1. 製品メニューで、Settings/Crawling/Form Submission​をクリックします。

  2. Form Submissionページで、削除するフォーム定義の右側の​Delete​をクリックします。

    削除するフォーム定義が正しいことを確認してください。 次の手順で​Delete​をクリックした場合、削除の確認ダイアログボックスは表示されません。

  3. Delete Form Definitionページで、Delete​をクリックします。

  4. (オプション)次のいずれかの操作を行います。

インデックスコネクタについて

XMLページや任意のフィードのインデックス作成に使用する追加の入力ソースを定義するには、Index Connectorを使用します。

データフィード入力ソースを使用すると、Webサイトで一般に見つかるものとは異なるフォームに保存されたコンテンツに、利用可能なクロール方法の1つを使用してアクセスできます。 クロールおよびインデックス付けされた各ドキュメントは、Webサイト上のコンテンツページに直接対応しています。 ただし、データフィードはXMLドキュメントから、またはカンマ区切りまたはタブ区切りのテキストファイルから取得され、インデックスを作成するコンテンツ情報が含まれます。

XMLデータソースは、個々のドキュメントに対応する情報を含むXMLスタンザス(レコード)で構成されます。 これらの個々のドキュメントはインデックスに追加されます。 テキストデータフィードには、個々のドキュメントに対応する個々の改行区切りレコードが含まれています。 これらの個々のドキュメントもインデックスに追加されます。 どちらの場合も、インデックスコネクタ設定は、フィードの解釈方法を説明します。 各設定では、ファイルの保存場所と、サーバーがファイルにアクセスする方法が説明されます。 この設定では、「マッピング」情報も説明します。 つまり、各レコードの項目を使用して、結果のインデックスにメタデータフィールドを埋め込む方法です。

Staged Index Connector Definitionsページにインデックスコネクタ定義を追加した後、「名前」または「種類」の値に​以外の​の設定を変更できます。

Index Connectorページには次の情報が表示されます。

  • 設定および追加した、定義済みのインデックスコネクタの名前。

  • 追加した各コネクタに対して、次のいずれかのデータソースの種類を指定します。

    • テキスト :単純な「フラット」ファイル、カンマ区切り、タブ区切りなどの一貫した区切り形式。
    • フィード - XMLフィード
    • XML - XMLドキュメントのコレクションです。
  • 次回のクロールとインデックス作成に対してコネクタが有効かどうかを示します。

  • データソースのアドレス。

インデックスコネクタについても参照してください

インデックスコネクタのテキスト設定とフィード設定でのインデックス作成プロセスの動作

手順

手順

説明

1

データソースをダウンロードします。

テキスト設定とフィード設定の場合、ファイルのダウンロードは簡単です。

2

ダウンロードしたデータソースを個々の擬似ドキュメントに分類します。

テキストの場合、改行で区切られた各テキスト行は、個々のドキュメントに対応し、カンマやタブなど、指定した区切り文字を使用して解析されます。

フィードでは、各ドキュメントのデータは次の形式の正規式パターンを使用して抽出されます。

<${Itemtag}>(.*?)</${Itemtag}>

インデックスコネクタページのマップを使用して、データのキャッシュコピーを作成し、クローラーのリンクのリストを作成します。 データはローカルキャッシュに保存され、設定済みのフィールドが入力されます。

解析済みデータがローカルキャッシュに書き込まれます。

このキャッシュは後で読み取られ、クローラが必要とする単純なHTMLドキュメントが作成されます。 例:

<html><head> <title>{title}</title> <meta name="{field}" content="{data}" /> ... </head><body> {body} </body></html>

<title> 要素は、タイトルメタデータフィールドへのマッピングが存在する場合にのみ生成されます。 同様に、 <body> 要素は、Bodyメタデータフィールドへのマッピングが存在する場合にのみ生成されます。

重要:事前定義済みのURLメタタグへの値の割り当てはサポートされていません。

その他すべてのマッピングについては、元のドキュメントで見つかったデータを持つ各フィールドに対して、 <meta> タグが生成されます。

各ドキュメントのフィールドがキャッシュに追加されます。 キャッシュに書き込まれるドキュメントごとに、次の例のようなリンクも生成されます。

<a href="index:Adobe?key=<primary key field>\" /> <a href="index:Adobe?key=<primary key field>\" /> ....

設定のマッピングには、プライマリキーとして識別される1つのフィールドが必要です。 このマッピングは、データがキャッシュから取得される際に使用されるキーを形成します。

クローラはURL インデックスを認識します。スキームプレフィックス。これにより、ローカルにキャッシュされたデータにアクセスできます。

3

キャッシュされたドキュメントセットをクロールします。

インデックス:リンクは、クローラの保留リストに追加され、通常のクロールシーケンスで処理されます。

4

各ドキュメントを処理します。

各リンクのキー値はキャッシュ内のエントリに対応するので、各リンクをクロールすると、ドキュメントのデータがキャッシュから取得されます。 その後、HTML画像を「アセンブル」し、処理してインデックスに追加します。

インデックスコネクタのXML設定でのインデックス作成プロセスの動作

XML設定のインデックス作成プロセスは、テキスト設定とフィード設定のプロセスと似ていますが、以下の小さな変更と例外があります。

XMLクロールのドキュメントは既に個別のファイルに分けられているので、上記の表の手順1と2は直接適用されません。 Index Connector Addページの​Host Address​フィールドと​File Path​フィールドにURLを指定すると、URLがダウンロードされ、通常のHTMLドキュメントとして処理されます。 ダウンロードドキュメントには<a href="{url}"...リンクのコレクションが含まれ、それぞれが処理されるXMLドキュメントを指すことを期待します。 そのようなリンクは次の形式に変換されます。

<a href="index:<ic_config_name>?url="{url}">

例えば、Adobeの設定から次のリンクが返されたとします。

<a href="https://www.adobe.com/somepath/doc1.xml">doc 1</a> 
<a href="https://www.adobe.com/otherpath/doc2.xml">doc 2</a>

上の表では、手順3は適用されず、クロールおよびインデックス作成時に手順4が完了します。

または、XMLドキュメントを、クロールプロセスによって自然に発見された他のドキュメントと混在させることもできます。 このような場合は、書き換えルール(Settings > Rewrite Rules > Crawl List Retrieve URL Rules)を使用して、XMLドキュメントのURLを変更し、インデックスコネクタに転送することができます。

クロールリストの取得URLルールについてを参照してください。

例えば、次の書き換えルールがあるとします。

RewriteRule (^http.*[.]xml$) index:Adobe?key=$1

このルールは、.xmlで終わるURLをインデックスコネクタリンクに変換します。 クローラはindex: URLスキームを認識して書き換えます。 ダウンロードプロセスは、プライマリ上のIndex Connector Apacheサーバーを通じてリダイレクトされます。 ダウンロードされた各ドキュメントは、フィードで使用されるのと同じ正規式パターンを使用して調べられます。 ただし、この場合、製造されたHTMLドキュメントはキャッシュに保存されません。 代わりに、インデックス処理用にクローラに直接渡されます。

複数のインデックスコネクタの設定方法

任意のアカウントに対して複数のインデックスコネクタ設定を定義できます。 次の図に示すように、設定は​Settings > Crawl > URL Entrypoints​のドロップダウンリストに自動的に追加されます。

ドロップダウンリストから設定を選択すると、URLエントリポイントのリストの最後に値が追加されます。

メモ

無効なインデックスコネクタの設定はドロップダウンリストに追加されますが、選択することはできません。 同じインデックスコネクタの設定を2回目に選択した場合は、設定がリストの最後に追加され、前のインスタンスが削除されます。

増分クロールのインデックスコネクタエントリポイントを指定するには、次の形式を使用してエントリを追加します。

index:<indexconnector_configuration_name>

[インデックスコネクタ]ページで追加された各エントリが見つかり、有効になっている場合、クローラは追加された各エントリを処理します。

注意:各ドキュメントのURLはインデックスコネクタ設定名とドキュメントの主キーを使用して構築されるので、増分更新を実行する際は、必ず同じインデックスコネクタ設定名を使用してください。 これにより、Adobe Search&Promoteは、以前にインデックス付けされたドキュメントを正しく更新できます。

URLエントリポイントについても参照してください。

インデックスコネクタを追加する際のセットアップマップの使用

インデックスコネクタを追加する際に、オプションで​Setup Maps​機能を使用して、データソースのサンプルをダウンロードできます。 データは、インデックスの適合性を調べられます。

インデックスコネクタの種類を選択した場合

設定マップ機能

テキスト

最初にタブを試し、次に縦棒()を試して区切り値を決定します。 | )を挿入し、最後にカンマ( , )を挿入します。 「マップの設定」をクリックする前に、既に区切り値を指定している場合は、代わりにその値が使用されます。

最適なスキームを使用すると、Mapフィールドに適切なタグとフィールドの値に推測値が入力されます。 さらに、解析済みデータのサンプリングも表示されます。 ファイルにヘッダー行が含まれていることがわかっている場合は、必ず「先頭行のヘッダー」を選択してください。 この情報は、設定関数で結果のマップエントリを識別しやすくするために使用されます。

フィード

データソースをダウンロードし、単純なXML解析を実行します。

結果のXPath識別子はMapテーブルのタグ行に表示され、同様の値はFieldsにも表示されます。 これらの行は使用可能なデータのみを識別し、より複雑なXPath定義は生成されません。 ただし、XMLデータの説明とItemtagの値の識別を行うので、この方法は役に立ちます。

注意: セットアップマップ機能は、XMLソース全体をダウンロードして分析を実行します。 ファイルのサイズが大きい場合は、この操作がタイムアウトする可能性があります。

成功した場合、この関数は可能なすべてのXPath項目を識別しますが、その多くは使用が望ましくない項目です。 結果のMap定義を確認し、不要または不要なMap定義を削除してください。

XML

プライマリリンクリストではなく、個々のドキュメントを代表するユーザーのURLをダウンロードします。 この単一のドキュメントは、フィードで使用されるのと同じメカニズムを使用して解析され、結果が表示されます。

追加 をクリックして設定を保存する前に、URLをプライマリリンクリストドキュメントに戻してください。

重要:サイズの大きいXMLデータセットでは、ファイルパーサーがファイル全体をメモリに読み込もうとするので、セットアップマップ機能が動作しない場合があります。その結果、メモリ不足状態が発生する可能性があります。 ただし、インデックス作成時に同じドキュメントが処理された場合、メモリへの読み込みは行われません。 その代わりに、大きなドキュメントは「外出中」に処理され、最初にメモリに完全に読み込まれるわけではありません。

インデックスコネクタを追加する際のプレビューの使用

インデックスコネクタを追加する際、オプションで​Preview​機能を使用して、データを保存しているかのようにデータを検証できます。 設定をアカウントに保存せずに、設定に対するテストを実行します。 テストは、設定済みのデータソースにアクセスします。 ただし、ダウンロードキャッシュは一時的な場所に書き込まれます。インデックス作成クローラが使用するメインキャッシュフォルダと競合しません。

プレビューは、 Acct:IndexConnector-プレビュー-Max-ドキュメントで制御される5つのドキュメントのデフォルトのみを処理します。 プレビューしたドキュメントは、インデックス作成クローラに表示されるとおり、ソース形式で表示されます。 表示は、Webブラウザーの「表示ソース」機能に似ています。 標準のナビゲーションリンクを使用して、プレビューセット内のドキュメントを移動できます。

プレビューはXML設定をサポートしません。このようなドキュメントは直接処理され、キャッシュにダウンロードされないからです。

インデックスコネクタ定義の追加

各インデックスコネクタの設定は、データソースと、そのソースに定義されたデータ項目をインデックス内のメタデータフィールドに関連付けるマッピングを定義します。

新しい有効な定義の効果がユーザーに表示される前に、サイトインデックスを作成し直します。

インデックスコネクタ定義を追加するには

  1. 製品メニューで、Settings/Crawling/Index Connector​をクリックします。

  2. Stage Index Connector Definitionsページで、Add New Index Connector​をクリックします。

  3. Index Connector Addページで、必要なコネクタオプションを設定します。 使用できるオプションは、選択した​Type​によって異なります。

    オプション

    説明

    名前

    インデックスコネクタ設定の一意の名前です。 英数字を使用できます。 「_」と「 — 」も使用できます。

    タイプ

    データのソース。 選択したデータソースタイプは、インデックスコネクタ追加ページで使用できる結果のオプションに影響します。 次の中から選択できます。

    • テキスト

      単純なフラットテキストファイル、カンマ区切り、タブ区切り、またはその他の一貫した区切り形式。 改行で区切られた各行のテキストは、個々のドキュメントに対応し、指定した区切り文字を使用して解析されます。

      各値(列)を、1から始まる列番号で参照されるメタデータフィールドにマップできます。

    • Feed

      複数の「行」の情報を含むプライマリXMLドキュメントをダウンロードします。

    • XML

      リンク( <a> )を個々のXMLドキュメントに送信します。

    データソースの種類:テキスト

    有効

    クロールとインデックスを行うには、設定を「オン」にします。 または、構成を「オフ」にして、クロールやインデックス作成を防ぐことができます。

    注意:無効なインデックスコネクタの設定は、エントリポイントリストに見つかった場合は無視されます。

    ホストアドレス

    データが存在するサーバーホストのアドレスを指定します。

    必要に応じて、次の例のように、データソースドキュメントへの完全なURI(Uniform Resource Identifier)パスを指定できます。

    https://www.somewhere.com/some_path/some_file.xml

    または

    ftp://user:password@ftpserver.somewhere.com/some_path/some_file.xml

    URIは、「Host Address」、「File Path」、「Protocol」、および「Username」、「Password」の各フィールドに対する適切なエントリに分類されます。

    データソースファイルが見つかったホストシステムのIPアドレスまたはURLアドレスを指定します。

    File Path

    単純なフラットテキストファイル、カンマ区切り、タブ区切り、またはその他の一貫した区切り形式ファイルへのパスを指定します。

    パスは、ホストアドレスのルートに対する相対パスです。

    Incremental File Path

    単純なフラットテキストファイル、カンマ区切り、タブ区切り、またはその他の一貫した区切り形式ファイルへのパスを指定します。

    パスは、ホストアドレスのルートに対する相対パスです。

    このファイルを指定した場合は、Incremental Index操作中にダウンロードされ、処理されます。 ファイルを指定しない場合は、代わりにFile Pathの下に表示されるファイルが使用されます。

    垂直ファイルパス

    垂直更新時に使用する単純なフラットテキストファイル、カンマ区切り、タブ区切り、またはその他の一貫した区切り形式ファイルのパスを指定します。

    パスは、ホストアドレスのルートに対する相対パスです。

    このファイルを指定した場合は、「垂直方向の更新」の操作中にダウンロードされ、処理されます。

    注意:この機能は、デフォルトでは有効になっていません。お使いの機能をアクティブにするには、テクニカルサポートにお問い合わせください。

    ファイルパスを削除

    1行に1つのドキュメント識別子の値を含む、単純なフラットテキストファイルへのパスを指定します。

    パスは、ホストアドレスのルートに対する相対パスです。

    このファイルを指定した場合は、Incremental Index操作中にダウンロードされ、処理されます。 このファイル内の値は、以前にインデックス付けされたドキュメントを削除する「削除」リクエストの作成に使用されます。 このファイルの値は、FullまたはIncremental File Pathファイル(プライマリキーとして指定された列)にある値に対応している必要があります。

    注意:この機能は、デフォルトでは有効になっていません。お使いの機能をアクティブにするには、テクニカルサポートにお問い合わせください。

    Protocol

    ファイルへのアクセスに使用するプロトコルを指定します。 次の中から選択できます。

    • HTTP

      必要に応じて、適切な認証資格情報を入力してHTTPサーバーにアクセスすることができます。

    • HTTPS

      必要に応じて、HTTPSサーバーにアクセスするための正しい認証資格情報を入力できます。

    • FTP

      FTPサーバーにアクセスするには、適切な認証資格情報を入力する必要があります。

    • SFTP

      SFTPサーバーにアクセスするには、適切な認証資格情報を入力する必要があります。

    • File

    タイムアウト

    FTP、SFTP、HTTP、またはHTTPS接続のタイムアウトを秒単位で指定します。 この値は30 ~ 300の範囲で設定する必要があります。

    再試行

    失敗したFTP、SFTP、HTTP、またはHTTPS接続の最大再試行数を指定します。 この値は0 ~ 10の範囲で設定する必要があります。

    値が0の場合は、再試行を禁止します。

    エンコード

    指定したデータソースファイルで使用する文字エンコーディングシステムを指定します。

    区切り

    指定したデータソースファイルの各フィールドの説明文字として使用する文字を指定します。

    カンマ文字()は区切り文字の例です。 コンマは、指定したデータソースファイル内のデータフィールドを区切るのに役立つフィールド区切り文字として機能します。

    タブを選択しますか? をクリックします。

    先頭行のヘッダー

    データソースファイルの最初の行にヘッダー情報のみが含まれ、データは含まれないことを示します。

    インデックス作成用の最小ドキュメント数

    正の値に設定した場合は、ダウンロードされるファイルに必要なレコードの最小数を指定します。 受け取るレコードが少ない場合、インデックス処理は中止されます。

    注意:この機能は、デフォルトでは有効になっていません。お使いの機能をアクティブにするには、テクニカルサポートにお問い合わせください。

    注意:この機能は、完全なインデックス処理でのみ使用されます。

    マップ

    列番号を使用して、列とメタデータのマッピングを指定します。

    • 最初の列を1にして、列番号を指定します。 各列に新しいマップ行を追加するには、アクションの下の + をクリックします。

      データソースの各列を参照する必要はありません。 代わりに、値をスキップすることもできます。

    • フィールド

      生成された各<meta>タグで使用するname属性値を定義します。

    • メタデータ?

      フィールドが、現在のアカウントに対して定義済みのメタデータフィールドを選択できるドロップダウンリストになります。

      必要に応じて、フィールドの値は、未定義のメタデータフィールドにすることができます。 未定義のメタデータフィールドは、フィルタースクリプトで使用されるコンテンツの作成に役立ちます。

      フィルタリングスクリプトについてを参照してください。

      Index Connectorが、任意のマップフィールドで複数のヒットを持つXMLドキュメントを処理する場合、複数の値が連結されて、結果のキャッシュドキュメントで単一の値になります。 デフォルトでは、これらの値はコンマ区切り文字を使用して組み合わされます。 ただし、対応するフィールド値が定義済みのメタデータフィールドであるとします。 さらに、そのフィールドには許可リスト属性が設定されています。 この場合、フィールドのリスト区切り文字値(最初に定義された区切り文字)が連結に使用されます。

    • プライマリキー?

      プライマリ・キーとして識別されるマップ定義は1つだけです。 このフィールドは、このドキュメントをインデックスに追加したときに表示される一意の参照になります。 この値は、ドキュメントのインデックス内のURLで使用されます。

      プライマリキーの値は、インデックスコネクタ設定で表されるすべてのドキュメントで一意である必要があります。発生した重複は無視されます。 ソースドキュメントにプライマリキーとして使用する一意の値が1つだけ含まれていないが、2つ以上のフィールドを組み合わせて一意の識別子を形成できる場合は、複数のの値を縦区切り("|")で定義できますの値。

    • HTMLを削除しますか?

      このオプションを選択すると、このフィールドのデータに含まれるHTMLタグがすべて削除されます。

    • アクション

      行をマップに追加したり、マップから行を削除したりできます。 行の順序は重要ではありません。

    データソースの種類:フィード

    有効

    クロールとインデックスを行うには、設定を「オン」にします。 または、構成を「オフ」にして、クロールやインデックス作成を防ぐことができます。

    注意:無効なインデックスコネクタの設定は、エントリポイントリストに見つかった場合は無視されます。

    ホストアドレス

    データソースファイルが見つかったホストシステムのIPアドレスまたはURLアドレスを指定します。

    File Path

    複数の「行」情報を含むプライマリXMLドキュメントへのパスを指定します。

    パスは、ホストアドレスのルートに対する相対パスです。

    Incremental File Path

    複数の「行」情報を含む増分XMLドキュメントのパスを指定します。

    パスは、ホストアドレスのルートに対する相対パスです。

    このファイルを指定した場合は、Incremental Index操作中にダウンロードされ、処理されます。 ファイルを指定しない場合は、代わりにFile Pathの下に表示されるファイルが使用されます。

    垂直ファイルパス

    垂直更新時に使用する複数の疎な「行」ドキュメントを含むXML情報へのパスを指定します。

    パスは、ホストアドレスのルートに対する相対パスです。

    このファイルを指定した場合は、「垂直方向の更新」の操作中にダウンロードされ、処理されます。

    注意:この機能は、デフォルトでは有効になっていません。お使いの機能をアクティブにするには、テクニカルサポートにお問い合わせください。

    ファイルパスを削除

    1行に1つのドキュメント識別子の値を含む、単純なフラットテキストファイルへのパスを指定します。

    パスは、ホストアドレスのルートに対する相対パスです。

    このファイルを指定した場合は、Incremental Index操作中にダウンロードされ、処理されます。 このファイル内の値は、以前にインデックス付けされたドキュメントを削除する「削除」リクエストの作成に使用されます。 このファイルの値は、FullまたはIncremental File Pathファイル(プライマリキーとして指定された列)にある値に対応している必要があります。

    注意:この機能は、デフォルトでは有効になっていません。お使いの機能をアクティブにするには、テクニカルサポートにお問い合わせください。

    プロトコル

    ファイルへのアクセスに使用するプロトコルを指定します。 次の中から選択できます。

    • HTTP

      必要に応じて、適切な認証資格情報を入力してHTTPサーバーにアクセスすることができます。

    • HTTPS

      必要に応じて、HTTPSサーバーにアクセスするための正しい認証資格情報を入力できます。

    • FTP

      FTPサーバーにアクセスするには、適切な認証資格情報を入力する必要があります。

    • SFTP

      SFTPサーバーにアクセスするには、適切な認証資格情報を入力する必要があります。

    • ファイル

    Itemtag

    指定したデータソースファイル内の個々のXML行を識別するために使用できるXML要素を識別します。

    例えば、AdobeXMLドキュメントの次のフィードフラグメントでは、Itemtagの値はレコードです。

    <?xml version="1.0" encoding="utf-8"?> <!DOCTYPE gsafeed PUBLIC "-//Google//DTD GSA Feeds//EN" ""> <gsafeed>      <header>           <datasource>marketplace</datasource>           <feedtype>incremental</feedtype>      </header>      <group action="add"> <record url=https://www.adobe.com/cfusion/marketplace_gsa index.cfm?event=marketplace.home&amp;marketplaceid=1 action="add" mimetype="text/html"displayurl="https://www.adobe.com/cfusion/marketplace/index.cfm?event=marketplace.home&amp;marketplaceid=1"><metadata> <meta name="mp_mkt" content="1"/> <meta name="mp_logo" content="/images/marketplace/%20%20%20%20%20%20%20%20%20dbreferenced/marketplaceicons/icn_air.png?lang=ja"/> <meta name="title" content="Adobe AIR Marketplace"/> <meta name="description" content="Discover new applications ..."/> </metadata> <content><![CDATA[<html><head><title>Adobe AIR Marketplace</title></head><body>Discover new applications ...</body></html>]]></cntent> </record> <record url=https://www.adobe.com/cfusion/marketplace_gsa/ index.cfm?event=marketplace.home&amp;marketplaceid=2 action="add" mimetype="text/html" displayurl="https://www.adobe.com/cfusion/ marketplace/index.cfm?event=marketplace.home&amp;marketplaceid=2"> <metadata> <meta name="mp_mkt" content="2"/> <meta name="mp_logo" content="/images/marketplace/%20%20%20%20%20%20%20%20%20dbreferenced/marketplaceicons/icn_photoshop.png?lang=ja"/> <meta name="title" content="Adobe Photoshop Marketplace"/> <meta name="description" content="Extend your creative possibilities ..."/> </metadata> <content><![CDATA[<html><head><title>Adobe Photoshop Marketplace</title></head><body>Extend your creative possibilities ...</body></html>]]>/content> </record> ... <record> ... </record>      </group> </gsafeed>

    インデックス作成用の最小ドキュメント数

    正の値に設定した場合は、ダウンロードされるファイルに必要なレコードの最小数を指定します。 受け取るレコードが少ない場合、インデックス処理は中止されます。

    注意:この機能は、デフォルトでは有効になっていません。お使いの機能をアクティブにするには、テクニカルサポートにお問い合わせください。

    注意:この機能は、完全なインデックス処理でのみ使用されます。

    マップ

    XPath式を使用して、XML要素とメタデータとのマッピングを指定できます。

    • タグ

      解析済みXMLデータのXPath表現を指定します。 上記のAdobeXMLドキュメントの例を使用して、Itemtagオプションの下で、次の構文を使用してマッピングできます。

      /record/@displayurl -> page-url /record/metadata/meta[@name='title']/@content -> title /record/metadata/meta[@name='description']/@content -> desc /record/metadata/meta[@name='description']/@content -> body

      上記の構文は、次のように変換されます。

      • /record/@displayurl&nbsp;->&nbsp;page-url

        レコード displayurl 属性は、メタデータフィールド page-url に対応付けられます。

      • /record/metadata/meta[@name='title']/@content&nbsp;->&nbsp;title

        メタデータ要素内に含まれるメタ要素のコンテンツ属性(レコード要素内に含まれる)。タイトルは、メタデータフィールドタイトル<a11に対応します/>。

      • /record/metadata/meta[@name='description']/@content&nbsp;->&nbsp;desc

        メタデータ要素内に含まれるメタ要素のコンテンツ属性(レコード要素内)(name属性は説明)は、メタデータフィールド desc1に対応します/>。

      • /record/metadata/meta[@name='description']/@content&nbsp;->&nbsp;body

        メタデータ要素内に含まれるレコード要素内のコンテンツ属性(name属性が説明)は、メタデータフィールド本体<a11にマッピングされます。/>。

      XPathは比較的複雑な表記法です。 詳しくは、次の場所を参照してください。

      https://www.w3schools.com/xpath/ を参照

    • フィールド

      生成された各 <meta> タグで使用するname属性値を定義します。

    • メタデータ?

      フィールドが、現在のアカウントに対して定義済みのメタデータフィールドを選択できるドロップダウンリストになります。

      必要に応じて、フィールドの値は、未定義のメタデータフィールドにすることができます。 未定義のメタデータフィールドは、フィルタースクリプトで使用されるコンテンツの作成に役立ちます。

      フィルタリングスクリプトについてを参照してください。

      Index Connectorが、任意のマップフィールドで複数のヒットを持つXMLドキュメントを処理する場合、複数の値が連結されて、結果のキャッシュドキュメントで単一の値になります。 デフォルトでは、これらの値はコンマ区切り文字を使用して組み合わされます。 ただし、対応するフィールド値が定義済みのメタデータフィールドであるとします。 さらに、そのフィールドには許可リスト属性が設定されています。 この場合、フィールドのリスト区切り文字値(最初に定義された区切り文字)が連結に使用されます。

    • プライマリキー?

      プライマリ・キーとして識別されるマップ定義は1つだけです。 このフィールドは、このドキュメントをインデックスに追加したときに表示される一意の参照になります。 この値は、ドキュメントのインデックス内のURLで使用されます。

      プライマリキーの値は、インデックスコネクタ設定で表されるすべてのドキュメントで一意である必要があります。発生した重複は無視されます。 ソースドキュメントにプライマリキーとして使用する一意の値が1つだけ含まれていない場合でも、2つ以上のフィールドを組み合わせて一意の識別子を形成できる場合は、複数のタグを縦区切り文字("|")の値。

    • HTMLを削除しますか?

      このオプションを選択すると、このフィールドのデータに含まれるHTMLタグはすべて削除されます。

    • 削除に使用しますか?

      Incremental Index操作でのみ使用されます。 このXPathパターンに一致するレコードは、削除対象の項目を識別します。 これらの各レコードのプライマリキー値は、Delete File Pathと同様に、「削除」リクエストの作成に使用されます。

      注意:この機能は、デフォルトでは有効になっていません。お使いの機能をアクティブにするには、テクニカルサポートにお問い合わせください。

    • アクション

      行をマップに追加したり、マップから行を削除したりできます。 行の順序は重要ではありません。

    データソースの種類:XML

    有効

    クロールとインデックスを行うには、設定を「オン」にします。 または、構成を「オフ」にして、クロールやインデックス作成を防ぐことができます。

    注意:無効なインデックスコネクタの設定は、エントリポイントリストに見つかった場合は無視されます。

    ホストアドレス

    データソースファイルが見つかったホストシステムのURLアドレスを指定します。

    File Path

    リンク( <a> )を個々のXMLドキュメントに送信します。

    パスは、ホストアドレスのルートに対する相対パスです。

    プロトコル

    ファイルへのアクセスに使用するプロトコルを指定します。 次の中から選択できます。

    • HTTP

      必要に応じて、適切な認証資格情報を入力してHTTPサーバーにアクセスすることができます。

    • HTTPS

      必要に応じて、HTTPSサーバーにアクセスするための正しい認証資格情報を入力できます。

    • FTP

      FTPサーバーにアクセスするには、適切な認証資格情報を入力する必要があります。

    • SFTP

      SFTPサーバーにアクセスするには、適切な認証資格情報を入力する必要があります。

    • ファイル

    注意:プロトコル設定は、「ホストアドレス」または「ファイルパス」フィールドに情報が指定されている場合にのみ使用されます。個々のXMLドキュメントは、URLの仕様に従って、HTTPまたはHTTPSを使用してダウンロードされます。

    Itemtag

    指定したデータソースファイルの「行」を定義するXML要素を識別します。

    マップ

    列番号を使用して、列とメタデータのマッピングを指定できます。

    • タグ

      解析済みXMLデータのXPath表現を指定します。 上記のAdobeXMLドキュメントの例で、Itemtagオプションの下の次の構文を使用してマッピングできます。

      /record/@displayurl -> page-url /record/metadata/meta[@name='title']/@content -> title /record/metadata/meta[@name='description']/@content -> desc /record/metadata/meta[@name='description']/@content -> body

      上記の構文は、次のように変換されます。

      • /record/@displayurl&nbsp;->&nbsp;page-url

        レコード displayurl 属性は、メタデータフィールド page-url に対応付けられます。

      • /record/metadata/meta[@name='title']/@content&nbsp;->&nbsp;title

        メタデータ要素内に含まれるメタ要素のコンテンツ属性(レコード要素内に含まれる)。タイトルは、メタデータフィールドタイトル<a11に対応します/>。

      • /record/metadata/meta[@name='description']/@content&nbsp;->&nbsp;desc

        メタデータ要素内に含まれるメタ要素のコンテンツ属性(レコード要素内)(name属性は説明)は、メタデータフィールド desc1に対応します/>。

      • /record/metadata/meta[@name='description']/@content&nbsp;->&nbsp;body

        メタデータ要素内に含まれるレコード要素内のコンテンツ属性(name属性が説明)は、メタデータフィールド本体<a11にマッピングされます。/>。

      XPathは比較的複雑な表記法です。 詳しくは、次の場所を参照してください。

      https://www.w3schools.com/xpath/ を参照

    • フィールド

      生成された各<meta>タグで使用するname属性値を定義します。

    • メタデータ?

      フィールドが、現在のアカウントに対して定義済みのメタデータフィールドを選択できるドロップダウンリストになります。

      必要に応じて、フィールドの値は、未定義のメタデータフィールドにすることができます。 未定義のメタデータフィールドは、フィルタースクリプトで使用されるコンテンツの作成に役立ちます。

      フィルタリングスクリプトについてを参照してください。

      Index Connectorが、任意のマップフィールドで複数のヒットを持つXMLドキュメントを処理する場合、複数の値が連結されて、結果のキャッシュドキュメントで単一の値になります。 デフォルトでは、これらの値はコンマ区切り文字を使用して組み合わされます。 ただし、対応するフィールド値が定義済みのメタデータフィールドであるとします。 さらに、そのフィールドには許可リスト属性が設定されています。 この場合、フィールドのリスト区切り文字値(最初に定義された区切り文字)が連結に使用されます。

    • プライマリキー?

      プライマリ・キーとして識別されるマップ定義は1つだけです。 このフィールドは、このドキュメントをインデックスに追加したときに表示される一意の参照になります。 この値は、ドキュメントのインデックス内のURLで使用されます。

      プライマリキーの値は、インデックスコネクタ設定で表されるすべてのドキュメントで一意である必要があります。発生した重複は無視されます。 ソースドキュメントにプライマリキーとして使用する一意の値が1つだけ含まれていない場合でも、2つ以上のフィールドを組み合わせて一意の識別子を形成できる場合は、複数のタグを縦区切り文字("|")の値。

    • HTMLを削除しますか?

      このオプションを選択すると、このフィールドのデータに含まれるHTMLタグはすべて削除されます。

    • アクション

      行をマップに追加したり、マップから行を削除したりできます。 行の順序は重要ではありません。

  4. (オプション)Setup Maps​をクリックして、データソースのサンプルをダウンロードします。 データは、インデックスの適合性を調べられます。 この機能は、テキストおよびフィードのタイプでのみ使用できます。

  5. (オプション)Preview​をクリックして、設定の実際の動作をテストします。 この機能は、テキストおよびフィードのタイプでのみ使用できます。

  6. Add​をクリックして、設定をIndex Connector DefinitionsページとURL EntrypointsページのIndex Connector Configurationsドロップダウンリストに追加します。

    URL入力ポイントについてを参照してください。

  7. Index Connector Definitionsページで、rebuild your staged site index​をクリックします。

  8. (オプション)Index Connector Definitionsページで、次のいずれかの操作を行います。

インデックスコネクタ定義の編集

定義した既存のインデックスコネクタを編集できます。

メモ

Typeドロップダウンリストの「インデックスコネクタ名」や「種類」など、変更できないオプションがあります。

インデックスコネクタ定義を編集するには

  1. 製品メニューで、Settings/Crawling/Index Connector​をクリックします。

  2. Index ConnectorページのActions列見出しの下で、設定を変更するインデックスコネクタ定義名の​Edit​をクリックします。

  3. Index Connector Editページで、必要なオプションを設定します。

    インデックスコネクタ定義の追加」のオプションの表を参照してください。

  4. クリック Save Changes.

  5. (オプション)Index Connector Definitionsページで、rebuild your staged site index​をクリックします。

  6. (オプション)Index Connector Definitionsページで、次のいずれかの操作を行います。

インデックスコネクタ定義の設定の表示

既存のインデックスコネクタ定義の設定を確認できます。

Index Connector Definitionsページにインデックスコネクタ定義を追加した後は、その種類の設定を変更できません。 代わりに、定義を削除してから、新しい定義を追加する必要があります。

インデックスコネクタ定義の設定を表示するには

  1. 製品メニューで、Settings/Crawling/Index Connector​をクリックします。
  2. Index ConnectorページのActions列見出しの下で、設定を確認または編集するインデックスコネクタ定義名の​Edit​をクリックします。

インデックスコネクタ定義のコピー

既存のインデックスコネクタ定義をコピーして、作成する新しいインデックスコネクタの基本として使用できます。

インデックスコネクタ定義をコピーする場合、コピーされた定義はデフォルトで無効になります。 定義を有効または「有効にする」には、Index Connector Editページで定義を編集し、Enable​を選択する必要があります。

インデックスコネクタ定義の編集」を参照してください。

インデックスコネクタ定義をコピーするには

  1. 製品メニューで、Settings/Crawling/Index Connector​をクリックします。

  2. Index ConnectorページのActions列見出しの下で、設定を重複するインデックスコネクタ定義名の​Copy​をクリックします。

  3. Index Connector Copyページで、定義の新しい名前を入力します。

  4. クリック Copy.

  5. (オプション)Index Connector Definitionsページで、次のいずれかの操作を行います。

インデックスコネクタ定義の名前変更

既存のインデックスコネクタ定義の名前を変更できます。

定義の名前を変更した後、Settings > Crawling > URL Entrypoints​をチェックします。 新しい定義名がURL Entrypointsページのドロップダウンリストに反映されることを確認する必要があります。

インデックスを作成する複数のURLエントリポイントの追加を参照してください。

インデックスコネクタ定義の名前を変更するには

  1. 製品メニューで、Settings/Crawling/Index Connector​をクリックします。

  2. Index ConnectorページのActions列見出しの下で、変更するインデックスコネクタ定義名の​Rename​をクリックします。

  3. Index Connector RenameページのNameフィールドに、定義の新しい名前を入力します。

  4. クリック Rename.

  5. Settings/Crawling/URL Entrypoints​をクリックします。 リストに以前のインデックスコネクタの名前が存在する場合は、その名前を削除し、新しく名前を変更したエントリを追加します。

    インデックスを作成する複数のURLエントリポイントの追加を参照してください。 1.(オプション)Index Connector Definitionsページで、次のいずれかの操作を行います。

インデックスコネクタ定義の削除

不要になった、または使用しなくなった既存のインデックスコネクタ定義は削除できます。

インデックスコネクタ定義を削除するには

  1. 製品メニューで、Settings/Crawling/Index Connector​をクリックします。
  2. Index Connector DefinitionsページのActions列見出しの下で、削除するインデックスコネクタ定義名の​Delete​をクリックします。
  3. Index Connector Deleteページで、Delete​をクリックします。

このページ