使用指令碼式索引,您可以編寫、更新和維護增量索引選項,而無需登錄。 搜索自動機從伺服器上托管的文本檔案中讀取說明。
要使用指令碼式索引,請使用「指令碼式增量索引配置」頁來指定位於伺服器上的指令碼檔案(純文字檔案檔案)的URL。 例如, https://www.mysite.com/indexlist.txt
。當您的網站變更時,您可以手動或自動將指令區塊新增至文字檔案(新聞摘要、股票行情或其他變更檔案的資訊送達時,會觸發指令碼)。
當指令碼式增量索引開始時,搜索自動機讀取文本檔案並運行在該檔案中找到的新命令。 預設情況下,搜索自動機僅處理由檔案日期確定的新命令。 除非您在配置指令碼索引時勾選Clear Date,否則搜索自動機「記住」最近處理的塊的日期指定符。
您在URL中指定的指令碼檔案是位於伺服器上的純文字檔案。 您可以對行尾序列使用歸位、換行或兩者。 空白行包含零個或多個空格字元,後面接著行尾序列。 所有命令均不區分大小寫。
文本檔案以塊的形式組織,這些塊描述了搜索自動機在執行指令碼式增量索引時所使用的資訊。
區塊依日期排序,文字檔上方有最舊的區塊,下方有最新的區塊。 每個區塊都以單行date-command和date-specifier命令開始,並以空行分隔符號結束,如下列區塊範例所示(介於數個命令之間):
使用HTTP 1.1樣式時,低於10th的所有序數日期都需要前導零。 例如,11月6日是11月6日,而非11月6日。
命令 |
說明 |
---|---|
date-command |
每個塊的第一行以兩個日期命令之一開頭:
|
日期指定符 |
date-specifier 命令通常記錄將塊資訊添加到檔案中的順序日期和時間(date命令)或時間秒(秒命令)。 例如: 使用HTTP 1.1樣式時,低於10th的所有序數日期都需要前導零。 例如,11月6日是11月6日,而非11月6日。 搜尋自動機會「記住」最近處理過的區塊的日期指定字元,並僅索引其認為「較新」的資訊。 (即時對搜索機器人並不重要。 相反,與先前處理的時間相比的時間才是重要的。) 例如,搜索自動機讀取日期指定符為10:00 p.m的塊後,它不會讀取記錄時間在10:00 p.m.之前的任何塊,而不管索引操作何時運行。 在最壞的情況下,您可能會在日期指定字元中錯誤地輸入"2040",而非"2004"。 在這種情況下,搜索機器人在下次索引操作期間對2040塊進行索引,然後拒絕讀取任何其他資訊塊(除非有一個2040年後日期)。 如果發生此情況,請移除文字檔案中所有先前處理過的區塊,按一下「清除日期」,然後即時推送。 |
留言行 |
以"#"字元開始注釋行。 每條注釋行都必須是自己的行;您無法鍵入行章節附註釋。 注釋行不被視為空白行。 它也可以出現在區塊中的任何位置,即使是在日期或秒數命令之前,如下列範例所示: |
action-command |
每個文本塊可以包含任意數量的操作命令。 以下action-command選項與標準增量索引的選項相對應:
|
另請參閱關於URL遮色片。
在以下指令碼檔案示例中,如果日期指定符在日期之後是最近處理的塊的日期指定符,則搜索自動機將處理這些塊。 如果是,則會執行下列索引作業:
從索引中刪除y2k-problems.html
。
將no-y2k-problems.html
添加到搜索索引中,並且不跟隨no-y2k-problems.html
的任何連結。
編目時,從搜尋索引中排除與housewares.htm
和lightfixtures.htm
l相符的URL。
在www.mydomain.com
下包括所有其他目錄和文檔。
更新products
和information
目錄內的所有文檔,搜索和索引自上次索引操作以來更改的所有子連結。
在編目時,排除網站archive
區段中的URL(如果URL的日期是1999年1月1日或之前)。
從搜尋索引中排除與housewares.html
和lightfixtures.html
相符的URL。
在help
目錄中為檔案編製索引,但不從這些檔案編目或為任何連結編製索引。
搜索並索引為www.mydomain.com
遇到的任何其他檔案。
# Start of file.
# Added by John Smith
date Sat, 01 Jan 2004 16:05:53 PST
exclude https://www.mydomain.com/housewares.html
exclude https://www.mydomain.com/lightfixtures.html
include https://www.mydomain.com/
delete https://www.mydomain.com/y2k-problems.html
add https://www.mydomain.com/no-y2k-problems.html nofollow
date Sun, 02 Jan 2004 20:19:08 PST
# Added by the wire service updater
exclude-date 1999-01-01 https://www.mydomain.com/archive server-date
exclude https://www.mydomain.com/housewares.html
exclude https://www.mydomain.com/lightfixtures.html
include https://www.mydomain.com/help/ nofollow
include https://www.mydomain.com/
# no add files, just update existing files
# update all files in the "products" directory
update https://www.mydomain.com/products/
# update all files in the "information" directory
update regexp ^https://www\.mydomain\.com/information/.*$
# End of file.
您可以指定已建立的指令碼,該指令碼可以寫入、更新和維護增量索引,而無需登錄。 搜索自動機從伺服器上托管的文本檔案中讀取指令,以執行增量索引。
配置指令碼式增量索引
在產品功能表上,按一下「Index > Scripted Index > Configuration」。
在Scripted Incremental Index Configuration頁面的Script File URL中,輸入位於您伺服器上的文字檔案指令碼的URL。
請參閱關於指令碼化索引。
(可選)如果您不希望搜索自動機「記住」最近處理的塊的日期指定符,請選中Clear Date。
預設情況下,搜索自動機只處理文本檔案中找到的新命令塊,該命令塊由檔案的日期確定。 如果您不想使用預設值,請勾選Clear Date。
按一下 Save Changes.
(可選)執行下列任一項作業:
按一下History以回復您所做的任何變更。
請參閱使用歷史記錄選項。
按一下 Live.
請參閱檢視即時設定。
按一下 Push Live.
請參閱推送舞台設定live。
您可以安排指令碼式增量索引以在一天中定期執行。
您選取的基本時間會根據「帳戶設定」中設定的時區為本機時間。
請參閱設定您的帳戶設定。
Web伺服器通常會安排在半夜停工進行維護。 如果伺服器在計畫的索引時間內關閉,則索引過程將失敗。 請確定您選取了一天中的某個時間,您的Web伺服器才可用。
索引排程僅適用於您的即時索引;不能計劃分段增量索引。
要設定即時網站的指令碼式增量索引計畫
您可以使用指令碼增量索引來為即時或分段網站的「片段」建立索引,例如經常變更的頁面集合,而不需登入。
要使用此功能,請確定已配置指令碼式增量索引文本檔案。
請參閱配置指令碼式增量索引。
若要執行即時或分段網站的指令碼增量索引
在產品功能表上,執行下列其中一項作業:
按一下 Scripted Index Now.
(可選)如果發生索引錯誤,請按一下View Errors以查看相關日誌。
當活動完整指令碼索引或分段完整指令碼索引完成時,您可以查看其關聯日誌以排除任何發生的錯誤。
您無法匯出記錄檔,也無法儲存記錄檔。 不過,日誌仍可供查看,直到新索引出現。
若要檢視即時或分段網站的增量索引記錄檔
在產品功能表上,執行下列其中一項作業:
按一下Index > Scripted Index > Live Log。
按一下Index > Scripted Index > Staged Log。
在記錄頁的上方或下方,執行下列任一作業:
使用導覽選項First、Prev、Next、Last或Go to line在日誌中移動。
使用顯示選項Errors only、Wrap line或Show來調整您所看到的內容。