常見問題頁面,討論在網站上建立SWF檔案索引和搜尋的支援。
以下是有關SWF檔案的常見問題:
如果SWF檔案包含在HTML頁面的內嵌或物件標籤中,則會編目並建立索引,如下列範例所示:
<embed src="Flash-file-URL">
<object>
<param name=movie value="Flash-file-URL">
</object>
如果您將檔案URL列為入口點,也會辨識SWF檔案。
若要搜尋和索引SWF檔案,請選取內容類型Adobe Flash Movies(Settings > Crawling > Content Types)。
只要Flash檔案是從HTML文檔中的<embed>
標籤或<object>
標籤引用的,就會對文本編製索引,並搜索檔案中列出的所有URL。
如果您的檔案未從<embed>
標籤或<object>
標籤引用,您可以在HTML檔案的<a href=...>
標籤中列出SWF檔案,或列為URL入口點。
SWF檔案由下列MIME類型識別:
application/x-shockwave-flash
如果副檔名為。swf,也可以使用application/octet-stream
"或text/plain
MIME類型識別SWF檔案。
配置錯誤的伺服器可能會對SWF檔案使用不同的MIME類型。 如果您在編目和索引SWF檔案時遇到問題,請務必檢查您的伺服器組態。
SWF檔案中包含的文字會建立索引,就像在封閉的HTML頁面中是<body>
文字一樣。 如果搜尋結果找到內嵌SWF檔案中的文字,結果會實際連結至封閉的HTML頁面,而非SWF檔案。 這樣,SWF檔案就會以正確的內容顯示。
如果SWF檔案包含URL做為「載入影片」動作,則參照的SWF檔案中的文字會作為封閉HTML頁面的一部分建立索引。
如果SWF檔案包含URL做為「Get URL」(取得URL)動作,URL會稍後編目並建立索引,就像HTML <a href=...>
參考稍後會編目並建立索引一樣。
如果SWF檔案列為URL入口點,SWF檔案文字會以單一頁面建立索引。 從入口點SWF連結直接尋找文字至影片,而非封閉HTML頁面的搜尋結果。
無.SWF檔案會視為其封閉HTML頁面的一部分。 SWF檔案中包含的所有「載入影片」URL也會視為封閉HTML頁面的一部分。 因此,從HTML頁面參考的SWF檔案不會計為帳戶的頁面總數的「頁面」。
如果SWF檔案列為URL入口點,則該SWF檔案和該SWF檔案中列出的所有「載入影片」URL都會計為帳戶頁面總計的一個「頁面」。
為防止對SWF檔案編製索引,可以向封閉的HTML文檔添加自動機meta標籤(<meta name="ROBOTS" content="NOINDEX">
)或<noindex>
標籤。 亦即,包含<embed>
或<object>
標籤的檔案。
您也可以使用robots meta標籤(<meta name="ROBOTS" content="NOFOLLOW">
)來防止SWF檔案中包含的下列URL。 如果封閉的HTML檔案已停用後續功能,則SWF檔案中列為「取得URL」動作的URL將不會後續。
若要停用SWF索引功能,請取消選取內容類型Adobe Flash Movies(Settings > Crawling > Content Types)。
您也可以選擇使用URL Masks來停用SWF檔案的索引。
若要停用SWF索引,請輸入下列其中一個URL遮色片:
exclude *.swf
(如果您不使用規則運算式)exclude regexp ^.*\.swf$
(如果您使用規則運算式)請參閱規則運算式。
網站搜尋/銷售從使用AdobeFlash建立的SWF檔案取得UTF-8。 UTF-8不包含語言指示。 如果您選擇了內容類型Adobe Flash Movies(Settings > Crawling > Content Types),則必須使用中繼資料插入來指定SWF檔案使用的語言。
請參閱添加欄位插入定義。
舊版SWF檔案也不指定字元集。 如果您選取SWF內容類型Adobe Flash Movies(Settings > Crawling > Content Types),則必須使用中繼資料插入來指定SWF檔案中使用的字元集。
常見問題頁面,討論網站搜尋/銷售如何協助造訪您網站的客戶找到所要搜尋的內容。
以下是一般搜尋的常見問題:
以下是與搜尋功能有關的常見問題:
無.這是網站搜尋/銷售的主要優勢。 引擎是專業應用程式,完全托管在我們的高效能伺服器上,並加以維護。 這使得軟體比其他搜尋解決方案更容易使用。 您只需將少量的HTML程式碼新增至您的網頁,讓網站的客戶可以輸入搜尋。 網站搜尋/銷售會處理所有其餘的工作。
我們會持續提供您的搜尋服務,讓您的訪客可以不間斷地搜尋您的網站。 若要查看您的網站是否超過頁面限制,請檢閱完整索引狀態或即時記錄。
請參閱關於完整索引。
請參閱檢視即時或分段的完整索引記錄……。
每週報告會傳送給每個作用中帳戶的擁有者。 您可以按一下Settings > My Profile > Personal Information來變更電子郵件地址。 如果您有多個作用中的搜尋帳戶,則所有電子報都會傳送至新位址。
請參閱設定您的個人使用者資訊。
網站搜尋/銷售是安全、快速、穩定且易於使用的。 您不會被迫使用Cookie(雖然您可以的話)來使用我們的產品,而且敏感資訊(例如密碼)永遠不會放在任何URL連結上,這些URL連結稍後可從您的瀏覽器中擷取。
Adobe致力於尊重其客戶和訪客的隱私權。 請參閱Adobe隱私中心。
是.您可以控制搜尋結果的外觀和內容。 在您網站的搜尋結果範本中,您可以建立連至您自己橫幅交換網路的連結,例如LinkExchange或SmartClicks。 您的訪客進行的任何點擊都會正確計入您的橫幅廣告交換帳戶。
是.這是網站搜尋/銷售的獨家功能。 透過我們先進的範本技術和HTML的一些知識,您可以精確控制搜尋結果的顯示方式。
請參閱搜尋範本標籤。
您的伺服器和網站搜尋/銷售伺服器之間的轉換完全順暢且對客戶不可見。 如果您不知道HTML,或您沒有時間建立自訂範本,則可從Adobe內部專業網頁開發人員團隊所建立的各種吸引人、現成可用的範本中選擇。
是.我們會持續提供搜尋統計資料,以瞭解過去兩個月來訪客在您網站上進行的搜尋。 您可以隨時在產品功能表的報表下檢視這些統計資料。 搜尋報表會提供您有關訪客在您網站上尋找哪些內容的重要資訊。 您可使用此資訊來改善設計或調整網站搜尋/銷售引擎,以更好地為訪客服務。
您可以輕鬆設定帳戶,以啟用或停用在PDF檔案、純文字檔案、Flash影片、MP3檔案或Microsoft Office檔案中找到的文字索引和搜尋功能。
這些設定會在Staged Content Types頁面上控制。
請參閱關於內容類型。
靜態或動態產生的HTML網頁會建立索引,包括從資料庫或任何其他後端程式建立的網頁。 由於瀏覽器所看到的HTML程式碼已建立索引,因此只要這些後端架構產生HTML頁面,您就可以在網站上使用網站搜尋/銷售。
搜尋機器人會從Account Settings中指定之網站位址的第一頁開始,爬行您的網站,並追蹤頁面間的連結。
請參閱設定您的帳戶設定。
當搜尋自動機爬蟲並索引您網站的所有頁面時,您可以使用搜尋引擎來搜尋您的網站。 換言之,如果動態產生的檔案與來自其他頁面的連結交織在您的網站中,搜尋機器人仍可以編目並索引動態內容。
在您的網站內容編目並建立索引後,您網站的客戶可以在已建立索引的內容中搜尋資訊。
當您希望訪客尋找與其搜尋查詢相關的頁面時,可以使用同義字。
例如,假設您的網站上有一個頁面,其中包含要銷售的產品價目表。 不過,在檢查網站搜尋/銷售所提供的搜尋報表後,您會發現客戶在搜尋中會尋找「成本」、「費用」或「費用」。 這些字詞不會在搜尋結果中顯示您的價目表頁面。 使用Dictionaries中的Add Synonyms功能,您可以指定這些單字都是同義字,而且無論客戶使用哪個搜尋詞,您的客戶都可以找到您的價目表。
請參閱關於字典。
是.使用進階關聯介面,您可以控制特定搜尋查詢傳回的頁面。 如果您想確定客戶在查詢特定字詞時會看到特定頁面,此功能會很有用。
請參閱新增中繼標籤欄位。
是.網站搜尋/銷售範本在可讓您建立使用您選擇的語言並符合網站外觀的結果頁面時十分靈活。
範本包含文字、標準HTML標籤和特殊標籤的組合,這些標籤定義為顯示搜尋結果。 當客戶執行搜索時,搜索自動機讀取模板,使用標準HTML標籤輸出文本,並基於特殊模板標籤插入結果連結。
請參閱搜尋範本標籤。
如果要更改結果語言,可以編輯模板上顯示的英文文本。
請參閱編輯演示或傳輸模板。
是.只需單一Adobe客戶登入,您就可以管理許多不同網站的不同搜尋引擎。 在「帳戶」下選擇並管理帳戶。
請參閱選擇要使用的不同帳戶。
是.您可以使用URL Entrypoints來設定存取多個網域。 提供您擁有之其他網域的URL登入點。 請記住,您必須擁有索引未擁有的網域的權限。
請參閱關於URL入口點。
是.包含「系列」功能,可讓客戶搜尋您網站的特定區域,以快速找到所要的內容。
請參閱關於系列。
例如,客戶可以搜尋與產品銷售資訊相關的URL集合,或是與支援服務相關的URL集合。 您可以設定系列,讓客戶看到系列的下拉式清單或一組核取方塊。
是.指定URL遮色片,以決定您要包含或排除在索引之外的網站頁面。 URL遮色片會決定網站頁面是否出現在您的搜尋結果中。
請參閱關於URL遮色片。
請參閱關於URL遮色片指令碼。
若要防止搜尋個別網頁的部分,您可以排除頁面的某些部分以建立索引。 使用<noindex>
和</noindex>
標籤環繞文字。 如果您想從搜尋中排除導覽文字,此方法很實用。
網頁通常會使用類似下列的中繼標籤來指定字元集:
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
網站搜尋/銷售引擎會使用現今網際網路上使用的所有常用字元集,正確索引網頁。 部分支援的字元集包括:
阿拉伯文(ISO-8859-6) |
繁體中文;Big5) |
日文(Shift_JIS) |
阿拉伯文(Windows-1256) |
繁體中文;EUC-TW) |
俄文(KOI8-R) |
波羅的海(ISO-8859-4) |
西里爾文(ISO-8859-5) |
南歐(ISO-8859-3) |
波羅的海(Windows-1257) |
西里爾文(Windows-1251) |
土耳其文(ISO-8859-9) |
中歐(ISO-8859-2) |
希臘文(ISO-8859-7) |
土耳其文(Windows-1254) |
中歐(Windows-1250) |
希臘文(Windows-1253) |
Unicode(UTF-8) |
中文(ISO-2022-CN) |
希伯來文(ISO-8859-8) |
US-ASCII(us-ascii) |
中文(ISO-2022-CN-EXT) |
希伯來文(Windows-1255) |
西歐(ISO-8859-1) |
中文(簡體;EUC-CN) |
日文(EUC-JP) |
西歐(ISO-8859-15) |
中文(簡體;GB2312) |
日文(ISO-2022-JP) |
西歐語系(Windows-1252) |
中文(簡體;GBK) |
日文(ISO-2022-JP-1) |
西歐文(x-mac-roman) |
中文(簡體;HZ-GB-2312) |
日文(ISO-2022-JP-2) |
請聯絡技術支援以詢問上述未列出的字元集。
變更網站內容後,您可以執行完整索引或增量索引。 網站搜尋/銷售下載及索引任何變更的網站內容。 建立索引完成後,您的客戶可以搜尋新內容。 您也可以在特定時間和特定日期排程網站的自動索引。
請參閱執行即時或分段網站的完整索引……。
請參閱執行即時或分段網站的遞增索引……。
請參閱設定即時網站的完整索引排程。
請參閱設定即時網站的遞增索引排程。
是.您可以每天排程網站的自動索引。
除了每日自動索引外,您還可以選擇頻繁變更其網站的部分,以增量方式建立索引。 在已排程自動索引的日,您可以控制索引發生的時間。 此外,您隨時都可以手動啟動網站索引。
請參閱設定即時網站的完整索引排程。
請參閱設定即時網站的遞增索引排程。
如果您使用HTTP基本驗證以密碼保護網站的某些部分,您可以指定網站搜尋/銷售可用來為網站建立索引的領域和密碼。
是.您可以在安全伺服器(https)上編目和建立內容索引。
是.機器人排除協定是符合的。 搜尋機器人會檢查robots.txt檔案(如果它存在於您的網站上)。 如果您的robots.txt檔案排除所有自動機來搜尋您的網站,則網站搜尋/銷售自動機也會排除。 若要僅允許網站搜尋/銷售自動機編目您的網站,請將robots.txt檔案的內容設定為:
User-agent: Atomz/1.0
Disallow:
User-agent: *
Disallow: /
您可以在以下網址進一步瞭解Web機器人和機器人排除協定:
https://www.robotstxt.org/orig.html
是.此案例是建立遞增索引功能以促進網站搜尋/銷售的原因。 增量索引的主要優點是,它可讓公司頻繁地為網站中不斷變化的部分建立動態索引。 此類功能可確保您以「最快」的精確度顯示搜尋結果。
請參閱執行即時或分段網站的遞增索引……。
請參閱設定即時網站的遞增索引排程。
靜態或動態產生的HTML網頁,包括從資料庫建立的頁面或任何其他後端程式都會建立索引。 由於瀏覽器檢視的HTML程式碼已建立索引,因此只要後端資料庫資訊產生於HTML頁面,您就可以在網站上使用網站搜尋/銷售。
搜尋機器人會從Account Settings中指定之網站位址的第一頁開始,爬行您的網站,並追蹤頁面間的連結。
請參閱設定您的帳戶設定。
當搜尋自動機爬蟲並索引您網站的所有頁面時,您可以使用搜尋引擎來搜尋您的網站。 換言之,如果動態產生的檔案與來自其他頁面的連結交織在您的網站中,搜尋機器人仍可以編目並索引動態資料庫內容。
在您的網站內容編目並建立索引後,您網站的客戶可以在已建立索引的內容中搜尋資訊。
您可以輕鬆啟用完整內容搜尋,或以主題為基礎的搜尋範圍較窄,但僅限於標題中的資訊、中繼描述、中繼關鍵字檔案標籤,或全部三種。 使用中繼資料定義,您也可以在實際搜尋結果中建立自訂顯示欄位,例如產品影像。
請參閱新增中繼標籤欄位。
是.您可以使用指令碼或程式來起始網站的增量索引,以及在內容變更或更新時,ping伺服器來索引網站。
請參閱關於指令碼化索引。
一個常見問題頁面,討論Search&Promote中各種功能實作。
以下是網站Search&Promote中功能實作的常見問題:
設定橫幅廣告出現時的業務規則,或協助決定結果出現的順序。 您也可以設定Facet中項目的位置,以及指定搜尋使用的範本。
重新排序業務規則,以變更其在簡報範本上執行的順序。 業務規則按照定義的順序運行;也就是說,規則的訂單編號越高,在流程中執行的時間越晚,超過了之前的規則。 通過在「業務規則」頁上表的「順序」列中輸入新編號,可以重新排序規則。
請參閱關於業務規則。
當生成索引時,無論其是完整索引還是增量索引編目狀態資訊都會即時顯示。 例如,您可以檢視索引建立程式期間發生的開始時間、用時和任何錯誤。 此外,還會顯示有關上一個索引狀態的資訊。 使用此資訊來疑難排解您遇到的索引錯誤。
如需排程索引,請參閱設定即時網站的完整索引排程和設定即時網站的增量索引排程。
如需啟動分段索引,請參閱執行即時或分段網站的完整索引……或執行即時或分段網站的遞增索引……。
網站可能會逐漸成長,而且隨著時間推移,Search&Promote會「發現」新增的更多檔案和網頁。 最終,您的帳戶可能會超過您的索引大小限制。在這種情況下,您可以考慮使用URL Mask。 此功能可隱藏文檔和網頁,使其不需要或不需要建立索引的索引編目,從而減少索引大小。 另一個選擇是聯絡技術支援,讓您的索引大小限制在帳戶中設定得更大。
請參閱關於URL遮色片。
如果您不確定該做什麼,請聯絡技術支援。 可能有許多其他變數會影響您的索引大小,若經過調整,可能也會影響您帳戶的帳單。
一個常問的問題頁面,討論對19種以上語言的索引和搜尋支援,包括多位元組亞洲語言,例如中文(簡體和繁體)、日文和韓文。
以下是語言和字元集的常見問題:
您的搜尋帳戶的「Web表單」區段包含您用來新增搜尋功能至網站的範例搜尋表單。 如果您查看此搜尋表單程式碼,可以找到類似下列的行:
<input type=hidden name="sp_f" value="iso-8859-1">
此程式碼行會告訴搜尋引擎傳入的查詢是以iso-8859-1編碼,這是西歐語言的常用編碼。 您可以前往產品功能表,然後按一下「Settings > My Profile > Personal Information」,以變更此設定。 在Personal Information頁面的Character Encoding下拉式清單中,選取新的編碼。
請參閱設定您的個人使用者資訊。
您也可以編輯搜尋表單的sp_f
行,手動變更網頁上的編碼值。 請記住,搜尋表單的sp_f
值必須符合顯示表單之頁面的字元集編碼。
預設情況下,否。 只要您的網站頁面正確識別其字元集編碼,即使頁面使用多種編碼,搜尋查詢的編碼和頁面的編碼之間也會進行必要的轉換。
帳戶的字元集編碼會決定結果範本的預設編碼。
請參閱設定您的個人使用者資訊。
您可以進一步瞭解如何在HTML範本中指定字元集。
請參閱搜尋範本標籤。
是.但是,Unicode字元集(例如UTF-8)無法提供足夠的資訊來判斷頁面所使用的語言。 若要正確搜尋這些頁面,必須指定語言。 要確定文檔語言,資訊按以下順序處理:
您的伺服器為檔案傳送的內容語言HTTP標題。
文檔<HEAD>
部分中的META元素(例如META HTTP-EQUIV="Content-Language" Content="ja_JP"
)。
<HTML>
標籤的LANG屬性(例如<HTML LANG="ja_JP">
)。
如果您的伺服器未設定為傳送「內容語言HTTP」標題,而您的檔案既不包含語言META元素,也不包含<HTML>
標籤的語言屬性,您可以使用中繼資料插入來指定適當的語言。
請參閱添加欄位插入定義。
網站搜尋/銷售從Adobe PDF檔案取得UTF-8,而無語言指示。 如果您選取PDF Documents(Settings > Crawling > Content Types),則必須使用中繼資料插入來指定PDF檔案中使用的語言。
請參閱添加欄位插入定義。
網站搜尋/銷售從AdobeFlash影片檔取得UTF-8,這些影片檔案是使用AdobeFlash建立,沒有語言指示。 如果您選擇了內容類型Adobe Flash Movies(Settings > Crawling > Content Types),則必須使用中繼資料插入來指定SWF檔案中使用的語言。
對於Flash版本4或更舊版本的SWF檔案,不指定檔案中字元的字元集。 如果您選擇了內容類型Adobe Flash Movies(Settings > Crawling > Content Types),則必須使用中繼資料插入來指定SWF檔案中使用的字元集。
請參閱添加欄位插入定義。
網站搜尋/銷售從Microsoft Office檔案(Microsoft Word、Microsoft Excel和Microsoft PowerPoint)取得UTF-8,而無語言指示。 如果您選擇了內容類型Microsoft Office Files(Settings > Crawling > Content Types),則必須使用元資料插入來指定Microsoft Office檔案中使用的語言。
請參閱添加欄位插入定義。
如果您選擇內容類型Text in MP3 Music Files(Settings > Crawling > Content Types),則必須使用中繼資料插入來指定用於編碼MP3檔案的字元集。
請參閱添加欄位插入定義。
如果您選擇了內容類型Text Documents(Settings > Crawling > Content Types),則必須使用元資料插入來指定用於編碼。txt檔案的字元集。
請參閱添加欄位插入定義。
如果您的帳戶使用預設範本、其中一個現成可用的範本,或以這些範本為基礎的範本,則可能包含將Arial或Helvetica指定為字型的字型標籤。 例如, <font face="arial, helvetica" size="+1">
。當使用Arial或Helvetica字型面時,Netscape 4.7和舊版不會顯示中文、日文或韓文字元。 移除face
屬性,或以更適合中文、日文或韓文的字型面取代字型面。
常問的問題頁面,討論與低索引頁面計數相關的常見問題。
以下是關於低索引頁面計數的常見問題:
索引記錄檔包含網站搜尋/銷售自動機在建立網站索引時收集的詳細資訊。 記錄檔包含已編目和遇到錯誤的連結清單。 檢查索引日誌是確定網站上所有頁面未建立索引的最佳開始位置。
請參閱檢視即時或分段的完整索引記錄……。
請參閱查看即時或分段的增量索引日誌……。
當您在HTML表單中輸入冗長的URL時,可能會導致一或多個印刷錯誤。 請記住,URL不應包含任何空格。 此外,請注意,有些Web伺服器會以區分大小寫的方式處理URL。
在產品功能表上,按一下「Settings > Crawling > URL Entrypoints」。 在Staged URL Entrypoints頁面上,驗證以下內容:
若要測試您的URL登入點,請複製URL並貼至網頁瀏覽器,以查看您的網站是否出現。 如果未顯示,請再次勾選,以確保您的URL路徑未發生任何錯誤。
請參閱關於URL入口點。
網站搜尋/銷售機器人會像客戶一樣爬行您的網站;依循頁面間的連結。 在搜尋機器人找到您網站上的其他頁面並建立索引之前,連結必須存在於入口點網頁中。
您可以在您的網站上使用複雜的導覽技術,例如使用JavaScript連結至其他頁面的滾動動作和功能表。 不過,網站搜尋/銷售自動機無法跟隨內嵌於JavaScript的連結。
您可使用的一個解決方案,就是在包含JavaScript的HTML中,將其他頁面的隱藏連結置入。 雖然您網站的客戶看不到這些連結,但搜尋機器人仍會尋找和編目這些連結。 您可以將隱藏的標籤放置在頁面底部的</body>
標籤之前。 它們可能如下所示:
<a href="/mydir/mypag1.html"></a>
<a href="/mydir/mypag2.html"></a>
另一個解決方案是將網站上其他頁面的URL列為要編目和索引的入口點。 以https://
開頭的URL,如下所示:
https://www.mydomain.com/mydir/mypag1.html
https://www.mydomain.com/mydir/mypag2.html
HTML規格要求<html>
、<head>
和<body>
標籤遵循HTML文檔中的特定序列。 所有網頁中的標籤都必須有下列順序:
<html>
<head>
...
<i>head tags go here</i> ...
</head>
<body>
...
<i>body tags go here</i> ...
</body>
</html>
如果HTML標籤順序不正確,則網站搜尋/銷售自動機無法正確解析您的網頁並建立其索引。 以下是未在正確順序中的標籤範例:
<body>
<head>
...
<i>head tags are here</i> ...
</head>
...
<i>body tags are here</i> ...
</body>
在這種情況下,請將<html>
、<head>
和<body>
標籤置於網頁上的正確序列中。
請確定您仔細檢閱並更正網頁中的任何無效HTML注釋。
HTML規範要求HTML注釋以字元<!--
開頭,以字元-->
結尾。 很容易忽略格式錯誤的注釋,這些注釋會導致網站搜尋/銷售自動機不正確剖析您網頁上的標籤。 格式錯誤的註解可能導致網站搜尋/銷售自動機遺漏其他必須加以剖析的重要標籤。 請留意網頁中<body>
標籤前的注釋。
以下是正確格式注釋的示例:
<!-- This HTML comment is OK. -->
以下是錯誤格式注釋的範例:
<!- This HTML comment is improperly formed. ->
<! This HTML comment is also improperly formed. >
通常,網站可由網站伺服器上實際存在且網域位址不同的頁面組成。 例如,若您的主要網站位址為:
https://www.mydomain.com/
您的網站可能也會在其他網域上有頁面,例如:
https://www.otherdomain.com/
依預設,網站搜尋/銷售自動機不會跟隨除主網域以外網域的連結。 不過,只要為搜尋帳戶設定額外的登入點,您就可以輕鬆為多個網域建立索引。
在產品功能表上,按一下「Settings > Crawling > URL Entrypoints」。 新增您網站的「主要網站入口點」URL。 然後,將其他URL登入點新增至包含網站頁面的任何其他網域。 例如,您可將主要URL入口點設為:
https://www.mydomain.com/
並新增下列其他網站URL入口點:
https://www.otherdomain.com/
您可能使用虛擬網域服務(有時稱為「網域重新導向服務」),為客戶提供更佳的URL以連至您的網站。 例如,假設您網站的實際位址如下:
https://www.myispdomain.com/~myname/mywebpages/
不過,您使用虛擬網域服務,讓客戶可以透過下列位址來到您的網站:
https://myname.adomain.com/
或
https://adomain.com/myname/
依預設,網站搜尋/銷售自動機不會跟隨除主網域以外網域的連結。 不過,只要為搜尋帳戶設定額外的登入點,您就可以輕鬆為多個網域建立索引。
在產品功能表上,按一下「Settings > Crawling > URL Entrypoints」。 將「主網站URL入口點」新增至網站的虛擬網域名稱。 然後,新增額外的登入點至您網站實際所在的網域。
例如,您可將主要URL入口點設定為:
https://myname.adomain.com/
並新增下列其他網站URL入口點:
https://www.myispdomain.com/~myname/mywebpages/
許多網站的首頁在<head>...</head>
標籤之間包含中繼重新整理標籤,類似下列:
<meta http-equiv="Refresh" content="0;URL=https://www.adomain.com/apath/afile.html">
在某些情況下,網站搜尋/銷售自動機無法跟隨中繼重新整理URL來索引您網站的內容。 透過設定額外的入口點,可輕鬆解決此問題。
在產品功能表上,按一下「Settings >編目> URL Entrypoints」。 將另一個入口點新增至meta refresh標籤的URL。
有時網頁會使用中繼自動機標籤來控制定期嘗試編目網站的網頁自動機。 中繼自動機標籤會出現在網頁的<head>...</head>
標籤之間,其外觀類似下列標籤:
<meta name="robots" content="noindex, nofollow">
由於網站搜尋/銷售機器人本身就是網頁機器人,所以它會遵循中繼機器人標籤的方向。 以此方式排除其他自動機,也排除網站搜尋/銷售自動機。
您可以在以下網址進一步瞭解Web機器人和機器人排除協定:
https://www.robotstxt.org/orig.html
移除或修改您要在網站上建立索引之網頁上的中繼自動機標籤。
有時,網站的頁面名為robots.txt,會排除所有或特定的機器人進行編目。 若要查看您的網站是否有robots.txt檔案,請在頂層網域下方尋找,如下所示:
https://www.yourdomain.com/robots.txt
robots.txt檔案的內容看起來類似下列文字:
User-agent: *
Disallow: /
由於網站搜尋/銷售機器人本身是網頁機器人,因此會遵循robots.txt檔案中的指示——排除網站搜尋/銷售機器人。 若要解決此問題,請編輯robots排除檔案(robots.txt),以允許網站搜尋/銷售自動機按如下方式編目和索引您的網站:
User-agent: Atomz/1.0
Disallow:
User-agent: *
Disallow: /
常見問題頁面,討論在網站上建立Microsoft® Office檔案索引和搜尋的支援。
以下是有關Microsoft Office檔案的常見問題:
Microsoft Word檔案、Microsoft Excel檔案和Microsoft PowerPoint檔案的完整內容已建立索引。
Microsoft Word檔案的下列部分已建立索引:
Microsoft Excel檔案的下列部分已建立索引:
Microsoft PowerPoint檔案的下列部分已建立索引:
包含在Microsoft Office檔案中的圖形,或包含圖形中的任何文字,都不會建立索引。 自訂屬性定義不會建立中繼資料的索引。 特殊欄位中的某些文字(例如PowerPoint檔案中的頁首和頁尾)也不會建立索引。
搜尋自動機對Microsoft Office檔案和HTML檔案進行索引的不同之處在於,每個HTML檔案都是個別頁面,而單一Microsoft Office檔案可代表數百個頁面。 因此,每個頁面在Microsoft Office檔案中都會計為您搜尋帳戶下的個別頁面。
如果不希望搜索自動機搜索和索引Microsoft Office檔案,請取消選擇內容類型Microsoft Office Files(Settings > Crawling > Content Types)。
您也可以使用URL Masks來停用Microsoft Office檔案的索引。
輸入下列URL遮色片:
如果您不使用規則運算式 |
|
如果您使用規則運算式 |
|
請參閱規則運算式。
常見問題頁面,討論在網站上建立MP3音樂檔案索引與搜尋的支援。
以下是有關MP3檔案的常見問題。
MP3檔案的編目和索引有兩種方式。 最常見的方式是來自HTML檔案中的錨點href標籤:
<a href="MP3-file-URL"></a>
第二種方式是將MP3檔案的URL輸入為URL入口點。
請參閱關於URL入口點。
要激活帳戶的MP3搜索和索引,請在產品菜單中按一下Settings > Crawling > Content Types。 在Staged Content Types頁面上,選擇Text in MP3 Music Files。
請參閱關於內容類型。
MP3檔案的MIME類型是「audio/mpeg」。
MP3檔案可選擇儲存少量的文字資訊。 這些資訊可包含相簿名稱、藝術家姓名、歌名、歌曲類型、發行年份和注釋。 這些資訊會儲存在檔案的最後端,稱為TAG。 包含TAG資訊的MP3檔案按以下方式編製索引:
是的,您網站上編目並建立索引的每個MP3檔案會計為一頁。
使用<nofollow>
和</nofollow>
標籤來環繞連結至MP3檔案的錨記。 搜索自動機不會跟隨這些標籤之間的連結。
另一種方法是將MP3檔案的URL新增為排除遮色片。
請參閱關於URL遮色片。
請參閱關於URL遮色片指令碼。
要控制帳戶的MP3索引,最簡單的方法是取消選取Staged Content Types頁面上的Text in MP3 Music Files。
請參閱選擇要編目的內容類型和索引。
您也可以使用「URL遮色片」功能,以依副檔名停用MP3索引。 若要這麼做,請在產品功能表上按一下「Settings > Crawling > URL Masks」。 輸入以下蒙版之一:
如果您的帳戶…… |
輸入下列URL遮色片 |
---|---|
不使用規則運算式 |
exclude *.mp3 |
使用規則運算式 |
排除regexp ^。*\.mp3$ |
請參閱規則運算式。
若要搜尋中文、日文或韓文MP3檔案,請在產品選單上按一下Settings > Crawling > Content Types > Text in MP3 Music Files。 然後,按一下「Settings > Metadata > Injections」,並指定用來編碼MP3檔案的字元集。
請參閱選擇要編目的內容類型和索引。
請參閱關於注射。
常見問題頁面,討論在網站上建立PDF檔案索引和搜尋的支援。
以下是有關PDF檔案的常見問題:
PDF檔案的完整內容已建立索引。 PDF檔案的下列部分已建立索引:
PDF目錄、檔案中的任何圖形,或包含圖形的任何文字,都不會建立索引。
每個PDF檔案都會計為單一檔案,包括包含多頁的PDF。
是.使用範本中的<search-if-link-extension>
標籤,在搜尋結果中加入PDF圖示或其他圖形或文字:
<search-results>
...
<search-if-link-extension value=".pdf">
<img src="/search/i/pdficon.gif">
</search-if-link-extension>
...
</search-results>
PDF圖示可協助您的客戶知道搜尋結果連結至可能非常大的PDF檔案。 檔案大小對透過調制解調器或行動裝置存取您網站的客戶可能很重要。
是.使用智慧型連結範本標籤(<search-smart-link>...</search-smart-link>
),客戶可以按一下以開啟第一個包含搜尋結果的PDF頁面。
若要使用智慧型連結,請將範本搜尋結果區段中的<search-link>...</search-link>
標籤取代為<search-smart-link>...</search-smart-link>
標籤。 當客戶按一下智慧型連結標籤產生的連結時,他們會前往與其搜尋查詢相關的第一個PDF頁面。
若要使用此功能,客戶必須使用最新版的Adobe AcrobatReader(或Adobe Acrobat),其中必須包含反白顯示外掛程式和外部視窗處理程式(EWH)外掛程式。 此外,其Web瀏覽器必須使用Netscape Navigator的Adobe Acrobat插件(您可以使用任何接受此Netscape Navigator插件的瀏覽器)或Internet Explorer 4.0及更新版本的AcrobatActiveX控制項。
請參閱搜尋範本標籤。
如果不希望搜索自動機搜索和索引PDF檔案,請取消選擇內容類型PDF Documents(Settings > Crawling > Content Types)。
您也可以選擇使用URL Masks來停用PDF索引。
若要停用PDF索引,請輸入下列其中一個URL遮色片:
exclude *.pdf
(如果您不使用規則運算式)exclude regexp ^.*\.pdf$
(如果您使用規則運算式)請參閱規則運算式。
網站搜尋/銷售從PDF檔案取得UTF-8,而無語言指示。 如果您選取了內容類型PDF Documents(Settings > Crawling > Content Types),則必須使用中繼資料插入來指定PDF檔案中使用的語言。
請參閱添加欄位插入定義。
常見問題頁面,說明索引器計數頁面數目多於實際頁數的部分原因,以及每種情況的解決方案。
如果您確定您的網站低於頁面限制,但索引器會告訴您已達限制,您應檢視這些常見問題和可能的解決方案答案。
索引記錄檔包含網站搜尋/銷售自動機在為您的網站建立索引時收集的詳細資訊。 記錄檔包含所有已編目連結和遇到錯誤的清單。 當您嘗試判斷哪些頁面要建立索引時,檢查索引日誌是開始的最佳位置。
請參閱檢視即時或分段的完整索引記錄……。
請參閱查看即時或分段的增量索引日誌……。
CGI程式使用URL參數,這些參數有時會導致索引器編目多個「假」URL。 如果站點搜索/銷售正在讀取CGI程式,並在其中跟隨帶有CGI參數的URL,則可能有數倍的頁面被搜索和編製索引,這對搜索索引不有用。 典型的CGI參數出現在具有?
或&
字元的URL中。
您可以使用「URL遮色片」功能來遮色片CGI程式的索引。 您可以對URL前置詞進行掩碼,或使用規則運算式來對CGI指令碼進行掩碼。
請參閱關於URL遮色片。
請參閱關於URL遮色片指令碼。
請參閱規則運算式。
當Web伺服器啟用了目錄瀏覽,且指定目錄中沒有index.html檔案時,對該目錄的訪問可以顯示該目錄中的檔案清單。 通常,頁面頂端有連結可讓您按一下Name、Last modified、Size等,以不同方式排序清單。 通常,這些項目會在網站搜尋/銷售索引記錄檔中顯示為URL,結尾處會顯示字元如?M=A
。 網站搜尋/銷售索引器會將這些連結作為連結,這可能導致為多個「假」URL建立索引。
通常,設計良好的網站會在每個目錄中放置索引檔案,或者會針對那些沒有索引檔案的目錄禁用目錄瀏覽。 幸運的是,如果您無法變更頁面或停用伺服器端的目錄清單,有一個簡單的方法可遮住這些「假」URL。
要完成此任務,請按一下Settings > Crawling > URL Masks。 新增遮色片,以遮色任何包含?
字元的URL。 您可以輸入下列規則運算式遮色片來執行此工作:
exclude regexp ^.*\?.*$
建立遮色片後,請確定您已重新索引網站。
請參閱執行即時或分段網站的完整索引……。
請參閱執行即時或分段網站的遞增索引……。
如果您的網站上正在搜尋論壇或新聞群組,則可能會依循不同顯示選項或排序選項的URL。 此行為表示同一頁面已建立多次索引。
通常,論壇或新聞群組會隨附其搜尋引擎。 在這種情況下,您可使用URL Masks來遮罩網站搜尋/銷售的論壇。
在產品功能表上,按一下「Settings > Crawling > URL Masks」。 在Staged URL Masks頁面上,將論壇的URL輸入為排除的URL遮色片,以遮色片。
建立遮色片後,請務必重新建立網站的索引。
請參閱執行即時或分段網站的完整索引……。
請參閱執行即時或分段網站的遞增索引……。
如果您的網站上有PDF檔案或Microsoft Office檔案,您可能會發現只有幾個檔案的索引大小會計算許多頁面。 編製索引的頁面數比您擁有的檔案多,是因為PDF或Microsoft Office檔案中的每個頁面都會計為個別頁面。
在產品功能表上,按一下「Index > Full Index > Live Index」。 在Full Index頁面上,選擇Count All Pages,然後按一下Full Index Now以查看總頁數。 如果您不想將PDF檔案或Microsoft Office檔案建立索引,可以在Settings > Crawling > Content Types下停用此內容類型。
請參閱執行即時或分段網站的完整索引……。
請參閱關於內容類型。
網站搜尋/銷售自動機會從指定的URL入口開始編目,並追蹤該特定網域中所有內容的所有找到連結。 如果您已指定許多URL入口點,可能會編目大量頁面。
在其他網域的登入點檔案標題中,使用「排除協定」的nofollow
標籤,如下所示:
<html>
<head>
<meta name="robots" content="nofollow">
</head>
上述程式碼會告訴網站搜尋/銷售自動機為頁面內容建立索引,但不要跟隨其他頁面的連結。
您可以在以下網址進一步瞭解Web機器人和機器人排除協定:
https://www.robotstxt.org/orig.html
如果您無法存取其他網域上的頁面來源,則可移除多個URL入口點。 這樣做有助於將索引活動限制在那些您希望客戶能夠搜索其內容的域。
請參閱關於URL入口點。
檢查您的帳戶是否已在「完整索引狀態」畫面上達到限制。 如果狀態報告您的索引大於允許值,或是花了比允許值更長的時間,您的網站就無法建立完整的索引。 您可以修正此錯誤,以獲得正確的涵蓋範圍和網站頁面計數。
為了保護網站搜尋/銷售伺服器,位元組和時間有內部限制。 只有當編目的檔案很大,或當網站搜尋/銷售嘗試觸及的伺服器緩慢時,才會達到這些限制。
如果您達到時間限制,請確定您的伺服器已連線,並稍後再次嘗試索引。 如果您達到位元組限制,請檢視索引記錄來檢查已編目的檔案。 它們有異常大嗎? 如果您看到其中任一訊息,請連絡技術支援。