常見問題

Adobe Flash

常見問題頁面,討論在網站上建立SWF檔案索引和搜尋的支援。

以下是有關SWF檔案的常見問題:

何時編目SWF檔案並建立索引?

如果SWF檔案包含在HTML頁面的內嵌或物件標籤中,則會編目並建立索引,如下列範例所示:

<embed src="Flash-file-URL">  
 
<object>  
<param name=movie value="Flash-file-URL">  
</object> 

如果您將檔案URL列為入口點,也會辨識SWF檔案。

請參 閱添加要編製索引的多個URL入口點

我要如何為SWF檔案建立索引?

若要編目SWF檔案並建立索引,請選取內容 Adobe Flash Movies 類型( Settings > Crawling > Content Types)。

只要Flash檔案是從HTML檔案中的 <embed> 標籤或標 <object> 簽引用,就會建立文字索引,並編目檔案中所列的所有URL。

如果您的檔案未從標籤或標 <embed> 記引用 <object> ,您可以將SWF檔案列在HTML檔案 <a href=...> 的標籤中,或列為URL入口點。

請參 閱添加要編製索引的多個URL入口點

如何辨識SWF檔案?

SWF檔案由下列MIME類型識別:

application/x-shockwave-flash

如果副檔名為。swf, application/octet-stream也可 text/plain 以使用"或MIME類型來識別SWF檔案。

配置錯誤的伺服器可能會對SWF檔案使用不同的MIME類型。 如果您在編目和索引SWF檔案時遇到問題,請務必檢查您的伺服器組態。

SWF檔案如何建立索引?

SWF檔案中包含的文字會建立索引,就像是封閉HTML <body> 頁面中的文字一樣。 如果搜尋結果找到內嵌SWF檔案中的文字,結果會實際連結至封閉的HTML頁面,而非SWF檔案。 這樣,SWF檔案就會以正確的內容顯示。

如果SWF檔案包含URL做為「載入影片」動作,則參照的SWF檔案中的文字會作為封閉HTML頁面的一部分建立索引。

如果SWF檔案包含URL做為「取得URL」動作,URL會在稍後編目並建立索引,就像HTML參考會在稍後編目 <a href=...> 並建立索引一樣。

如果SWF檔案列為URL入口點,SWF檔案文字會以單一頁面建立索引。 從入口點SWF連結直接尋找文字至影片,而非封閉HTML頁面的搜尋結果。

請參 閱添加要編製索引的多個URL入口點

SWF檔案會計為頁面嗎?

無.SWF檔案會視為其封閉HTML頁面的一部分。 SWF檔案中包含的所有「載入影片」URL也會視為封閉HTML頁面的一部分。 因此,從HTML頁面參考的SWF檔案不會計為帳戶的頁面總數的「頁面」。

如果SWF檔案列為URL入口點,則該SWF檔案和該SWF檔案中列出的所有「載入影片」URL都會計為帳戶頁面總計的一個「頁面」。

我要如何防止個別SWF檔案的索引?

為防止對SWF檔案編製索引,可以將自動機meta標籤( <meta name="ROBOTS" content="NOINDEX">)或標籤添 <noindex> 加到封閉的HTML文檔。 即包含或標籤的 <embed><object> 檔。

您也可以使用robots meta標 <meta name="ROBOTS" content="NOFOLLOW">簽()來防止SWF檔案中包含的下列URL。 如果封閉的HTML檔案已停用後續功能,則SWF檔案中列為「取得URL」動作的URL將不會後續。

我要如何防止SWF檔案在我的網站上建立索引?

若要停用SWF索引,請取消選取內 Adobe Flash Movies 容類型( Settings > Crawling > Content Types)。

您也可以選擇使 URL Masks 用來停用SWF檔案的索引。

請參 閱將URL遮色片新增至……的索引部分或非索引部分.

若要停用SWF索引,請輸入下列其中一個URL遮色片:

  • exclude *.swf (如果您不使用規則運算式)
  • exclude regexp ^.*\.swf$ (如果您使用規則運算式)

請參閱 規則運算式

我為何無法在我的網站上搜尋中文、日文或韓文SWF檔案?

網站搜尋/銷售從使用Adobe Flash建立的SWF檔案取得UTF-8。 UTF-8不包含語言指示。 如果您選取了內容類 Adobe Flash Movies 型( Settings > Crawling > Content Types),則必須使用中繼資料插入來指定SWF檔案所使用的語言。

請參閱 新增欄位插入定義

舊版SWF檔案也不指定字元集。 如果您選取SWF內容類 Adobe Flash Movies 型( Settings > Crawling > Content Types),則必須使用中繼資料插入來指定SWF檔案中使用的字元集。

一般搜尋

常見問題頁面,討論網站搜尋/銷售如何協助造訪您網站的客戶找到所要搜尋的內容。

以下是一般搜尋的常見問題:

以下是與搜尋功能有關的常見問題:

我是否必須安裝任何軟體才能使用網站搜尋/銷售?

無.這是網站搜尋/銷售的主要優勢。 引擎是專業應用程式,完全托管在我們的高效能伺服器上,並加以維護。 這使得軟體比其他搜尋解決方案更容易使用。 您只需將少量的HTML程式碼新增至您的網頁,讓網站的客戶可以輸入搜尋。 網站搜尋/銷售會處理所有其餘的工作。

當我的網站超過頁面限制時,會發生什麼情況?

我們會持續提供您的搜尋服務,讓您的訪客可以不間斷地搜尋您的網站。 若要查看您的網站是否超過頁面限制,請檢閱完整索引狀態或即時記錄。

請參閱 關於完整索引

請參 閱檢視即時或分段的完整索引記錄…….

如何變更每週報表的傳送電子郵件地址?

每週報告會傳送給每個作用中帳戶的擁有者。 您可以按一下> Settings >變更電子郵 My Profile 件位址 Personal Information。 如果您有多個作用中的搜尋帳戶,則所有電子報都會傳送至新位址。

請參 閱設定您的個人使用者資訊

我的客戶在網站搜尋/銷售資訊的安全性如何?

網站搜尋/銷售是安全、快速、穩定且易於使用的。 您不會被迫使用Cookie(雖然您可以的話)來使用我們的產品,而且敏感資訊(例如密碼)永遠不會放在任何URL連結上,這些URL連結稍後可從您的瀏覽器中擷取。

我客戶資訊的隱私權如何?

Adobe致力於尊重其客戶和訪客的隱私權。 請參閱Adobe隱 私權中心

我可以在搜尋結果頁面上顯示自己的橫幅廣告嗎?

是.您可以控制搜尋結果的外觀和內容。 在您網站的搜尋結果範本中,您可以建立連至您自己橫幅交換網路的連結,例如LinkExchange或SmartClicks。 您的訪客進行的任何點擊都會正確計入您的橫幅廣告交換帳戶。

我可以自訂網站的搜尋結果嗎?

是.這是網站搜尋/銷售的獨家功能。 透過我們先進的範本技術和HTML的一些知識,您可以精確控制搜尋結果的顯示方式。

請參閱 搜尋範本標籤

您的伺服器和網站搜尋/銷售伺服器之間的轉換完全順暢且不會影響客戶。 如果您不知道HTML,或您沒有時間建立自訂範本,則可從Adobe專業網頁開發人員內部團隊所建立的各種吸引人、現成可用的範本中選擇。

我可以在我的網站上看到客戶正在搜尋哪些內容嗎?

是.我們會持續提供搜尋統計資料,以瞭解過去兩個月來訪客在您網站上進行的搜尋。 您可以隨時在產品功能表的報表下檢視這些統計資料。 搜尋報表會提供您有關訪客在您網站上搜尋的重要資訊。 您可使用此資訊來改善設計或調整網站搜尋/銷售引擎,以更好地為訪客服務。

我要如何控制哪些內容類型(PDF、文字、Flash、MP3和Microsoft Office)已建立索引並加以搜尋?

您可輕鬆設定帳戶,以啟用或停用在PDF檔案、純文字檔案、Flash影片、MP3檔案或Microsoft Office檔案中尋找文字的索引和搜尋功能。

這些設定會在頁面上 Staged Content Types 控制。

請參閱 關於內容類型

是否支援以ASP、JSP、PHP、CFM或Perl為基礎的內容,以動態方式產生網頁?

靜態或動態產生的HTML網頁會建立索引,包括從資料庫或任何其他後端程式建立的網頁。 由於瀏覽器所看到的HTML程式碼已建立索引,因此只要這些後端架構產生HTML頁面,您就可以在網站上使用網站搜尋/銷售。

搜尋自動機會從中指定之網站位址的第一頁開始,爬行您的網站, Account Settings並追蹤頁面間的連結。

請參 閱設定帳戶設定

當搜尋自動機爬蟲並索引您網站的所有頁面時,您可以使用搜尋引擎來搜尋您的網站。 換言之,如果動態產生的檔案與來自其他頁面的連結交織在您的網站中,搜尋機器人仍可以編目並索引動態內容。

在您的網站內容編目並建立索引後,您網站的客戶可以在已建立索引的內容中搜尋資訊。

如何使用同義字來改善網站的搜尋結果?

當您希望訪客尋找與其搜尋查詢相關的頁面時,可以使用同義字。

例如,假設您的網站上有一個頁面,其中包含要銷售的產品價目表。 不過,在檢查網站搜尋/銷售所提供的搜尋報表後,您會發現客戶在搜尋中會尋找「成本」、「費用」或「費用」。 這些字詞不會在搜尋結果中顯示您的價目表頁面。 使用中 Add Synonyms 的功 Dictionaries能,您可以指定這些單字都是同義字,而且客戶可以找到您的價目表,不論他們使用哪個搜尋詞。

請參閱 關於字典

我是否可控制搜尋結果的順序?

是.使用進階關聯介面,您可以控制特定搜尋查詢傳回的頁面。 如果您想確定客戶在查詢特定字詞時會看到特定頁面,此功能會很有用。

請參 閱新增中繼標籤欄位

我可以變更搜尋結果頁面的語言嗎?

是.網站搜尋/銷售範本在可讓您建立使用您選擇的語言並符合網站外觀的結果頁面時十分靈活。

範本包含文字、標準HTML標籤和特殊標籤的組合,這些標籤定義為顯示搜尋結果。 當客戶執行搜索時,搜索自動機讀取模板,使用標準HTML標籤輸出文本,並基於特殊模板標籤插入結果連結。

請參閱 搜尋範本標籤

如果要更改結果語言,可以編輯模板上顯示的英文文本。

請參 閱編輯簡報或傳輸範本

我的Adobe客戶登入是否可擁有多個網站?

是.只要單次Adobe客戶登入,您就可以管理許多不同網站的不同搜尋引擎。 在「帳戶」下選擇並管理帳戶。

請參 閱選擇要使用的其他帳戶

我可以搜尋多個網域嗎?

是.您可以使用來設定存取多個網域的權限 URL Entrypoints。 提供您擁有之其他網域的URL登入點。 請記住,您必須擁有索引未擁有的網域的權限。

請參 閱關於URL入口點

我可以將網站細分為不同的區段,讓客戶可以個別或整個網站搜尋其中任何區段嗎?

是.包含「系列」功能,可讓客戶搜尋您網站的特定區域,以快速找到所要的內容。

請參閱 關於系列

例如,客戶可以搜尋與產品銷售資訊相關的URL集合,或是與支援服務相關的URL集合。 您可以設定系列,讓客戶看到系列的下拉式清單或一組核取方塊。

如何排除網站的部分內容,使其不受搜尋?

是.指定URL遮色片,以決定您要包含或排除在索引之外的網站頁面。 URL遮色片會決定網站頁面是否出現在您的搜尋結果中。

請參閱 關於URL遮色片

請參閱 關於URL遮色片指令碼

若要防止搜尋個別網頁的部分,您可以排除頁面的某些部分以建立索引。 以及標籤環繞 <noindex></noindex> 字。 如果您想從搜尋中排除導覽文字,此方法很實用。

支援哪些字元集?

網頁通常會使用類似下列的中繼標籤來指定字元集:

<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">

網站搜尋/銷售引擎會使用現今網際網路上使用的所有常用字元集,正確索引網頁。 部分支援的字元集包括:

阿拉伯文(ISO-8859-6)

繁體中文;Big5)

日文(Shift_JIS)

阿拉伯文(Windows-1256)

繁體中文;EUC-TW)

俄文(KOI8-R)

波羅的海(ISO-8859-4)

西里爾文(ISO-8859-5)

南歐(ISO-8859-3)

波羅的海(Windows-1257)

西里爾文(Windows-1251)

土耳其文(ISO-8859-9)

中歐(ISO-8859-2)

希臘文(ISO-8859-7)

土耳其文(Windows-1254)

中歐(Windows-1250)

希臘文(Windows-1253)

Unicode(UTF-8)

中文(ISO-2022-CN)

希伯來文(ISO-8859-8)

US-ASCII(us-ascii)

中文(ISO-2022-CN-EXT)

希伯來文(Windows-1255)

西歐(ISO-8859-1)

中文(簡體;EUC-CN)

日文(EUC-JP)

西歐(ISO-8859-15)

中文(簡體;GB2312)

日文(ISO-2022-JP)

西歐語系(Windows-1252)

中文(簡體;GBK)

日文(ISO-2022-JP-1)

西歐文(x-mac-roman)

中文(簡體;HZ-GB-2312)

日文(ISO-2022-JP-2)

請聯絡技術支援以詢問上述未列出的字元集。

如果我變更或更新我的網站,該怎麼辦?

變更網站內容後,您可以執行完整索引或增量索引。 網站搜尋/銷售下載及索引任何變更的網站內容。 建立索引完成後,您的客戶可以搜尋新內容。 您也可以在特定時間和特定日期排程網站的自動索引。

參閱執行即時或分段網站的完整索引…….

請參 閱執行即時或分段網站的遞增索引…….

請參 閱設定即時網站的完整索引排程

請參 閱設定即時網站的遞增索引排程

我的網站是否可自動建立索引?

是.您可以每天排程網站的自動索引。

除了每日自動索引外,您還可以選擇頻繁變更其網站的部分,以增量方式建立索引。 在已排程自動索引的日,您可以控制索引發生的時間。 此外,您隨時都可以手動啟動網站索引。

請參 閱設定即時網站的完整索引排程

請參 閱設定即時網站的遞增索引排程

我在我的網站上使用密碼。 我是否仍能使用網站搜尋/銷售?

如果您使用HTTP基本驗證以密碼保護網站的某些部分,您可以指定網站搜尋/銷售可用來為網站建立索引的領域和密碼。

請參 閱新增密碼,以存取您網站中需要…….

您是否支援https或安全伺服器內容的編目和索引?

是.您可以在安全伺服器(https)上編目和建立內容索引。

網站搜尋/銷售是否遵守我網站上的robots.txt檔案?

是.機器人排除協定是符合的。 搜尋機器人會檢查robots.txt檔案(如果它存在於您的網站上)。 如果您的robots.txt檔案排除所有自動機來搜尋您的網站,則網站搜尋/銷售自動機也會排除。 若要僅允許網站搜尋/銷售自動機編目您的網站,請將robots.txt檔案的內容設定為:

User-agent: Atomz/1.0 
Disallow:
User-agent: * 
Disallow: /

您可以在以下網址進一步瞭解Web機器人和機器人排除協定:

https://www.robotstxt.org/orig.html

網站的某些部分必須經常更新,以便客戶獲得最準確的搜尋結果。 增量索引是否有助於解決此問題?

是.此案例是建立遞增索引功能以促進網站搜尋/銷售的原因。 增量索引的主要優點是,它可讓公司頻繁地為網站中不斷變化的部分建立動態索引。 此類功能可確保您以「最快」的精確度顯示搜尋結果。

請參 閱執行即時或分段網站的遞增索引…….

請參 閱設定即時網站的遞增索引排程

後端資料庫是否支援動態產生的網頁,例如產品目錄或庫存管理系統?

靜態或動態產生的HTML網頁,包括從資料庫建立的頁面或任何其他後端程式都會建立索引。 由於瀏覽器檢視的HTML程式碼已建立索引,因此只要後端資料庫資訊產生於HTML頁面,您就可以在網站上使用網站搜尋/銷售。

搜尋自動機會從中指定之網站位址的第一頁開始,爬行您的網站, Account Settings並追蹤頁面間的連結。

請參 閱設定帳戶設定

當搜尋自動機爬蟲並索引您網站的所有頁面時,您可以使用搜尋引擎來搜尋您的網站。 換言之,如果動態產生的檔案與來自其他頁面的連結交織在您的網站中,搜尋機器人仍可以編目並索引動態資料庫內容。

在您的網站內容編目並建立索引後,您網站的客戶可以在已建立索引的內容中搜尋資訊。

您可以輕鬆啟用完整內容搜尋,或以主題為基礎的搜尋範圍較窄,但僅限於標題中的資訊、中繼描述、中繼關鍵字檔案標籤,或全部三種。 使用中繼資料定義,您也可以在實際搜尋結果中建立自訂顯示欄位,例如產品影像。

請參 閱新增中繼標籤欄位

我可以使用指令碼或程式來啟動網站的增量索引嗎?

是.您可以使用指令碼或程式來起始網站的增量索引,以及在內容變更或更新時,ping伺服器來索引網站。

請參 閱關於指令碼索引

功能實作

常問的問題頁面,討論中的各種功能實作 Search&Promote。

以下是網站上功能實作的 Search&Promote 常見問題:

為什麼我的業務規則沒有運作?

設定橫幅廣告出現時的業務規則,或協助決定結果出現的順序。 您也可以設定Facet中項目的位置,以及指定搜尋使用的範本。
重新排序業務規則,以變更其在簡報範本上執行的順序。 業務規則按照定義的順序運行;也就是說,規則的訂單編號越高,在流程中執行的時間越晚,超過了之前的規則。 通過在「業務規則」頁上表的「順序」列中輸入新編號,可以重新排序規則。

See About Business Rules.

為什麼排程索引、啟動索引錯誤,以及啟動分段索引時遇到問題?

當生成索引時,無論其是完整索引還是增量索引編目狀態資訊都會即時顯示。 例如,您可以檢視索引建立程式期間發生的開始時間、用時和任何錯誤。 此外,還會顯示有關上一個索引狀態的資訊。 使用此資訊來疑難排解您遇到的索引錯誤。

如需排程索引,請參 閱設定即時網站的完整索引排程 , 以及設定即時網站的遞增索引排程

如需啟動分段索引,請參 閱執行即時或分段網站的完整索引……執行即時或分段網站的遞增索引…….

我的指數大小限制超出了我允許的界限。 為什麼會發生這種情況,我要如何解決?

網站可能會逐漸成長,而且隨著時間推移,Search&Promote會「發現」新增的更多檔案和網頁。 最終,您的帳戶可能會超過您的索引大小限制。在這種情況下,您可以考慮使用 URL Mask。 此功能可隱藏文檔和網頁,防止您不想要或不需要建立索引的索引編目,從而減少索引大小。 另一個選擇是聯絡技術支援,讓您的索引大小限制在帳戶中設定得更大。

請參閱 關於URL遮色片

如果您不確定該做什麼,請聯絡技術支援。 可能有許多其他變數會影響您的索引大小,若經過調整,可能也會影響您帳戶的帳單。

國際

一個常問的問題頁面,討論對19種以上語言的索引和搜尋支援,包括多位元組亞洲語言,例如中文(簡體和繁體)、日文和韓文。

以下是語言和字元集的常見問題:

什麼控制搜尋查詢的字元集編碼?

您的搜尋帳戶的「Web表單」區段包含您用來新增搜尋功能至網站的範例搜尋表單。 如果您查看此搜尋表單程式碼,可以找到類似下列的行:

<input type=hidden name="sp_f" value="iso-8859-1">

此程式碼行會告訴搜尋引擎傳入的查詢是以iso-8859-1編碼,這是西歐語言的常用編碼。 您可以前往產品功能表,然後按一下 Settings > My Profile >來變更此設 Personal Information​定。 在頁 Personal Information 面的下拉式清 Character Encoding 單中,選取新編碼。

請參 閱設定您的個人使用者資訊

您也可以編輯搜尋表單的行,手動變更網 sp_f 頁上的編碼值。 請記住, sp_f 搜尋表單的值必須符合顯示表單之頁面的字元集編碼。

僅搜尋其編碼與搜尋查詢編碼相符的頁面嗎?

預設情況下,否。 只要您的網站頁面正確識別其字元集編碼,即使頁面使用多種編碼,搜尋查詢的編碼和頁面的編碼之間也會進行必要的轉換。

搜尋結果頁面使用何種編碼?

帳戶的字元集編碼會決定結果範本的預設編碼。

請參 閱設定您的個人使用者資訊

您可以進一步瞭解如何在HTML範本中指定字元集。

請參閱 搜尋範本標籤

我是否可在Unicode、UTF-8、編碼頁面上使用網站搜尋/銷售?

是.但是,Unicode字元集(例如UTF-8)無法提供足夠的資訊來判斷頁面所使用的語言。 若要正確搜尋這些頁面,必須指定語言。 要確定文檔語言,資訊按以下順序處理:

  • 您的伺服器為檔案傳送的內容語言HTTP標題。

  • META元素(例如 META HTTP-EQUIV="Content-Language" Content="ja_JP"),在文 <HEAD> 件的區段中。

  • 標籤的LANG <HTML> 屬性(例如 <HTML LANG="ja_JP">)。

如果您的伺服器未設定為傳送「內容語言HTTP」標題,而您的檔案既不包含語言META元素,也不包含標籤的語言屬性,則您可以使用中繼資料插入來指定適當的語言。 <HTML>

請參閱 新增欄位插入定義

我為何無法在網站上搜尋中文、日文或韓文PDF檔案?

網站搜尋/銷售從Adobe PDF檔案取得UTF-8,而無語言指示。 如果您選 PDF Documents 取( Settings > Crawling > Content Types),則必須使用中繼資料插入來指定PDF檔案中使用的語言。

請參閱 新增欄位插入定義

我為何無法在我的網站上搜尋中文、日文或韓文SWF檔案?

網站搜尋/銷售從使用Adobe Flash建立的Adobe Flash影片檔案取得UTF-8,而不需顯示語言。 如果您選取了內容類 Adobe Flash Movies 型( Settings > Crawling > Content Types),則必須使用中繼資料插入來指定SWF檔案中使用的語言。

對於Flash 4或更舊版本的SWF檔案,不會指定檔案中字元的字元集。 如果您選取了內容類 Adobe Flash Movies 型( Settings > Crawling > Content Types),則必須使用中繼資料插入來指定SWF檔案中使用的字元集。

請參閱 新增欄位插入定義

為什麼我無法在我的網站上搜尋中文、日文或韓文的Microsoft Office檔案?

網站搜尋/銷售從Microsoft Office檔案(Microsoft Word、Microsoft Excel和Microsoft PowerPoint)取得UTF-8,而無語言指示。 如果您選取了內容類 Microsoft Office Files 型( Settings > Crawling > Content Types),則必須使用中繼資料插入來指定Microsoft Office檔案中使用的語言。

請參閱 新增欄位插入定義

為什麼我無法在我的網站上搜尋中文、日文或韓文MP3檔案?

如果您選取內容類 Text in MP3 Music Files 型( Settings > Crawling > Content Types),則必須使用中繼資料插入來指定用來編碼MP3檔案的字元集。

請參閱 新增欄位插入定義

我是否需要做任何特殊動作,才能讓網站上的。txt檔案正確索引?

如果您選取了內容類 Text Documents 型( Settings > Crawling > Content Types),則必須使用中繼資料插入來指定用來編碼。txt檔案的字元集。

請參閱 新增欄位插入定義

中文、日文或韓文字型為何會出現在Netscape 4.7及更舊版本的搜尋結果中?

如果您的帳戶使用預設範本、其中一個現成可用的範本,或以這些範本為基礎的範本,則可能包含將Arial或Helvetica指定為字型的字型標籤。 例如, <font face="arial, helvetica" size="+1">。當使用Arial或Helvetica字型面時,Netscape 4.7和舊版不會顯示中文、日文或韓文字元。 移除屬 face 性或以較適合中文、日文或韓文的字型面取代字型面。

低頁數

常問的問題頁面,討論與低索引頁面計數相關的常見問題。

以下是關於低索引頁面計數的常見問題:

您檢查過索引日誌嗎?

索引記錄檔包含網站搜尋/銷售自動機在建立網站索引時收集的詳細資訊。 記錄檔包含已編目和遇到錯誤的連結清單。 檢查索引日誌是確定網站上所有頁面未建立索引的最佳開始位置。

請參 閱檢視即時或分段的完整索引記錄…….

請參 閱查看即時或分段的增量索引日誌…….

您的URL中是否有輸入錯誤?

當您在HTML表單中輸入冗長的URL時,可能會導致一或多個印刷錯誤。 請記住,URL不應包含任何空格。 此外,請注意,有些Web伺服器會以區分大小寫的方式處理URL。

在產品功能表上,按一下 Settings > Crawling > URL Entrypoints。 在頁面 Staged URL Entrypoints 上,驗證下列項目:

  • 您的URL中沒有任何印刷錯誤。
  • URL中的字元都使用正確的外框。
  • URL中沒有空格字元。

若要測試您的URL登入點,請複製URL並貼至網頁瀏覽器,以查看您的網站是否出現。 如果未顯示,請再次勾選,以確保您的URL路徑未發生任何錯誤。

請參 閱關於URL入口點

登入點網頁是否包含您網站上其他頁面的連結?

網站搜尋/銷售機器人會像客戶一樣爬行您的網站;依循頁面間的連結。 在搜尋機器人找到您網站上的其他頁面並建立索引之前,連結必須存在於入口點網頁中。

請參 閱添加要編製索引的多個URL入口點

您網站上其他頁面的連結是否內嵌在JavaScript中?

您可以在您的網站上使用複雜的導覽技術,例如使用JavaScript連結至其他頁面的滾動動作和功能表。 不過,網站搜尋/銷售自動機無法跟隨內嵌於JavaScript的連結。

您可使用的一個解決方案,就是在包含JavaScript的HTML中,將其他頁面的隱藏連結置入。 雖然您網站的客戶看不到這些連結,但搜尋機器人仍會尋找和編目這些連結。 您可以將隱藏的標籤置於頁面底部,就在標籤之 </body> 前。 它們可能如下所示:

<a href="/mydir/mypag1.html"></a> 
<a href="/mydir/mypag2.html"></a>

另一個解決方案是將網站上其他頁面的URL列為要編目和索引的入口點。 URL的開頭 https:// 如下所示:

https://www.mydomain.com/mydir/mypag1.html 
https://www.mydomain.com/mydir/mypag2.html

請參 閱添加要編製索引的多個URL入口點

網頁上的HTML標籤是否順序無效?

HTML規格要求HTML文 <html>件中 <head>, <body> 和標籤遵循特定順序。 所有網頁中的標籤都必須有下列順序:

<html> 
<head> 
...  
<i>head tags go here</i> ... 
</head> 
<body> 
...  
<i>body tags go here</i> ... 
</body> 
</html>

如果HTML標籤順序不正確,則網站搜尋/銷售自動機無法正確解析您的網頁並建立其索引。 以下是未在正確順序中的標籤範例:

<body> 
<head> 
...  
<i>head tags are here</i> ... 
</head> 
...  
<i>body tags are here</i> ... 
</body>

在這種情況下,請將、 <html><head><body> 簽放入網頁上的正確序列中。

您的網頁中是否有錯誤的HTML註解標籤?

請確定您仔細檢閱並更正網頁中的任何無效HTML注釋。

HTML規格要求HTML注釋以字元開頭, <!-- 以字元結尾 -->。 很容易忽略格式錯誤的注釋,這些注釋會導致網站搜尋/銷售自動機不正確剖析您網頁上的標籤。 格式錯誤的註解可能導致網站搜尋/銷售自動機遺漏其他必須加以剖析的重要標籤。 請留意網頁中標籤 <body> 前的注釋。

以下是正確格式注釋的示例:

<!-- This HTML comment is OK. -->

以下是錯誤格式注釋的範例:

<!- This HTML comment is improperly formed. -> 
<! This HTML comment is also improperly formed. >

您的網頁是否包含其他網域頁面的連結?

通常,網站可由網站伺服器上實際存在且網域位址不同的頁面組成。 例如,若您的主要網站位址為:

https://www.mydomain.com/

您的網站可能也會在其他網域上有頁面,例如:

https://www.otherdomain.com/

依預設,網站搜尋/銷售自動機不會跟隨除主網域以外網域的連結。 不過,只要為搜尋帳戶設定額外的登入點,您就可以輕鬆為多個網域建立索引。

在產品功能表上,按一下 Settings > Crawling > URL Entrypoints。 新增您網站的「主要網站入口點」URL。 然後,將其他URL登入點新增至包含網站頁面的任何其他網域。 例如,您可將主要URL入口點設為:

https://www.mydomain.com/

並新增下列其他網站URL入口點:

https://www.otherdomain.com/

您的URL是否使用虛擬網域服務?

您可能使用虛擬網域服務(有時稱為「網域重新導向服務」),為客戶提供更佳的URL以連至您的網站。 例如,假設您網站的實際位址如下:

https://www.myispdomain.com/~myname/mywebpages/

不過,您使用虛擬網域服務,讓客戶可以透過下列位址來到您的網站:

https://myname.adomain.com/

https://adomain.com/myname/

依預設,網站搜尋/銷售自動機不會跟隨除主網域以外網域的連結。 不過,只要為搜尋帳戶設定額外的登入點,您就可以輕鬆為多個網域建立索引。

在產品功能表上,按一下 Settings > Crawling > URL Entrypoints。 將「主網站URL入口點」新增至網站的虛擬網域名稱。 然後,新增額外的登入點至您網站實際所在的網域。

例如,您可將主要URL入口點設定為:

https://myname.adomain.com/

並新增下列其他網站URL入口點:

https://www.myispdomain.com/~myname/mywebpages/

您的網頁是否使用中繼重新整理標籤?

許多網站的首頁包含類似下列的標籤之 <head>...</head> 間的中繼重新整理標籤:

<meta http-equiv="Refresh" content="0;URL=https://www.adomain.com/apath/afile.html">

在某些情況下,網站搜尋/銷售自動機無法跟隨中繼重新整理URL來索引您網站的內容。 透過設定額外的入口點,可輕鬆解決此問題。

在產品功能表上,按一下 Settings >編目> URL Entrypoints。 將另一個入口點新增至meta refresh標籤的URL。

您的網頁是否使用中繼機器人標籤?

有時網頁會使用中繼自動機標籤來控制定期嘗試編目網站的網頁自動機。 中繼自動機標籤會出 <head>...</head> 現在網頁的標籤之間,其外觀類似下列標籤:

<meta name="robots" content="noindex, nofollow">

由於網站搜尋/銷售機器人本身就是網頁機器人,所以它會遵循中繼機器人標籤的方向。 以此方式排除其他自動機,也排除網站搜尋/銷售自動機。

您可以在以下網址進一步瞭解Web機器人和機器人排除協定:

https://www.robotstxt.org/orig.html

移除或修改您要在網站上建立索引之網頁上的中繼自動機標籤。

您的網站是否使用Robots排除檔案?

有時,網站的頁面名為robots.txt,會排除所有或特定的機器人進行編目。 若要查看您的網站是否有robots.txt檔案,請在頂層網域下方尋找,如下所示:

https://www.yourdomain.com/robots.txt

robots.txt檔案的內容看起來類似下列文字:

User-agent: * 
Disallow: /

由於網站搜尋/銷售機器人本身是網頁機器人,因此會遵循robots.txt檔案中的指示——排除網站搜尋/銷售機器人。 若要解決此問題,請編輯robots排除檔案(robots.txt),以允許網站搜尋/銷售自動機按如下方式編目和索引您的網站:

User-agent: Atomz/1.0 
Disallow: 
 
User-agent: * 
Disallow: /

Microsoft Office

常見問題頁面,討論在網站上建立Microsoft® Office檔案索引和搜尋的支援。

以下是有關Microsoft Office檔案的常見問題:

在Microsoft Office檔案中建立索引的是什麼?

Microsoft Word檔案、Microsoft Excel檔案和Microsoft PowerPoint檔案的完整內容已建立索引。

Microsoft Word檔案的下列部分已建立索引:

  • 標題
  • 關鍵字
  • 主旨(說明)
  • 文字內容
  • 其他檔案的超連結

Microsoft Excel檔案的下列部分已建立索引:

  • 標題
  • 關鍵字
  • 主旨(說明)
  • 儲存格中的文字
  • 儲存格中數值公式的值

Microsoft PowerPoint檔案的下列部分已建立索引:

  • 標題
  • 關鍵字
  • 主旨(說明)
  • 每張投影片上的文字

哪些內容未在Microsoft Office檔案中建立索引?

包含在Microsoft Office檔案中的圖形,或包含圖形中的任何文字,都不會建立索引。 自訂屬性定義不會建立中繼資料的索引。 特殊欄位中的某些文字(例如PowerPoint檔案中的頁首和頁尾)也不會建立索引。

Microsoft Office檔案與HTML頁面的索引有何不同?

搜尋自動機對Microsoft Office檔案和HTML檔案進行索引的不同之處在於,每個HTML檔案都是個別頁面,而單一Microsoft Office檔案可代表數百個頁面。 因此,每個頁面在Microsoft Office檔案中都會計為您搜尋帳戶下的個別頁面。

如何防止在我的網站上建立Microsoft Office檔案的索引?

如果不希望搜索自動機搜索和索引Microsoft Office檔案,請取消選擇內 Microsoft Office Files 容類型( Settings > Crawling > Content Types)。

您也可以使 URL Masks 用來停用Microsoft Office檔案的索引。

輸入下列URL遮色片:

如果您不使用規則運算式

  • exclude *.doc
  • exclude *.xls
  • exclude *.ppt

如果您使用規則運算式

  • 排除regexp ^。*\.doc$
  • 排除regexp ^。*\.xls$
  • 排除regexp ^。*\.ppt$

請參 閱將URL遮色片新增至……的索引部分或非索引部分.

請參閱 規則運算式

MP3

常見問題頁面,討論在網站上建立MP3音樂檔案索引與搜尋的支援。

以下是有關MP3檔案的常見問題。

何時編目MP3檔案並建立索引?

MP3檔案的編目和索引有兩種方式。 最常見的方式是來自HTML檔案中的錨點href標籤:

<a href="MP3-file-URL"></a>

第二種方式是將MP3檔案的URL輸入為URL入口點。

請參 閱關於URL入口點

我要做什麼才能在網站上編目和索引MP3檔案?

若要啟用帳戶的MP3編目和索引,請在產品功能表上按一下 Settings > Crawling > Content Types。 在頁面 Staged Content Types 上,選擇 Text in MP3 Music Files

請參閱 關於內容類型

如何識別MP3檔案?

MP3檔案的MIME類型是「audio/mpeg」。

MP3檔案中有哪些索引?

MP3檔案可選擇儲存少量的文字資訊。 這些資訊可包含相簿名稱、藝術家姓名、歌名、歌曲類型、發行年份和注釋。 這些資訊會儲存在檔案的最後端,稱為TAG。 包含TAG資訊的MP3檔案按以下方式編製索引:

  • 歌曲標題會被視為HTML頁面的標題。
  • 注釋會被視為為HTML頁面定義的說明。
  • 類型會被視為為HTML頁面定義的關鍵字。
  • 藝術家名稱、相簿名稱和發行年份會被視為HTML檔案的正文。

MP3檔案會計為頁面嗎?

是的,您網站上編目並建立索引的每個MP3檔案會計為一頁。

我要如何防止個別MP3檔案的索引?

將連結至MP3檔案的錨點標籤與標籤包 <nofollow> 圍起 </nofollow> 來。 搜索自動機不會跟隨這些標籤之間的連結。

另一種方法是將MP3檔案的URL新增為排除遮色片。

請參閱 關於URL遮色片

請參閱 關於URL遮色片指令碼

如何防止MP3檔案建立索引?

要控制帳戶的MP3索引,最簡單的方式是取消選 Text in MP3 Music Files 取頁面 Staged Content Types 。

請參 閱選擇要編目和索引的內容類型

您也可以使用「URL遮色片」功能,以依副檔名停用MP3索引。 若要這麼做,請在產品功能表上按一下 Settings > Crawling > URL Masks。 輸入以下蒙版之一:

如果您的帳戶……

輸入下列URL遮色片

不使用規則運算式

exclude *.mp3

使用規則運算式

排除regexp ^。*\.mp3$

請參閱 規則運算式

我為什麼無法在網站上搜尋中文、日文或韓文MP3檔案?

若要搜尋中文、日文或韓文MP3檔案,請在產品選單上按一下 Settings > Crawling > Content Types > Text in MP3 Music Files。 然後,按 Settings 一下> Metadata > Injections,並指定用來編碼MP3檔案的字元集。

請參 閱選擇要編目和索引的內容類型

請參 閱注射

PDF

常見問題頁面,討論在網站上建立PDF檔案索引和搜尋的支援。

以下是有關PDF檔案的常見問題:

PDF檔案中的索引項目為何?

PDF檔案的完整內容已建立索引。 PDF檔案的下列部分已建立索引:

  • 標題
  • 關鍵字
  • 主旨(說明)
  • 文字內容

哪些PDF檔案未建立索引?

PDF目錄、檔案中的任何圖形,或包含圖形的任何文字,都不會建立索引。

如何計算建立索引的PDF檔案?

每個PDF檔案都會計為單一檔案,包括包含多頁的PDF。

搜尋結果是否可顯示PDF圖示?

是.使用范 <search-if-link-extension> 本中的標籤,在搜尋結果中加入PDF圖示或其他圖形或文字:

<search-results> 
  ... 
  <search-if-link-extension value=".pdf"> 
    <img src="/search/i/pdficon.gif"> 
  </search-if-link-extension> 
  ... 
</search-results>

PDF圖示可協助您的客戶知道搜尋結果連結至可能非常大的PDF檔案。 檔案大小對透過調制解調器或行動裝置存取您網站的客戶可能很重要。

搜尋結果是否可連結至PDF檔案中的特定頁面?

是.使用智慧型連結範本標 <search-smart-link>...</search-smart-link>簽(),客戶可以按一下以開啟第一個包含搜尋結果的PDF頁面。

若要使用智慧型連結,請 <search-link>...</search-link> 以標籤取代範本搜尋結果區段中的標 <search-smart-link>...</search-smart-link> 記。 當客戶按一下智慧型連結標籤產生的連結時,他們會前往與其搜尋查詢相關的第一個PDF頁面。

注意

若要使用此功能,客戶必須使用最新版的Adobe Acrobat或Adobe Acrobat Reader,其中必須包含反白顯示外掛程式和外部視窗處理常式(EWH)外掛程式。 此外,其網頁瀏覽器必須使用Adobe Acrobat外掛程式for Netscape Navigator(您可以使用任何接受此Netscape Navigator外掛程式的瀏覽器)或Acrobat ActiveX控制項for Internet Explorer 4.0及更新版本。

請參閱 搜尋範本標籤

如何防止PDF檔案在我的網站上建立索引?

如果您不想讓搜尋自動機編目並為PDF檔案建立索引,請取消選取內容 PDF Documents 類型( Settings > Crawling > Content Types)。

您也可以選擇使用來 URL Masks 停用PDF索引。

請參 閱將URL遮色片新增至……的索引部分或非索引部分.

若要停用PDF索引,請輸入下列其中一個URL遮色片:

  • exclude *.pdf (如果您不使用規則運算式)
  • exclude regexp ^.*\.pdf$ (如果您使用規則運算式)

請參閱 規則運算式

我為何無法在網站上搜尋中文、日文或韓文PDF檔案?

網站搜尋/銷售從PDF檔案取得UTF-8,而無語言指示。 如果您選取了內容類 PDF Documents 型( Settings > Crawling > Content Types),則必須使用中繼資料插入來指定PDF檔案中使用的語言。

請參閱 新增欄位插入定義

頁面過多

常見問題頁面,說明索引器計數頁面數目多於實際頁數的部分原因,以及每種情況的解決方案。

如果您確定您的網站低於頁面限制,但索引器會告訴您已達限制,您應檢視這些常見問題和可能的解決方案答案。

您檢查過各種索引日誌嗎?

索引記錄檔包含網站搜尋/銷售自動機在為您的網站建立索引時收集的詳細資訊。 記錄檔包含所有已編目連結和遇到錯誤的清單。 當您嘗試判斷哪些頁面要建立索引時,檢查索引日誌是開始的最佳位置。

請參 閱檢視即時或分段的完整索引記錄…….

請參 閱查看即時或分段的增量索引日誌…….

請參 閱查看即時或……的指令碼式增量索引日誌.

請參 閱查看即時或分段的已再生索引日誌…….

參閱檢視即時或分段網站的重新排名索引記錄

CGI程式是否在您的網站上建立索引?

CGI程式使用URL參數,這些參數有時會導致索引器編目多個「假」URL。 如果站點搜索/銷售正在讀取CGI程式,並在其中跟隨帶有CGI參數的URL,則可能有數倍的頁面被搜索和編製索引,這對搜索索引不有用。 典型的CGI參數會出現在含有或 ? 字元的 & URL中。

您可以使用「URL遮色片」功能來遮色片CGI程式的索引。 您可以對URL前置詞進行掩碼,或使用規則運算式來對CGI指令碼進行掩碼。

請參閱 關於URL遮色片

請參閱 關於URL遮色片指令碼

請參閱 規則運算式

您的伺服器是否啟用目錄瀏覽功能?

當Web伺服器啟用了目錄瀏覽,且指定目錄中沒有index.html檔案時,對該目錄的訪問可以顯示該目錄中的檔案清單。 通常,頁面頂端會有連結,讓您只要按一下、 NameLast modifiedSize​等,就能以不同方式排序清單。 通常,這些字元會在網站搜尋/銷售索引記錄檔中顯示為URL,其字元 ?M=A 如結尾。 網站搜尋/銷售索引器會將這些連結作為連結,這可能導致為多個「假」URL建立索引。

通常,設計良好的網站會在每個目錄中放置索引檔案,或者會針對那些沒有索引檔案的目錄禁用目錄瀏覽。 幸運的是,如果您無法變更頁面或停用伺服器端的目錄清單,有一個簡單的方法可遮住這些「假」URL。

要完成此任務,請按一下 Settings > Crawling > URL Masks。 新增遮色片,以遮色任何包含字元的URL ?。 您可以輸入下列規則運算式遮色片來執行此工作:

exclude regexp ^.*\?.*$

建立遮色片後,請確定您已重新索引網站。

參閱執行即時或分段網站的完整索引…….

請參 閱執行即時或分段網站的遞增索引…….

您的網站上是否有論壇或新聞群組?

如果您的網站上正在搜尋論壇或新聞群組,則可能會依循不同顯示選項或排序選項的URL。 此行為表示同一頁面已建立多次索引。

通常,論壇或新聞群組會隨附其搜尋引擎。 在這種情況下,您可以使用來 URL Masks 遮罩網站搜尋/銷售的論壇。

在產品功能表上,按一下 Settings > Crawling > URL Masks。 在頁面 Staged URL Masks 上,將論壇的URL輸入為排除的URL遮色片,以遮色片。

請參 閱將URL遮色片新增至……的索引部分或非索引部分.

建立遮色片後,請務必重新建立網站的索引。

參閱執行即時或分段網站的完整索引…….

請參 閱執行即時或分段網站的遞增索引…….

您的網站上是否有PDF或Microsoft Office檔案?

如果您的網站上有PDF Microsoft Office 檔案或檔案,您可能會發現只有幾個檔案的索引大小會計算許多頁面。 編製索引的頁面數比您擁有的檔案多,是因為PDF或Microsoft Office檔案中的每個頁面都會計為個別頁面。

在產品功能表上,按一下 Index > Full Index > Live Index。 在頁面 Full Index 上,選 Count All Pages​取,然後按一 Full Index Now 下以查看總頁數。 如果您不想將PDF檔案或Microsoft Office檔案建立索引,可以在 Settings > Crawling >下停用此內容類 Content Types​型。

參閱執行即時或分段網站的完整索引…….

請參閱 關於內容類型

您有多個URL入口點嗎?

網站搜尋/銷售自動機會從指定的URL入口開始編目,並追蹤該特定網域中所有內容的所有找到連結。 如果您已指定許多URL入口點,可能會編目大量頁面。

在額外網域的登入點文 nofollow 件標題中使用「排除協定」標籤,如下所示:

<html> 
<head> 
<meta name="robots" content="nofollow"> 
</head>

上述程式碼會告訴網站搜尋/銷售自動機為頁面內容建立索引,但不要跟隨其他頁面的連結。

您可以在以下網址進一步瞭解Web機器人和機器人排除協定:

https://www.robotstxt.org/orig.html

如果您無法存取其他網域上的頁面來源,則可移除多個URL入口點。 這樣做有助於將索引活動限制在那些您希望客戶能夠搜索其內容的域。

請參 閱關於URL入口點

您是否已超過網站搜尋/銷售的內部位元組或時間限制?

檢查您的帳戶是否已在「完整索引狀態」畫面上達到限制。 如果狀態報告您的索引大於允許值,或是花了比允許值更長的時間,您的網站就無法建立完整的索引。 您可以修正此錯誤,以獲得正確的涵蓋範圍和網站頁面計數。

為了保護網站搜尋/銷售伺服器,位元組和時間有內部限制。 只有當編目的檔案很大,或當網站搜尋/銷售嘗試觸及的伺服器緩慢時,才會達到這些限制。

如果您達到時間限制,請確定您的伺服器已連線,並稍後再次嘗試索引。 如果您達到位元組限制,請檢視索引記錄來檢查已編目的檔案。 它們有異常大嗎? 如果您看到其中任一訊息,請連絡技術支援。

本頁內容