設定Web編目程式的最佳做法
本文提供使用的最佳實務 robots.txt
和 sitemap.xml
Adobe Commerce中的檔案,包括設定和安全性。 這些檔案會指示Web編目程式(通常是搜尋引擎自動機制)如何編目網站上的頁面。 設定這些檔案可改善網站效能和搜尋引擎最佳化。
受影響的產品和版本
所有支援的版本 之:
- 雲端基礎結構上的Adobe Commerce
- Adobe Commerce內部部署
雲端基礎結構上的Adobe Commerce
預設Adobe Commerce專案包含階層,其中包含單一網站、商店和商店檢視。 針對更複雜的實作,您可以為建立其他網站、商店和商店檢視 多網站 店面。
單一網站店面
設定時,請遵循這些最佳實務 robots.txt
和 sitemap.xml
單一網站店面的檔案:
-
確定您的專案正在使用
ece-tools
2002.0.12版或更新版本。 -
使用管理員應用程式將內容新增至
robots.txt
檔案。note tip TIP 檢視自動產生的 robots.txt
您商店的檔案,位於<domain.your.project>/robots.txt
. -
使用管理員應用程式來產生
sitemap.xml
檔案。note important IMPORTANT 由於雲端基礎結構專案上的Adobe Commerce是唯讀檔案系統,您必須指定 pub/media
路徑。 -
使用自訂Fastly VCL程式碼片段,從網站的根重新導向至
pub/media/
兩個檔案的位置:code language-vcl { "name": "sitemaprobots_rewrite", "dynamic": "0", "type": "recv", "priority": "90", "content": "if ( req.url.path ~ \"^/?sitemap.xml$\" ) { set req.url = \"pub/media/sitemap.xml\"; } else if (req.url.path ~ \"^/?robots.txt$\") { set req.url = \"pub/media/robots.txt\";}" }
-
在網頁瀏覽器中檢視檔案,以測試重新導向。 例如,
<domain.your.project>/robots.txt
和<domain.your.project>/sitemap.xml
. 請確定您使用的是設定重新導向的根路徑,而不是不同的路徑。
多網站店面
您可以在雲端基礎結構上透過單一實施Adobe Commerce來設定和執行數個存放區。 另請參閱 設定多個網站或商店.
設定此專案的相同最佳實務 robots.txt
和 sitemap.xml
檔案 單一網站店面 適用於具有兩個重要差異的多網站店面:
-
確定
robots.txt
和sitemap.xml
檔案名稱包含對應網站的名稱。 例如:domaineone_robots.txt
domaintwo_robots.txt
domainone_sitemap.xml
domaintwo_sitemap.xml
-
使用稍作修改的自訂Fastly VCL程式碼片段,從網站的根重新導向至
pub/media
這兩個檔案在您網站中的位置:code language-vcl { "name": "sitemaprobots_rewrite", "dynamic": "0", "type": "recv", "priority": "90", "content": "if ( req.url.path == \"/robots.txt\" ) { if ( req.http.host ~ \"(domainone|domaintwo).com$\" ) { set req.url = \"pub/media/\" re.group.1 \"_robots.txt\"; }} else if ( req.url.path == \"/sitemap.xml\" ) { if ( req.http.host ~ \"(domainone|domaintwo).com$\" ) { set req.url = \"pub/media/\" re.group.1 \"_sitemap.xml\"; }}" }
Adobe Commerce內部部署
使用管理應用程式來設定 robots.txt
和 sitemap.xml
防止機器人掃描和索引不必要內容的檔案(請參閱 搜尋引擎自動機制)。
/path/to/commerce/pub/media/
或 /path/to/commerce/media
,以適合您的安裝專案為準。安全性
請勿在下列位置公開您的管理員路徑: robots.txt
檔案。 公開管理員路徑是網站駭客活動的弱點,且可能會遺失資料。 從以下位置移除管理員路徑: robots.txt
檔案。
如需編輯 robots.txt
檔案並移除管理員路徑的所有專案,請參閱 行銷使用手冊> SEO和搜尋>搜尋引擎機器人.