網站目錄技能 site-catalog-skill

瞭解Experience現代化代理程式的網站目錄技能如何執行現有網站的自動化分析,以支援Edge Delivery Services移轉規劃。

概觀 overview

網站目錄技能會探索網站上的每個頁面、識別使用中的頁面範本和封鎖變體、擷取每個頁面的熒幕擷圖,並產生互動式HTML報表套裝,您可以在Console「預覽」索引標籤中瀏覽或下載並在本機開啟。

此技能可透過下列方式支援您及您將現有專案移轉至Edge Delivery Services:

  • 開始移轉專案 — 在任何工作開始瞭解網站規模(包括頁面計數、範本、區塊變體和區域設定)之前先執行技能。 這會建立每個下游決定所依賴的基準詳細目錄。
  • 工作量預估與規劃 — 取得量化量度,以支援提案、衝刺規劃及資源分配。
  • 大量匯入準備 — 使用template-catalog.json來識別哪些頁面共用相同的配置,並逐個範本計畫大量匯入。
  • 利害關係人報告 — 與專案經理、架構師和業務利害關係人共用互動式HTML報告套裝。

正在叫用 invoking

在Experience Modernization Console中,使用自然語言要求代理程式編目網站。 以下是範例提示。

  • scope site https://www.example.com
  • site scope https://www.example.com
  • analyze https://www.example.com
  • find templates on https://www.example.com
  • discover templates on https://www.example.com
  • catalog site https://www.example.com
  • how many page types are there on https://www.example.com
  • what are the layouts on https://www.example.com
  • analyze site structure of https://www.example.com

您會注意到該技能的工作流程有四個循序執行的階段:

  1. 分析
  2. 範本
  3. 調整
  4. 區塊編目

您可以重播任何階段,而代理程式會清除該階段的輸出和所有下游輸出,然後從該點繼續進行。 以下是重播階段的一些範例提示。

  • Repeat analyzing / Redo page analysis / Rerun analyze pages
  • Repeat templating / Redo the template discovery step / Restart the templating step
  • Repeat tuning / Rerun tune templates / Redo template tuning
  • Repeat block cataloging / Restart catalog block variants

重播階段時,會保留先前的階段。

輸出 output

當技能完成網站的編目時,您會收到三種不同型別的輸出。

  1. 聊天​中的完成摘要,包括總計(頁面、範本、具有EDS對應的區塊變體與自訂劃分)、地區設定劃分、涵蓋範圍百分比以及整體報告狀態(完整/不完整/失敗)

  2. 互動式HTML報表套裝​作為您的主要交付專案,已儲存至catalog/template-catalog-report-bundle.zip

    • 此套件組合包含template-catalog-report.html加上所有參照的熒幕擷取畫面與資產。
    • 您可以下載套件組合併在本機檢視或共用。
    • 或者,您可以要求代理程式Move template-catalog-report-bundle.zip to the /content folder to render it in the preview tab. Update all references as needed.在主控台中檢視報告。
  3. catalog/中用於下游技能和程式設計用途的結構化JSON成品,包括summary.jsontemplate-catalog.jsonblock-catalog.jsonurls-all.jsonurls-grouped.jsonurls-checklist.json.pages/.blocks/

目錄資料夾內容 contents

結構化JSON成品會依技能儲存在catalog/中。

檔案
說明
template-catalog-report-bundle.zip
互動式HTML報表套裝(主要交付專案)
summary.json
統計量度和報告狀態
template-catalog.json
URL各使用的所有不重複範本(用於大量匯入)
block-catalog.json
具有中繼資料和熒幕擷圖參考的所有區塊變體
urls-all.json
發現的每個URL
urls-grouped.json
依模式和區域設定分組的URL
urls-sample.json
代表URL抽樣分析
urls-checklist.json
每個URL的分析狀態
catalog.log
執行記錄
.pages/<page-slug>/page-catalog.json
頁面層級分析輸出
.pages/<page-slug>/full-page.jpg
全頁熒幕擷圖
.pages/<page-slug>/blocks/<block-name>.jpg
每個區塊的熒幕擷取畫面
.pages/_global/header.json + header.jpg
全域標題分析和熒幕擷圖
.pages/_global/footer.json + footer.jpg
全域頁尾分析和熒幕擷圖
.blocks/<variantId>/metadata.json
封鎖變數中繼資料
.blocks/<variantId>/screenshots/<name>.jpg
封鎖變體熒幕擷取畫面

報表狀態 status

summary.json中的status欄位可以是:

狀態
含義
complete
已成功分析所有頁面(或失敗率為10%或更低)。
incomplete
超過10%的頁面失敗,或超過50%的頁面發生封鎖偵測當機。 輸出仍可使用,但部分。
failed
未成功分析任何頁面。

大型網站的取樣 sampling

根據預設,此技能將深層頁面分析限製為1000個URL。 若網站的URL最多為1000個(含)URL,則會分析每個頁面。

若網站的URL超過1000個,代理程式會暫停並詢問如何繼續:

  • 增加取樣上限(最多4000個URL)
  • 僅分析特定群組(例如僅/products/*/blog/*
  • 分析所有URL並執行完整網站,而不使用抽樣

無論範例限製為何,URL探索一律涵蓋整個網站。 只有每頁深度分析階段會受到限制。

若要覆寫和分析每個頁面,請告訴代理程式:

  • analyze all URLs
  • analyze everything
  • analyze every page
  • run the full site

大量匯入工作流程 bulk-import

網站目錄技能是移轉完整網站建議方法的一部分。

  1. 執行網站目錄技能以取得完整的範本目錄和區塊目錄。
  2. 開啟HTML報表套裝,以視覺化方式檢視代理程式識別的範本。
  3. 對於每個範本,手動匯入代表性頁面(列在template-catalog.json中)並調整匯入,直到輸出正確為止。
  4. 使用來自template-catalog.json的URL清單大量匯入該範本的其餘頁面。
  5. 對每個範本重複此動作,直到移轉完整網站為止。

限制 limitations

網站目錄技能有下列限制。

  • 僅公用網站 — 目標必須可公開存取(無驗證、VPN或防火牆)。
  • 不支援動態內容 — 可能無法擷取需要使用者互動才能出現在DOM中的內容。
  • 預設1000 URL限制 — 深層分析階段預設限製為1000個URL,可以覆寫,最多可達4000個URL。
recommendation-more-help
experience-manager-cloud-service-help-main-toc