网站目录技能 site-catalog-skill
了解Experience现代化代理的网站目录技能如何执行现有网站的自动分析,以支持Edge Delivery Services迁移规划。
概述 overview
网站目录技能可发现网站上的每个页面,识别正在使用的页面模板和块变体,捕获每个页面的屏幕快照,并生成一个交互式HTML报表包,您可以在Console“预览”选项卡中浏览或下载并在本地打开。
该技能可通过以下方式为您和您将现有项目迁移到Edge Delivery Services提供支持:
- 开始迁移项目 — 运行技能,然后所有工作开始了解站点的规模,包括页面计数、模板、块变体和区域设置。 它建立了每个下游决策所依赖的基准库存。
- 工作量估计和规划 — 获取量化指标以支持提案、冲刺规划和资源分配。
- 批量导入准备 — 使用
template-catalog.json确定哪些页面共享相同的布局并计划逐个模板批量导入。 - 利益相关者报告 — 与项目经理、架构师和业务利益相关者共享交互式HTML报告包。
正在调用 invoking
在Experience Modernization Console中,使用自然语言要求代理编录站点。 以下是示例提示。
scope site https://www.example.comsite scope https://www.example.comanalyze https://www.example.comfind templates on https://www.example.comdiscover templates on https://www.example.comcatalog site https://www.example.comhow many page types are there on https://www.example.comwhat are the layouts on https://www.example.comanalyze site structure of https://www.example.com
您会注意到该技能的工作流具有四个按顺序运行的阶段:
- 分析
- 模板
- 调整
- 块编录
您可以重播任何阶段,代理会清除该阶段的输出和所有下游输出,然后从那时起继续运行。 以下是重播阶段的一些示例提示。
Repeat analyzing/Redo page analysis/Rerun analyze pagesRepeat templating/Redo the template discovery step/Restart the templating stepRepeat tuning/Rerun tune templates/Redo template tuningRepeat block cataloging/Restart catalog block variants
在重放阶段时,将保留先前的阶段。
输出 output
当技能完成网站的编目时,您会收到三种不同类型的输出。
-
聊天中的完成摘要,包括总计(页面、模板、具有EDS映射的块变体与自定义细分)、区域设置细分、覆盖率百分比和总体报告状态(完整/不完整/失败)
-
一个交互式HTML报表包作为您的主要交付项,已保存到
catalog/template-catalog-report-bundle.zip- 该捆绑包包含
template-catalog-report.html以及所有引用的屏幕截图和资源。 - 您可以下载该捆绑包并在本地查看或共享它。
- 或者,您可以要求代理
Move template-catalog-report-bundle.zip to the /content folder to render it in the preview tab. Update all references as needed.在控制台中查看报告。
- 该捆绑包包含
-
在
catalog/中针对下游技能和编程使用结构化JSON工件,包括summary.json、template-catalog.json、block-catalog.json、urls-all.json、urls-grouped.json、urls-checklist.json、.pages/、.blocks/
目录文件夹内容 contents
结构化JSON工件按技能存储在catalog/中。
template-catalog-report-bundle.zipsummary.jsontemplate-catalog.jsonblock-catalog.jsonurls-all.jsonurls-grouped.jsonurls-sample.jsonurls-checklist.jsoncatalog.log.pages/<page-slug>/page-catalog.json.pages/<page-slug>/full-page.jpg.pages/<page-slug>/blocks/<block-name>.jpg.pages/_global/header.json + header.jpg.pages/_global/footer.json + footer.jpg.blocks/<variantId>/metadata.json.blocks/<variantId>/screenshots/<name>.jpg报表状态 status
summary.json中的status字段可以是:
completeincompletefailed大型站点的取样 sampling
默认情况下,该技能将深层页面分析限制为1000个URL。 对于最多包含1000个URL的网站,将分析每个页面。
对于具有超过1000个URL的网站,代理会暂停并询问如何继续:
- 增加采样上限(最多4000个URL)
- 仅分析特定组(例如,仅
/products/*或/blog/*) - 分析所有URL并运行整个站点,而不进行采样
无论示例限制如何,URL发现始终涵盖整个站点。 只有深度每页面分析阶段是有限的。
要覆盖并分析每个页面,请告知代理:
analyze all URLsanalyze everythinganalyze every pagerun the full site
批量导入工作流 bulk-import
站点目录技能是迁移整个站点的推荐方法的一部分。
- 运行站点目录技能以获取完整的模板目录和块目录。
- 打开HTML报表包,以可视方式查看代理标识的模板。
- 对于每个模板,手动导入代表性页面(在
template-catalog.json中列出)并优化导入,直到输出正确为止。 - 使用来自
template-catalog.json的URL列表批量导入该模板的其余页面。 - 对每个模板重复执行上述操作,直到迁移整个站点。
限制 limitations
站点目录技能具有以下限制。
- 仅公用站点 — 目标必须可公开访问(无身份验证、VPN或防火墙)。
- 不支持动态内容 — 可能无法捕获需要用户交互才能在DOM中显示的内容。
- 默认1000 URL限制 — 默认情况下,深层分析阶段限制为1000个URL,可以将其覆盖,最多可覆盖4000个URL。