网站目录技能 site-catalog-skill

了解Experience现代化代理的网站目录技能如何执行现有网站的自动分析,以支持Edge Delivery Services迁移规划。

概述 overview

网站目录技能可发现网站上的每个页面,识别正在使用的页面模板和块变体,捕获每个页面的屏幕快照,并生成一个交互式HTML报表包,您可以在Console“预览”选项卡中浏览或下载并在本地打开。

该技能可通过以下方式为您和您将现有项目迁移到Edge Delivery Services提供支持:

  • 开始迁移项目 — 运行技能,然后所有工作开始了解站点的规模,包括页面计数、模板、块变体和区域设置。 它建立了每个下游决策所依赖的基准库存。
  • 工作量估计和规划 — 获取量化指标以支持提案、冲刺规划和资源分配。
  • 批量导入准备 — 使用template-catalog.json确定哪些页面共享相同的布局并计划逐个模板批量导入。
  • 利益相关者报告 — 与项目经理、架构师和业务利益相关者共享交互式HTML报告包。

正在调用 invoking

在Experience Modernization Console中,使用自然语言要求代理编录站点。 以下是示例提示。

  • scope site https://www.example.com
  • site scope https://www.example.com
  • analyze https://www.example.com
  • find templates on https://www.example.com
  • discover templates on https://www.example.com
  • catalog site https://www.example.com
  • how many page types are there on https://www.example.com
  • what are the layouts on https://www.example.com
  • analyze site structure of https://www.example.com

您会注意到该技能的工作流具有四个按顺序运行的阶段:

  1. 分析
  2. 模板
  3. 调整
  4. 块编录

您可以重播任何阶段,代理会清除该阶段的输出和所有下游输出,然后从那时起继续运行。 以下是重播阶段的一些示例提示。

  • Repeat analyzing / Redo page analysis / Rerun analyze pages
  • Repeat templating / Redo the template discovery step / Restart the templating step
  • Repeat tuning / Rerun tune templates / Redo template tuning
  • Repeat block cataloging / Restart catalog block variants

在重放阶段时,将保留先前的阶段。

输出 output

当技能完成网站的编目时,您会收到三种不同类型的输出。

  1. 聊天中的完成摘要,包括总计(页面、模板、具有EDS映射的块变体与自定义细分)、区域设置细分、覆盖率百分比和总体报告状态(完整/不完整/失败)

  2. 一个交互式HTML报表包​作为您的主要交付项,已保存到catalog/template-catalog-report-bundle.zip

    • 该捆绑包包含template-catalog-report.html以及所有引用的屏幕截图和资源。
    • 您可以下载该捆绑包并在本地查看或共享它。
    • 或者,您可以要求代理Move template-catalog-report-bundle.zip to the /content folder to render it in the preview tab. Update all references as needed.在控制台中查看报告。
  3. catalog/中针对下游技能和编程使用​结构化JSON工件,包括summary.jsontemplate-catalog.jsonblock-catalog.jsonurls-all.jsonurls-grouped.jsonurls-checklist.json.pages/.blocks/

目录文件夹内容 contents

结构化JSON工件按技能存储在catalog/中。

文件
描述
template-catalog-report-bundle.zip
交互式HTML报表包(主要交付内容)
summary.json
汇总量度和报告状态
template-catalog.json
具有使用每个URL的所有唯一模板(用于批量导入)
block-catalog.json
具有元数据和屏幕快照引用的所有块变量
urls-all.json
发现的每个URL
urls-grouped.json
按模式和区域设置分组的URL
urls-sample.json
代表URL采样以供分析
urls-checklist.json
每个URL的分析状态
catalog.log
执行日志
.pages/<page-slug>/page-catalog.json
页面级分析输出
.pages/<page-slug>/full-page.jpg
全页屏幕截图
.pages/<page-slug>/blocks/<block-name>.jpg
每块屏幕截图
.pages/_global/header.json + header.jpg
全局标题分析和屏幕截图
.pages/_global/footer.json + footer.jpg
全局页脚分析和屏幕快照
.blocks/<variantId>/metadata.json
阻止变量元数据
.blocks/<variantId>/screenshots/<name>.jpg
阻止变体屏幕截图

报表状态 status

summary.json中的status字段可以是:

状态
含义
complete
已成功分析所有页面(或者失败率为10%或更低)。
incomplete
超过10%的页面失败,或者超过50%的页面崩溃了块检测。 输出仍然可用,但不是全部。
failed
未成功分析页面。

大型站点的取样 sampling

默认情况下,该技能将深层页面分析限制为1000个URL。 对于最多包含1000个URL的网站,将分析每个页面。

对于具有超过1000个URL的网站,代理会暂停并询问如何继续:

  • 增加采样上限(最多4000个URL)
  • 仅分析特定组(例如,仅/products/*/blog/*
  • 分析所有URL并运行整个站点,而不进行采样

无论示例限制如何,URL发现始终涵盖整个站点。 只有深度每页面分析阶段是有限的。

要覆盖并分析每个页面,请告知代理:

  • analyze all URLs
  • analyze everything
  • analyze every page
  • run the full site

批量导入工作流 bulk-import

站点目录技能是迁移整个站点的推荐方法的一部分。

  1. 运行站点目录技能以获取完整的模板目录和块目录。
  2. 打开HTML报表包,以可视方式查看代理标识的模板。
  3. 对于每个模板,手动导入代表性页面(在template-catalog.json中列出)并优化导入,直到输出正确为止。
  4. 使用来自template-catalog.json的URL列表批量导入该模板的其余页面。
  5. 对每个模板重复执行上述操作,直到迁移整个站点。

限制 limitations

站点目录技能具有以下限制。

  • 仅公用站点 — 目标必须可公开访问(无身份验证、VPN或防火墙)。
  • 不支持动态内容 — 可能无法捕获需要用户交互才能在DOM中显示的内容。
  • 默认1000 URL限制 — 默认情况下,深层分析阶段限制为1000个URL,可以将其覆盖,最多可覆盖4000个URL。
recommendation-more-help
experience-manager-cloud-service-help-main-toc