Dispatcher 概述 dispatcher-overview
Dispatcher 是 Adobe Experience Manager 与企业级 Web 服务器结合使用的缓存和负载平衡工具。
Dispatcher的部署过程与所选的Web服务器和操作系统平台无关:
- 了解 Dispatcher(此页面)。另请参阅有关 Dispatcher 的常见问题解答。
- 按照 Web 服务器文档安装支持的 Web 服务器。
- 在 Web 服务器上安装 Dispatcher 模块,并相应地配置 Web 服务器。
- 配置 Dispatcher(dispatcher.any 文件)。
- 配置 AEM,以便内容更新后,使缓存失效。
根据需要使用以下信息:
为何使用 Dispatcher 来实施缓存? why-use-dispatcher-to-implement-caching
有两种基本方法可进行 Web 发布:
- 静态 Web 服务器:例如 Apache 或 IIS,简易,但速度快。
- 内容管理服务器:提供动态、实时、智能的内容,但需要更多的计算时间和其他资源。
Dispatcher 可帮助实现既快速又动态的环境。它在静态 HTML 服务器(比如 Apache)中使用的目的是:
- 以静态网站的形式尽可能多地存储(“缓存”)站点内容
- 尽可能少地访问布局引擎。
这意味着:
-
如同在静态 Web 服务器上一样快速而简便地处理 静态内容。此外,还可使用为静态 Web 服务器提供的管理和安全工具。
-
根据需要生成 动态内容,完全没有必要再减慢系统速度。
Dispatcher 包含根据动态站点内容生成和更新静态 HTML 的机制。您可以详细指定将哪些文档存储为静态文件,哪些文档始终通过动态方式生成。
此部分阐明此过程背后的原理。
静态 Web 服务器 static-web-server
一个静态 Web 服务器(如 Apache 或 IIS)为网站的访客提供静态 HTML 文件。仅创建一次静态页面,因此对于每个请求都传送相同的内容。
此过程简单而又高效。如果访客请求某个文件(如 HTML 页面),则直接从内存取得该文件;在最差的情况下,从本地驱动器读取它。静态 Web 服务器已经出现很长一段时间了。 因此,管理和安全管理工具种类繁多。这些工具与网络基础设施结合得很好。
内容管理服务器 content-management-servers
如果使用 CMS(全称为内容管理服务器,如 AEM),则有一个先进的布局引擎处理来自访客的请求。该引擎从存储库读取内容,并与样式、格式和访问权限相结合,将内容转换为专门根据访客的需求和权利定制的文档。
通过此工作流,可创建更丰富的动态内容,从而提高网站的灵活性和功能性。但是,布局引擎需要比静态服务器更大的处理能力,因此,如果许多访客同时使用系统,则此设置的速度可能会减慢。
Dispatcher 如何执行缓存 how-dispatcher-performs-caching
缓存目录:对于执行缓存,Dispatcher 模块利用 Web 服务器的功能来提供静态内容。Dispatcher 将缓存文档放在 Web 服务器的根目录下。
缓存方法
Dispatcher 有两种主要的方法可在对网站作出更改时更新缓存内容。
- 内容更新 删除已更改的页面以及与其直接关联的文件。
- 自动失效 在更新后自动使缓存可能已过期的那些部分失效。也就是说,它实际上将相关的页面标为已过期,但不删除任何内容。
内容更新
在内容更新中,有一个或多个 AEM 文档发生了变更。AEM 向 Dispatcher 发送联合请求,以相应地更新缓存:
- 它从缓存中删除修改过的文件。
- 它从缓存中删除以相同句柄开头的所有文件。例如,如果更新了文件
/en/index.html
,则会删除所有以/en/index.
开头的文件。通过此机制,您可设计出缓存效率高的网站,尤其是涉及图片导航的网站。 - 它“接触”所谓的 statfile**,这样将更新 statfile 的时间戳以指示上次更改的日期。
应注意以下几点:
- 内容更新一般与“知道”必须替换哪些内容的创作系统配合使用。
- 影响文件的内容更新会被移除,但不会立即替换。下次请求此类文件时,Dispatcher将从AEM实例获取新文件,并将其放在缓存中,从而覆盖旧内容。
- 通常情况下,自动生成的图片(包含来自页面的文本)将存储在以相同句柄开头的图片文件中 - 从而确保存在关联以便于删除。例如,您可以将 mypage.html 页面的标题文本作为 mypage.titlePicture.gif 图片存储在相同的文件夹中。这样每次更新页面后就会自动从缓存中删除图片,您就可以确保图片始终反映页面的最新版本。
- 您可能有多个 statfile,例如每个语言文件夹一个。如果页面已更新,AEM 将查找包含 statfile 的下一个父文件夹,然后处理**该文件。
自动失效
自动失效可自动使部分缓存失效 - 不会实际删除任何文件。在每次内容更新时,都会处理所谓的 statfile,因此其时间戳记可以反映最新的内容更新日期。
Dispatcher 有一个遵循自动失效机制的文件列表。当请求该列表中的文档时,Dispatcher 会将缓存文档的日期与 statfile 的时间戳记进行比较:
- 如果缓存文档的日期较新,则 Dispatcher 将返回缓存文档。
- 如果日期较旧,则 Dispatcher 将从 AEM 实例中检索最新版本。
同样,应当注意这几点:
- 一般在互相之间的关系比较复杂(如 HTML 页面)时使用自动失效。这些页面包含链接和导航条目,因此在内容更新后一般必须更新这些页面。如果您有自动生成的 PDF 或图片文件,也可选择使这些文件自动失效。
- 除了接触 statfile 之外,自动失效并不涉及在更新时 Dispatcher 执行的任何操作。但是,接触 statfile 将自动使缓存内容过时,但并不真正地从缓存中删除内容。
Dispatcher 如何返回文档 how-dispatcher-returns-documents
确定文档是否实施了缓存
您可以在配置文件中定义 Dispatcher 缓存的文档。Dispatcher 根据可缓存文档列表检查请求。如果文档不在此列表中,则 Dispatcher 从 AEM 实例中请求该文档。
在以下情况下,Dispatcher 始终直接从 AEM 实例请求文档:
- 请求 URI 包含问号“
?
”。 此场景一般指示无需缓存的动态页面,如搜索结果。 - 缺失文件扩展名。Web 服务器需要扩展名以确定文档类型(MIME 类型)。
- 设置了身份验证标头(可配置)。
确定文档是否已缓存
Dispatcher 将缓存文件存储在 Web 服务器上,当做静态网站的一部分。如果用户请求一个可缓存的文档,则 Dispatcher 检查该文档是否存在于 Web 服务器的文件系统中:
- 如果文档已缓存,则 Dispatcher 返回该文件。
- 如果未缓存,则 Dispatcher 从 AEM 实例请求该文档。
确定文档是否为最新
为确定文档是否为最新状态,Dispatcher 将执行两个步骤:
- 它检查文档是否遵循自动失效机制。如果不是,则认为该文档是最新的。
- 如果该文档配置为自动失效,则 Dispatcher 检查它比最后一次可用更改旧还是新。如果较旧,则 Dispatcher 从 AEM 实例请求当前版本,并替换缓存中的版本。
负载平衡的好处 the-benefits-of-load-balancing
负载平衡就是在多个 AEM 实例间分发网站的计算负载。
您将获得:
-
提高了处理能力:
在实践中,提高处理能力意味着 Dispatcher 可在若干 AEM 实例之间分摊文档请求。由于现在每个实例处理的文档数量减少,您的响应速度将会加快。Dispatcher 保留每个文档类别的内部统计信息,以便能够估计负载并高效分发查询。 -
扩大了防故障范围
如果 Dispatcher 没有从某个实例收到响应,则它自动将请求转发到其他实例。如果一个实例变得不可用,唯一的影响就是网站响应变慢,而这与损失的计算能力成比例。但是,所有服务都继续正常运转。 -
您还可以在同一个静态 Web 服务器上管理不同的网站。
Dispatcher 如何执行负载平衡 how-the-dispatcher-performs-load-balancing
性能统计数据
Dispatcher 保留有关 AEM 每个实例处理文档的速度的内部统计信息。Dispatcher 根据这些数据估算哪个实例在应答请求时的响应速度最快,然后它在该实例上预留必要的计算时间。
不同类型的请求,其平均完成时间可能也不相同,因此 Dispatcher 让您指定文档类别。随后将在估算时间时考虑这些类别。例如,可区分 HTML 页面与图像,因为二者的典型响应时间可能相差较大。
如果使用详细搜索功能,则可为搜索查询创建类别。此方法有助于 Dispatcher 将搜索查询发送到响应最快的实例。它还有助于防止速度较慢的实例在收到若干“高成本”搜索查询而其他实例获得“低成本”请求时发生停滞。
个性化的内容(粘性连接)
粘性连接可确保同一个用户的文档全部在 AEM 的同一个实例上撰写。如果您使用个性化的页面和会话数据,则这一点非常重要。数据存储在该实例上,则同一用户发出的后续请求必须返回到该实例,否则数据就会丢失。
由于粘性连接会限制 Dispatcher 优化请求的能力,因此应仅在需要时使用。您可以指定包含“粘性”文档的文件夹,从而确保该文件夹中每个用户的所有文档都在同一个实例上撰写。
使用多个 Dispatcher using-multiple-dispatchers
在复杂设置中,您可以使用多个 Dispatcher。例如,您可以使用:
- 一个 Dispatcher 用于在内联网上发布网站
- 第二个 Dispatcher,通过不同的地址和不同的安全设置,在内联网上发布相同的内容。
在这种情况下,请确保每个请求只通过一个 Dispatcher。一个 Dispatcher 不能处理来自另一个 Dispatcher 的请求。因此,请确保两个 Dispatcher 都能直接访问 AEM 网站。
将 Dispatcher 与 CDN 结合使用 using-dispatcher-with-a-cdn
内容交付网络 (CDN)(如 Akamai Edge Delivery 或 Amazon Cloud Front)从距离最终用户较近的站点交付内容。这样,它可以
- 加快最终用户响应速度
- 减少服务器的负载
作为 HTTP 基础设施组件,CDN 的工作原理与 Dispatcher 非常相似。当 CDN 节点收到请求时,如果可能(缓存中的资源可用且有效),它会从缓存中为请求提供服务。否则,它将连接下一个距离最近的服务器,以检索资源并缓存下来,以备响应后续请求(如果适用)。
“下一个距离最近的服务器”取决于您的具体设置。例如,在 Akamai 设置中,请求可以遵循以下路径:
- Akamai 边缘节点
- Akamai Midgress 图层
- 您的防火墙
- 您的负载平衡器
- Dispatcher
- AEM
Dispatcher 一般就是下一个可能从缓存提供文档并影响返回到 CDN 服务器的响应标头的服务器。
控制 CDN 缓存 controlling-a-cdn-cache
有若干方法可控制 CDN 缓存某个资源多久后再从 Dispatcher 重新获取该资源。
-
显式配置
根据 mime 类型、扩展名、请求类型等,配置特定资源在 CDN 缓存中保留多久。 -
到期和缓存控制标头
如果上游服务器发送Expires:
和Cache-Control:
HTTP 标头,则大多数 CDN 都将采用这些标头。例如,可使用 mod_expires Apache 模块实现此方法。 -
手动失效
CDN 允许通过 Web 界面从缓存中删除资源。 -
基于 API 的失效
大多数 CDN 还提供使得可从缓存中删除资源的 REST 和/或 SOAP API。
在典型的 AEM 设置中,通过扩展、路径或两者进行配置(可以通过上面的第 1 点和第 2 点实现)可以设置合理的缓存期限。这些缓存期适用于不经常更改的常用资源,例如设计图像和客户端库。在部署新版本时,通常需要手动进行失效操作。
如果将此方法用于缓存受管内容,则意味着仅在配置的缓存期限到期,内容变更才对最终用户可见。 而且,当再次从 Dispatcher 获取文档时,用户才能看到内容的更改。
为了更精细地控制,通过基于 API 的失效,可在 Dispatcher 缓存失效时使 CDN 的缓存失效。可根据 CDN 的 API 实现您自己的 ContentBuilder 和 TransportHandler(如果 API 不基于 REST),并设置使用这两项使 CDN 的缓存失效的复制代理。
将 Dispatcher 与创作服务器一起使用 using-a-dispatcher-with-an-author-server
author_dispatcher.any
文件并修改 /cache
部分的 /rule
属性,如下所示:/rules
{
/0000
{ /type "deny" /glob "*"}
}
Dispatcher 可在创作实例之前使用以提高创作性能。要配置创作 Dispatcher,请执行以下操作:
-
将 Dispatcher 装入 Web 服务器(Apache 或 IIS Web 服务器,请参阅安装 Dispatcher)。
-
对照正常工作的 AEM 发布实例测试新安装的 Dispatcher。这样做确保安装的基准正确无误。
-
确保 Dispatcher 能够通过 TCP/IP 连接到您的作者实例。
-
将示例的
dispatcher.any
文件替换为随 Dispatcher 下载提供的author_dispatcher.any
文件。 -
在文本编辑器中打开
author_dispatcher.any
,并进行以下更改:- 更改
/renders
部分的/hostname
和/port
,以使其指向您的创作实例。 - 更改
/cache
部分的/docroot
,以使其指向缓存目录。如果您将 AEM 与 Touch UI 一起使用,请查看上面的警告。 - 保存更改。
- 更改
-
删除您在前面配置的“
/cache
”>“/docroot
”目录中的所有现有文件。 -
重新启动 Web 服务器。
author_dispatcher.any
配置,在安装影响 /libs
或 /apps
下任何内容的 CQ5 功能包、修补程序或应用程序代码包时,必须删除缓存文件。这些文件位于 Dispatcher 缓存中的相应目录下。这样做可以确保下次请求它们时获取新升级的文件,而不是旧的缓存文件。- 在您的 AEM 创作实例上删除或禁用 创作 Dispatcher 的 刷新代理。
- 按照上述的新指示,重新进行创作 Dispatcher 配置。