Información general de Dispatcher
- Temas:
- Dispatcher
Creado para:
- Administrador
Dispatcher es una herramienta de equilibrio de carga y de almacenamiento en caché de Adobe Experience Manager que se puede utilizar junto con un servidor web de clase empresarial.
El proceso de implementación de Dispatcher es independiente del servidor web y de la plataforma del sistema operativo elegido:
- Obtenga información sobre Dispatcher (esta página). Consulte también las preguntas más frecuentes sobre Dispatcher.
- Instale un servidor web admitido según la documentación del servidor web.
- Instale el módulo de Dispatcher en el servidor web y configure ese servidor web en consecuencia.
- Configure Dispatcher (mediante el archivo dispatcher.any).
- Configure AEM para que las actualizaciones de contenido invaliden la caché.
- Consulte Preguntas a los expertos de la comunidad de AEM para julio de 2017.
- Acceda a este repositorio. Contiene una colección de experimentos en formato de laboratorio "para llevar a casa".
Utilice la siguiente información según sea necesario:
- Lista de comprobación de seguridad de Dispatcher
- Base de conocimientos de Dispatcher
- Optimizar un sitio web para el rendimiento de la caché
- Utilización de Dispatcher con múltiples dominios
- Utilización de SSL con Dispatcher
- Implementar el almacenamiento en caché con permisos confidenciales
- Solución de problemas de Dispatcher
- Preguntas más frecuentes sobre los problemas principales de Dispatcher
¿Por qué utilizar Dispatcher para implementar el almacenamiento en caché?
Existen dos enfoques básicos para la publicación web:
- Servidores web estáticos: por ejemplo, Apache o IIS, que son muy sencillos pero rápidos.
- Servidores de administración de contenido: estos proporcionan un contenido dinámico, en tiempo real e inteligente, pero necesitan más tiempo de cálculo y otros recursos.
Dispatcher le ayudará a crear un entorno rápido y dinámico. Funciona como parte de un servidor HTML estático, como Apache, con el objetivo de:
- guardar (o "almacenar en caché") todo el contenido posible del sitio en forma de un sitio web estático.
- acceder al motor de diseño lo menos posible.
Lo que significa que:
-
el contenido estático se gestiona con la misma velocidad y facilidad que en un servidor web estático. Además, puede utilizar las herramientas de administración y seguridad disponibles para sus servidores web estáticos.
-
el contenido dinámico se genera según sea necesario, sin ralentizar el sistema más de lo absolutamente necesario.
Dispatcher contiene mecanismos para generar y actualizar HTML estático basado en el contenido del sitio dinámico. Puede especificar con detalle qué documentos se han guardado como archivos estáticos y cuáles se crean siempre de manera dinámica.
En esta sección se ilustran los principios en los que se basa este proceso.
Servidor web estático
Un servidor web estático, como Apache o IIS, proporciona archivos HTML estáticos a los visitantes de su sitio web. Las páginas estáticas se crean una vez, por lo que se enviará el mismo contenido para cada solicitud.
Este proceso es sencillo y eficiente. Si un visitante solicita un archivo (por ejemplo, una página HTML), ese archivo se toma generalmente directamente de la memoria y, en el peor de los casos, se lee desde la unidad local. Los servidores web estáticos han estado disponibles durante bastante tiempo. Como tal, existe una amplia gama de herramientas para la administración y la administración de la seguridad. Estas herramientas están bien integradas con las infraestructuras de red.
Servidores de administración de contenido
Si utiliza un servidor de administración de contenido, como AEM, un motor de diseño avanzado se encarga de procesar la solicitud de un visitante. El motor lee el contenido de un repositorio que, combinado con estilos, formatos y derechos de acceso, transforma ese contenido en un documento totalmente ajustado a las necesidades y derechos del visitante.
Este flujo de trabajo le permite crear contenido dinámico más rico, lo que aumenta la flexibilidad y funcionalidad del sitio web. Sin embargo, el motor de diseño requiere más potencia de procesamiento que un servidor estático, por lo que esta configuración puede resultar más lenta si muchos visitantes utilizan el sistema.
Cómo realiza Dispatcher el almacenamiento en caché
Directorio de caché: para realizar el almacenamiento en caché, el módulo de Dispatcher utiliza la capacidad del servidor web para proporcionar contenido estático. Así pues, Dispatcher coloca los documentos guardados en la caché en la raíz del servidor web.
Métodos de almacenamiento en caché
Dispatcher tiene dos métodos principales para actualizar el contenido de la caché cuando se realizan cambios en el sitio web.
- Las actualizaciones de contenido quitan las páginas que han cambiado, así como los archivos que están directamente asociados a ellas.
- La invalidación automática invalida automáticamente las partes de la caché que pueden estar desactualizadas tras una actualización. Es decir, marca las páginas relevantes como desactualizadas, sin eliminar nada.
Actualizaciones de contenido
En una actualización de contenido, cambian uno o varios documentos AEM. AEM envía una solicitud de distribución a Dispatcher, que actualiza la caché en consecuencia:
- Elimina los archivos modificados de la caché.
- Elimina de la caché todos los archivos que comiencen con el mismo identificador. Por ejemplo, si se actualiza el archivo
/en/index.html
, se eliminan todos los archivos que empiecen por/en/index.
. Este mecanismo le permite diseñar sitios eficientes en la caché, especialmente sobre la navegación de imágenes. - Esto afecta al denominado archivo de estado, que actualiza la marca de tiempo del archivo de estado para indicar la fecha del último cambio.
Es necesario señalar los siguientes puntos:
- Las actualizaciones de contenido se utilizan en general con un sistema de creación, que “sabe” lo que hay que reemplazar.
- Las actualizaciones de contenido que afectan a los archivos se eliminan, pero no se reemplazan inmediatamente. La próxima vez que se solicite un archivo de ese tipo, Dispatcher recuperará el nuevo archivo de la instancia de AEM y lo colocará en la caché, sobrescribiendo el contenido anterior.
- En general, las imágenes creadas automáticamente y que contengan texto de una página se guardan en archivos de imagen que comiencen por el mismo identificador. De esa manera, se garantiza que exista la asociación para poder realizar la eliminación. Por ejemplo, puede guardar el texto de título de la página mypage.html como la imagen mypage.titlePicture.gif en la misma carpeta. De este modo, la imagen se elimina automáticamente de la caché cada vez que se actualiza la página, por lo que puede estar seguro de que la imagen siempre reflejará la versión actual de la página.
- Puede tener varios archivos de estado, por ejemplo, uno por carpeta de idioma. Si se actualiza una página, AEM busca la siguiente carpeta principal que contenga un archivo de estado y que afecte a dicho archivo.
Invalidación automática
La invalidación automática invalida automáticamente partes de la caché, sin eliminar físicamente ningún archivo. En cada actualización de contenido, se modifica el llamado archivo de estado, por lo que la marca de tiempo reflejará la última actualización de contenido.
Dispatcher tiene una lista de archivos que están sujetos a la invalidación automática. Cuando se solicita un documento de esa lista, Dispatcher compara la fecha del documento en caché con la marca de tiempo del archivo de estado:
- si el documento en caché es más reciente, Dispatcher lo devuelve.
- si es anterior, Dispatcher recupera la versión actual de la instancia de AEM.
Cabe señalar también algunos puntos:
- La invalidación automática se suele utilizar cuando las interrelaciones son complejas; por ejemplo, en páginas HTML. Estas páginas contienen vínculos y entradas de navegación, por lo que normalmente deben actualizarse después de actualizar el contenido. Si ha generado automáticamente archivos PDF o de imagen, puede optar por invalidarlos automáticamente también.
- La invalidación automática no implica ninguna acción por parte de Dispatcher en el momento de la actualización, excepto cuando este proceso afecta al archivo de estado. Sin embargo, al modificar el archivo de estado automáticamente, el contenido de la caché queda obsoleto y no se puede eliminar físicamente de la misma.
Cómo devuelve documentos Dispatcher
Determinar si un documento está sujeto al almacenamiento en caché
Puede definir qué documentos almacena en caché Dispatcher en el archivo de configuración. Dispatcher comprueba la solicitud con la lista de documentos que se pueden almacenar en caché. Si el documento no está en esta lista, Dispatcher solicita el documento a la instancia de AEM.
Dispatcher siempre solicita el documento directamente desde la instancia de AEM en los siguientes casos:
- El URI de la solicitud contiene el signo de interrogación
?
. Este escenario generalmente indica una página dinámica, como un resultado de búsqueda, que no necesita almacenarse en la caché. - Si falta la extensión del archivo. El servidor web necesita la extensión para determinar el tipo de documento (el tipo MIME).
- El encabezado de autenticación está establecido (configurable).
Determinar si un documento está almacenado en la caché
Dispatcher almacena los archivos en la caché del servidor web como si fueran parte de un sitio web estático. Si un usuario solicita un documento almacenable en la caché, Dispatcher comprueba si el documento existe en el sistema de archivos del servidor web:
- si el documento está en la caché, Dispatcher devuelve el archivo.
- si no está en la caché, Dispatcher solicita el documento a la instancia de AEM.
Determinar si un documento está actualizado
Para saber si un documento está actualizado, Dispatcher realiza dos acciones:
- Comprueba si el documento depende de la invalidación automática. En caso contrario, el documento se considera actualizado.
- Si el documento está configurado para la invalidación automática, Dispatcher comprueba si es anterior o posterior a la fecha del último cambio disponible. Si es anterior, Dispatcher solicita la versión actual a la instancia de AEM y reemplaza la versión en la caché.
Las ventajas del equilibrio de carga
Equilibrio de carga es la práctica de distribuir la carga de cálculo del sitio web en varias instancias de AEM.
Se obtiene lo siguiente:
-
mayor potencia de procesamiento
En la práctica, esto significa que Dispatcher comparte solicitudes de documento entre varias instancias de AEM. Dado que cada instancia tiene ahora menos documentos para procesar, los tiempos de respuesta son más rápidos. Dispatcher guarda estadísticas internas de cada categoría de documento, de modo que puede estimar la carga y distribuir las consultas de forma eficaz. -
mayor cobertura de seguridad contra fallos
Si Dispatcher no recibe respuestas de una instancia, reenviará automáticamente las solicitudes a una de las otras instancias. Por lo tanto, si una instancia deja de estar disponible, el único efecto es una ralentización del sitio, proporcional a la potencia de cálculo perdida. Sin embargo, todos los servicios continuarán. -
También puede administrar distintos sitios web en el mismo servidor web estático.
Cómo realiza Dispatcher el equilibrio de carga
Estadísticas de rendimiento
Dispatcher mantiene estadísticas internas sobre la rapidez con la que cada instancia de AEM procesa los documentos. En base a estos datos, Dispatcher calcula qué instancia proporcionará el tiempo de respuesta más rápido al responder una solicitud y, por lo tanto, se reserva el tiempo de cálculo necesario en ese caso.
Los distintos tipos de solicitudes pueden tener diferentes tiempos medio de finalización, por lo que Dispatcher permite especificar categorías de documentos. Estas categorías se tienen en cuenta al calcular las estimaciones de tiempo. Por ejemplo, puede hacer una distinción entre páginas e imágenes HTML, ya que los tiempos de respuesta típicos pueden ser diferentes.
Si utiliza una función de búsqueda detallada, puede crear una nueva categoría para las consultas de búsqueda. Este método permite que Dispatcher envíe consultas de búsqueda a la instancia que responda con mayor rapidez. También contribuye a evitar que una instancia más lenta se detenga cuando reciba varias consultas de búsqueda "costosas", mientras que las demás reciben las solicitudes "más baratas".
Contenido personalizado (conexiones duraderas)
Las conexiones duraderas garantizan que todos los documentos de un usuario se compongan en la misma instancia de AEM. Esto es importante si utiliza páginas personalizadas y datos de sesión. Los datos se almacenan en la instancia, por lo que las solicitudes posteriores del mismo usuario deben volver a esa instancia o se perderán los datos.
Como las conexiones duraderas restringen la capacidad de Dispatcher para optimizar las solicitudes, debe utilizarlas únicamente cuando sea necesario. Puede especificar la carpeta que contiene los documentos “duraderos”, asegurándose así de que todos los documentos de esa carpeta se compongan en la misma instancia para cada usuario.
Utilizar varias instancias de Dispatcher
En configuraciones complejas, puede utilizar varias instancias de Dispatcher. Por ejemplo, puede utilizar:
- una instancia de Dispatcher para publicar un sitio web en la Intranet
- una segunda instancia de Dispatcher, en una dirección y con una configuración de seguridad diferentes, para publicar el mismo contenido en Internet.
En ese caso, asegúrese de que cada solicitud pasa por una única instancia de Dispatcher. Una instancia de Dispatcher no administra solicitudes procedentes de otra instancia de Dispatcher. Por lo tanto, asegúrese de que ambas instancias de Dispatcher acceden directamente al sitio web de AEM.
Utilizar Dispatcher con una CDN
Una red de entrega de contenido (CDN), como Akamai Edge Delivery o Amazon Cloud Front, ofrece contenido desde una ubicación cercana al usuario final. Por eso
- se aceleran los tiempos de respuesta de los usuarios finales
- se quita carga de los servidores
Como componente de infraestructura HTTP, una CDN funciona parecido a Dispatcher. Cuando un nodo de CDN recibe una solicitud, la sirve desde su caché, si es posible (el recurso está disponible en la caché y es válido). De lo contrario, se dirige al siguiente servidor más cercano para recuperar el recurso y almacenarlo en la caché para solicitudes adicionales, si procede.
El "siguiente servidor más cercano" depende de la configuración específica. Por ejemplo, en una configuración de Akamai, la solicitud puede seguir la siguiente ruta:
- El nodo perimetral Akamai
- La capa Akamai Midgress
- Su cortafuegos
- Su equilibrador de carga
- Dispatcher
- AEM
Normalmente, Dispatcher es el siguiente servidor que puede proporcionar el documento desde una caché e influir en los encabezados de respuesta devueltos al servidor CDN.
Controlar una caché de CDN
Existen varias formas de controlar durante cuánto tiempo una CDN almacena en caché un recurso antes de recuperarlo de Dispatcher.
-
Configuración explícita
Configure el tiempo durante el que se retienen recursos concretos en la caché de CDN, según el tipo MIME, la extensión, el tipo de solicitud, etc. -
Caducidad y encabezados de control de caché
La mayoría de las CDN respetan los encabezados HTTPExpires:
yCache-Control:
si es el servidor de flujo ascendente el que los envía. Esto se puede lograr, por ejemplo, utilizando el módulo Apache mod_expires. -
Invalidación manual
Las CDN permiten que los recursos se eliminen de la caché a través de interfaces web. -
Invalidación basada en API
La mayoría de las CDN también ofrecen una API de REST o SOAP que permite eliminar recursos de la caché.
En una configuración típica de AEM, la configuración por extensión, por ruta o por ambas (que se puede lograr mediante los puntos 1 y 2 anteriores) ofrece posibilidades para establecer períodos razonables de almacenamiento en caché. Estos periodos de almacenamiento en caché son para los recursos usados con frecuencia que no cambian con frecuencia, como imágenes de diseño y bibliotecas del cliente. Cuando se implementan nuevas versiones, generalmente se requiere una invalidación manual.
Si este método se utiliza para almacenar en caché el contenido administrado, implica que los cambios de contenido solo son visibles para los usuarios finales una vez que el período de almacenamiento en caché configurado haya caducado. Y, cuando el documento se recupere de Dispatcher de nuevo.
Para un control más preciso, la invalidación basada en API permite invalidar la caché de una CDN, ya que la caché de Dispatcher se invalida a su vez. Según la API de CDN, puede implementar sus propios ContentBuilder y TransportHandler (si la API no está basada en REST) y configurar un agente de replicación que los use para invalidar la caché de CDN.
Utilizar Dispatcher con un servidor de creación
author_dispatcher.any
y modifique la propiedad /rule
de la sección /cache
de la siguiente manera:/rules
{
/0000
{ /type "deny" /glob "*"}
}
Dispatcher se puede utilizar delante de una instancia de autor para mejorar el rendimiento del proceso de creación. Para configurar una instancia de Dispatcher de creación, haga lo siguiente:
-
Instale una instancia de Dispatcher en un servidor web (puede ser Apache o IIS, consulte Instalación de Dispatcher).
-
Pruebe el Dispatcher recién instalado con una instancia de publicación AEM en funcionamiento. De este modo, se garantiza que se ha alcanzado una instalación correcta para la línea de base.
-
Asegúrese de que Dispatcher pueda conectarse por medio de TCP/IP a su instancia de autor.
-
Sustituya el archivo de ejemplo
dispatcher.any
por el archivoauthor_dispatcher.any
que se proporciona con la descarga de Dispatcher. -
Abra
author_dispatcher.any
en un editor de texto y realice los siguientes cambios:- Cambie
/hostname
y/port
de la sección/renders
para que apunten a la instancia de autor. - Cambie
/docroot
de la sección/cache
para que apunte a un directorio de caché. Si utiliza AEM con la interfaz táctil de usuario, consulte la advertencia anterior. - Guarde los cambios.
- Cambie
-
Elimine todos los archivos existentes en el directorio
/cache
>/docroot
que configuró anteriormente. -
Reinicie el servidor web.
author_dispatcher.any
proporcionada, cuando instale un paquete de funciones CQ5, una revisión o un paquete de código de aplicación que afecta a cualquier contenido de /libs
o /apps
, debe eliminar los archivos en caché. Los archivos están en esos directorios en su caché de Dispatcher. Al hacerlo, se garantiza que la próxima vez que se soliciten se recuperen los archivos recién actualizados y no los antiguos que se guardaron en la caché.- Elimine o desactive el agente de vaciado del Dispatcher de autor en la instancia de autor de AEM.
- Vuelva a configurar la instancia de Dispatcher de autor siguiendo las nuevas instrucciones que le indicamos previamente.