Invalider des pages mises en cache depuis AEM invalidating-cached-pages-from-aem

Lors de l’utilisation de Dispatcher avec AEM, vous devez configurer l’interaction pour assurer une gestion efficace du cache. En fonction de votre environnement, la configuration peut également augmenter les performances.

Configuration des comptes d’utilisateur AEM setting-up-aem-user-accounts

Le compte d’utilisateur ou d’utilisatrice admin par défaut est utilisé pour authentifier les agents de réplication qui sont installés par défaut. Vous devez créer un compte d’utilisateur ou d’utilisatrice dédié à utiliser avec des agents de réplication.

Pour plus d’informations, voir Configuration des utilisateurs de réplication et de transport de la section Liste de contrôle de sécurité d’AEM.

Invalider le cache de Dispatcher depuis l’environnement de création invalidating-dispatcher-cache-from-the-authoring-environment

Un agent de réplication de l’instance de création AEM envoie une demande d’invalidation du cache à Dispatcher lorsqu’une page est publiée. Dispatcher actualise le fichier ultérieurement dans le cache lorsque du nouveau contenu est publié.

Procédez comme suit pour configurer un agent de réplication sur l’instance d’auteur AEM. La configuration invalide le cache de Dispatcher lors de l’activation de la page :

  1. Ouvrez la console d’outils AEM. (https://localhost:4502/miscadmin#/etc)

  2. Ouvrez l’agent de réplication requis sous Outils/réplication/Agents sur l’instance d’auteur. Vous pouvez utiliser l’agent de purge de Dispatcher installé par défaut.

  3. Cliquez sur Modifier puis, dans l’onglet Paramètres, assurez-vous que l’option Activé est sélectionnée.

  4. (Facultatif) Pour activer les requêtes d’invalidation de chemin d’alias ou de redirection vers les microsites, activez l’option Mise à jour d’alias.

  5. Dans l’onglet Transport, accédez à Dispatcher en saisissant l’URI.

    Si vous utilisez l’agent de purge standard de Dispatcher, vous devrez probablement mettre à jour le nom d’hôte et le port. Par exemple, https://<dispatcherHost>:<portApache>/dispatcher/invalidate.cache.

    Note : pour les agents de purge de Dispatcher, la propriété URI n’est utilisée que si vous utilisez des entrées d’hôte virtuel basées sur un chemin pour différencier les batteries de serveurs. Utilisez ce champ pour cibler la ferme de serveurs à invalider. Par exemple, la ferme de serveurs n°1 dispose d’un hôte virtuel de www.mysite.com/path1/* et la ferme de serveurs n°2 d’un hôte virtuel de www.mysite.com/path2/*. Vous pouvez utiliser une URL de /path1/invalidate.cache pour cibler la première ferme de serveurs et /path2/invalidate.cache pour cibler la seconde ferme de serveurs. Pour plus d’informations, voir Utilisation de Dispatcher avec plusieurs domaines.

  6. Configurez les autres paramètres selon vos besoins.

  7. Cliquez sur OK pour activer l’agent.

Vous pouvez également accéder à l’agent de purge de Dispatcher et le configurer depuis l’interface utilisateur tactile d’AEM.

Pour plus d’informations sur l’activation d’accès aux URL de redirection, voir Activer un accès aux URL de redirection.

NOTE
L’agent de vidage du cache de Dispatcher n’a pas besoin d’un nom d’utilisateur et d’un mot de passe, mais s’ils sont configurés, ils sont envoyés avec une authentification de base.

Cette approche présente deux problèmes potentiels :

  • Dispatcher doit être accessible depuis l’instance de création. Si votre réseau (le pare-feu, par exemple) est configuré de sorte que l’accès entre les deux soit limité, cela peut ne pas être le cas.

  • La publication et l’invalidation du cache ont lieu en même temps. En fonction du moment, un utilisateur ou une utilisatrice peut demander une page juste après sa suppression du cache et juste avant la publication de la nouvelle page. AEM renvoie désormais l’ancienne page et Dispatcher la met à nouveau en cache. Cette situation est plus problématique pour les sites volumineux.

Invalidation du cache de Dispatcher depuis une instance de publication invalidating-dispatcher-cache-from-a-publishing-instance

Dans certains cas, vous pouvez améliorer les performances en transférant la gestion des caches de l’environnement de création à une instance de publication. C’est alors l’environnement de publication (et non l’environnement de création AEM) qui envoie une requête d’invalidation du cache à Dispatcher lorsqu’une page publiée est reçue.

Ces cas incluent :

NOTE
Un administrateur AEM expérimenté doit prendre la décision d’utiliser cette méthode.

Un agent de réplication opérant sur l’instance de publication contrôle le vidage de Dispatcher. Toutefois, la configuration est effectuée dans l’environnement de création, puis transférée en activant l’agent :

  1. Ouvrez la console Outils AEM.

  2. Ouvrez l’agent de réplication requis sous Outils/réplication/Agents sur publication. Vous pouvez utiliser l’agent de purge de Dispatcher installé par défaut.

  3. Cliquez sur Modifier puis, dans l’onglet Paramètres, assurez-vous que l’option Activé est sélectionnée.

  4. (Facultatif) Pour activer les requêtes d’invalidation de chemin d’alias ou de redirection vers les microsites, activez l’option Mise à jour d’alias.

  5. Dans l’onglet Transport, accédez à Dispatcher en saisissant l’URI nécessaire.
    Si vous utilisez l’agent de purge standard de Dispatcher, mettez à jour le nom d’hôte et le port ; par exemple, http://<dispatcherHost>:<portApache>/dispatcher/invalidate.cache

    Note : pour les agents de purge de Dispatcher, la propriété URI n’est utilisée que si vous utilisez des entrées d’hôte virtuel basées sur un chemin pour différencier les batteries de serveurs. Utilisez ce champ pour cibler la ferme de serveurs à invalider. Par exemple, la ferme de serveurs n°1 dispose d’un hôte virtuel de www.mysite.com/path1/* et la ferme de serveurs n°2 d’un hôte virtuel de www.mysite.com/path2/*. Vous pouvez utiliser une URL de /path1/invalidate.cache pour cibler la première ferme de serveurs et /path2/invalidate.cache pour cibler la seconde ferme de serveurs. Pour plus d’informations, voir Utilisation de Dispatcher avec plusieurs domaines.

  6. Configurez les autres paramètres selon vos besoins.

  7. Connectez-vous à l’instance de publication et validez la configuration de l’agent de purge. Assurez-vous également qu’il est activé.

  8. Répétez l’opération pour chaque instance de publication concernée.

Après configuration, lorsque vous activez une page de création à publier, cet agent lance une réplication standard. Le journal comprend des messages indiquant les requêtes provenant de votre serveur de publication, semblables à l’exemple suivant :

  1. <publishserver> 13:29:47 127.0.0.1 POST /dispatcher/invalidate.cache 200

Invalider manuellement le cache de Dispatcher manually-invalidating-the-dispatcher-cache

Pour invalider (ou purger) le cache de Dispatcher sans activer de page, vous pouvez émettre une requête HTTP au Dispatcher. Par exemple, vous pouvez créer une application AEM qui permet aux administrateurs et administratrices ou à d’autres applications de purger le cache.

La requête HTTP entraîne Dispatcher à supprimer des fichiers spécifiques du cache. Le Dispatcher actualise ensuite éventuellement le cache avec une nouvelle copie.

Suppression de fichiers mis en cache delete-cached-files

Envoyez une requête HTTP qui entraîne Dispatcher à supprimer des fichiers du cache. Dispatcher met à nouveau les fichiers en cache uniquement lorsqu’il reçoit une requête client pour la page. Cette méthode de suppression de fichiers mis en cache convient aux sites web peu susceptibles de recevoir des requêtes simultanées pour la même page.

La requête HTTP se présente comme suit :

POST /dispatcher/invalidate.cache HTTP/1.1
CQ-Action: Activate
CQ-Handle: path-pattern
Content-Length: 0

Dispatcher vide (supprime) les fichiers et les dossiers mis en cache dont les noms correspondent à la valeur de l’en-tête CQ-Handler. Par exemple, un CQ-Handle de /content/geomtrixx-outdoors/en correspond aux éléments suivants :

  • Tous les fichiers (quelle que soit leur extension) nommés en dans le répertoire geometrixx-outdoors

  • N’importe quel répertoire nommé _jcr_content below the en répertoire (qui, s’il existe, contient les rendus mis en cache des sous-noeuds de la page)

Tous les autres fichiers du cache de Dispatcher (ou jusqu’à un niveau spécifique, en fonction du paramètre /statfileslevel) sont invalidés en modifiant le fichier .stat. La date de dernière modification de ce fichier est comparée à la date de la dernière modification du document mis en cache et le document est à nouveau récupéré si le fichier .stat est plus récent. Pour plus d’informations, voir Invalidation des fichiers par niveau de dossier.

L’invalidation (c’est-à-dire la modification des fichiers .stat) peut être évitée en envoyant un en-tête CQ-Action-Scope: ResourceOnly supplémentaire. Cette fonctionnalité peut être utilisée pour vider des ressources spécifiques. Tout cela sans invalider les autres parties du cache, comme les données JSON. Ces données sont créées dynamiquement et nécessitent une purge régulière, indépendamment du cache. Par exemple, représenter les données obtenues à partir d’un système tiers pour afficher des informations, des tickets d’actions, etc.

Supprimer et remettre en cache des fichiers delete-and-recache-files

Envoyez une requête HTTP qui entraîne Dispatcher à supprimer les fichiers mis en cache, et à récupérer immédiatement le fichier. Supprimez et remettez immédiatement les fichiers en cache lorsque les sites web sont susceptibles de recevoir des requêtes client simultanées pour la même page. La remise en cache immédiate garantit que Dispatcher récupère et met en cache la page une seule fois, au lieu d’une fois pour chacune des requêtes client simultanées.

Note : la suppression et la remise en cache ne peuvent être exécutées que sur l’instance de publication. En cas d’exécution depuis l’instance de création, des conditions de concurrence se produisent lorsque les tentatives de remise en cache des ressources ont lieu avant leur publication.

La requête HTTP se présente comme suit :

POST /dispatcher/invalidate.cache HTTP/1.1
CQ-Action: Activate
`Content-Type: text/plain
CQ-Handle: path-pattern
Content-Length: numchars in bodypage_path0

page_path1
...
page_pathn

Les chemins d’accès aux pages à mettre à nouveau en cache immédiatement sont répertoriés sur des lignes distinctes dans le corps du message. La valeur de CQ-Handle est le chemin d’accès d’une page qui invalide les pages à remettre en cache. (Voir le paramètre /statfileslevel de l’élément de configuration Cache). L’exemple de message HTTP suivant supprime et recense les /content/geometrixx-outdoors/en.html page :

POST /dispatcher/invalidate.cache HTTP/1.1
CQ-Action: Activate
Content-Type: text/plain
CQ-Handle: /content/geometrixx-outdoors/en/men.html
Content-Length: 36

/content/geometrixx-outdoors/en.html

Exemple de servlet de purge example-flush-servlet

Le code suivant implémente un servlet qui envoie une requête d’invalidation à Dispatcher. Le servlet reçoit un message de requête contenant les paramètres handle et page. Ces paramètres fournissent la valeur de l’en-tête CQ-Handle et le chemin d’accès à la page à remettre en cache, respectivement. Le servlet utilise les valeurs pour construire la requête HTTP pour Dispatcher.

Lorsque le servlet est déployé sur l’instance de publication, l’URL suivante entraîne Dispatcher à supprimer la page /content/geometrixx-outdoors/en.html , puis à mettre en cache une nouvelle copie.

10.36.79.223:4503/bin/flushcache/html?page=/content/geometrixx-outdoors/en.html&handle=/content/geometrixx-outdoors/en/men.html

NOTE
Cet exemple de servlet n’est pas sécurisé et présente uniquement l’utilisation du message de requête HTTP Post. Votre solution doit sécuriser l’accès au servlet.
package com.adobe.example;

import org.apache.felix.scr.annotations.Component;
import org.apache.felix.scr.annotations.Service;
import org.apache.felix.scr.annotations.Property;

import org.apache.sling.api.SlingHttpServletRequest;
import org.apache.sling.api.SlingHttpServletResponse;
import org.apache.sling.api.servlets.SlingSafeMethodsServlet;

import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

import org.apache.commons.httpclient.*;
import org.apache.commons.httpclient.methods.PostMethod;
import org.apache.commons.httpclient.methods.StringRequestEntity;

@Component(metatype=true)
@Service
public class Flushcache extends SlingSafeMethodsServlet {

 @Property(value="/bin/flushcache")
 static final String SERVLET_PATH="sling.servlet.paths";

 private Logger logger = LoggerFactory.getLogger(this.getClass());

 public void doGet(SlingHttpServletRequest request, SlingHttpServletResponse response) {
  try{
      //retrieve the request parameters
      String handle = request.getParameter("handle");
      String page = request.getParameter("page");

      //hard-coding connection properties is a bad practice, but is done here to simplify the example
      String server = "localhost";
      String uri = "/dispatcher/invalidate.cache";

      HttpClient client = new HttpClient();

      PostMethod post = new PostMethod("https://"+host+uri);
      post.setRequestHeader("CQ-Action", "Activate");
      post.setRequestHeader("CQ-Handle",handle);

      StringRequestEntity body = new StringRequestEntity(page,null,null);
      post.setRequestEntity(body);
      post.setRequestHeader("Content-length", String.valueOf(body.getContentLength()));
      client.executeMethod(post);
      post.releaseConnection();
      //log the results
      logger.info("result: " + post.getResponseBodyAsString());
      }
  }catch(Exception e){
      logger.error("Flushcache servlet exception: " + e.getMessage());
  }
 }
}
recommendation-more-help
ce382601-480f-4a99-8be7-73178d4b6ef5