Analyse du taux d’accès au cache du réseau CDN

Le contenu mis en cache sur le réseau CDN réduit la latence subie par les utilisateurs et les utilisatrices du site web, qui n’ont pas besoin d’attendre que la requête revienne vers Apache/Dispatcher ou l’instance de publication AEM. Dans ce contexte, il est utile d’optimiser le taux d’accès au cache du réseau CDN pour maximiser la quantité de contenu pouvant être mise en cache sur le réseau CDN.

Découvrez comment analyser les journaux de réseau CDN fournis par AEM as a Cloud Service et comment obtenir des informations telles que le taux d’accès au cache et les URL principales de types de cache MISS et PASS à des fins d’optimisation.

Les journaux de réseau CDN sont disponibles au format JSON, qui contient divers champs, y compris url et cache. Pour plus d’informations, voir Format des journaux de réseau CDN. Le champ cache fournit des informations sur l’état du cache. Ses valeurs possibles sont HIT, MISS ou PASS. Examinons les détails des valeurs possibles.

État du cache
Valeur possible
Description
HIT
Les données demandées sont récupérées dans le cache du réseau CDN et ne nécessitent pas d’effectuer une requête de récupération auprès du serveur AEM.
MISS
Les données requises sont introuvables dans le cache du réseau CDN et doivent faire l’objet d’une requête au serveur AEM.
PASS
Les données requises sont explicitement définies pour ne pas être mises en cache et toujours récupérées à partir du serveur AEM.

Pour les besoins de ce tutoriel, le projet AEM WKND est déployé dans l’environnement AEM as a Cloud Service et un petit test de performance est déclenché à l’aide d’Apache JMeter.

Ce tutoriel est structuré de manière à vous guider dans le processus suivant :

  1. Téléchargement des journaux de réseau CDN via Cloud Manager
  2. L’analyse de ces journaux de réseau CDN peut être réalisée selon deux méthodes : un tableau de bord installé localement ou Jupityer Notebook ou Spunk accessible à distance (pour ceux qui disposent d’une licence Adobe Experience Platform).
  3. Optimisation de la configuration du cache de réseau CDN

Télécharger les journaux de réseau CDN

Pour télécharger les journaux de réseau CDN, procédez comme suit :

  1. Connectez-vous à Cloud Manager à l’adresse my.cloudmanager.adobe.com et sélectionnez votre organisation et votre programme.

  2. Pour un environnement AEMCS souhaité, sélectionnez Télécharger les journaux dans le menu représentant des points de suspension.

    Télécharger les journaux : Cloud Manager{width="500" modal="regular"}

  3. Dans la boîte de dialogue Télécharger les journaux, sélectionnez le service de Publication dans le menu déroulant, puis cliquez sur l’icône de téléchargement en regard de la ligne CDN.

    Journaux de réseau CDN : Cloud Manager{width="500" modal="regular"}

Si le fichier journal téléchargé date d’aujourd’hui, l’extension de fichier est .log. Sinon, pour les fichiers journaux précédents, l’extension est .log.gz.

Analyser les journaux de réseau CDN téléchargés

Pour obtenir des informations telles que le taux d’accès au cache et les URL principales des types de cache MISS et PASS, analysez le fichier journal de réseau CDN téléchargé. Ces informations permettent d’optimiser la Configuration du cache de réseau CDN et d’améliorer les performances du site.

Pour analyser les journaux CDN, ce tutoriel présente trois options :

  1. Elasticsearch, Logstash et Kibana (ELK)  : l’outil de tableau de bord ELK peut être installé localement.
  2. Splunk  : l’outil de tableau de bord Splunk nécessite l’accès à Splunk et l’activation du transfert de journal AEMCS pour ingérer les journaux CDN.
  3. Jupyter Notebook  : accessible à distance dans le cadre d’Adobe Experience Platform sans installer de logiciel supplémentaire, pour les clientes et clients qui disposent d’une licence Adobe Experience Platform.

Option 1 : utilisation des outils de tableau de bord ELK

La pile ELK est un ensemble d’outils fournissant une solution évolutive et permettant de rechercher, d’analyser et de visualiser les données. Elle se compose d’Elasticsearch, de Logstash et de Kibana.

Pour identifier les détails clés, nous allons utiliser le projet AEMCS-CDN-Log-Analysis-Tooling. Ce projet fournit un conteneur Docker de la pile ELK et un tableau de bord Kibana préconfiguré pour analyser les journaux de réseau CDN.

  1. Suivez les étapes de Configuration du conteneur ELK Docker et veillez à importer le tableau de bord Kibana Taux d’accès au cache du réseau CDN.

  2. Pour identifier le taux d’accès au cache du réseau CDN et aux URL principales, procédez comme suit :

    1. Copiez le ou les fichiers journaux de réseau CDN téléchargés dans le dossier de journaux spécifique à l’environnement, par exemple ELK/logs/stage.

    2. Ouvrez le tableau de bord Taux d’accès au cache du réseau CDN en cliquant dans le coin supérieur gauche sur Menu de navigation > Analytics > Tableau de bord > Taux d’accès au cache du réseau CDN.

      Taux d’accès au cache du réseau CDN : tableau de bord Kibana{width="500" modal="regular"}

    3. Sélectionnez la période souhaitée dans le coin supérieur droit.

      Période : tableau de bord Kibana{width="500" modal="regular"}

    4. Le tableau de bord Taux d’accès au cache du réseau CDN est explicite.

    5. La section Analyse totale des requêtes affiche les détails suivants :

      • Taux de cache par type de cache
      • Nombre de mises en cache par type de cache

      Analyse totale des requêtes : tableau de bord Kibana{width="500" modal="regular"}

    6. L’analyse par type de requête ou MIME affiche les détails suivants :

      • Taux de cache par type de cache
      • Nombre de mises en cache par type de cache
      • Principales URL MISS et PASS

      Analyse par type de requête ou MIME : tableau de bord Kibana{width="500" modal="regular"}

Filtrage par nom d’environnement ou identifiant de programme

Pour filtrer les journaux ingérés par nom d’environnement, procédez comme suit :

  1. Dans le tableau de bord Taux d’accès au cache du réseau CDN, cliquez sur l’icône Ajouter un filtre.

    Filtre : tableau de bord Kibana{width="500" modal="regular"}

  2. Dans la boîte de dialogue modale Ajouter un filtre, sélectionnez le champ aem_env_name.keyword dans le menu déroulant, puis l’opérateur is et le nom de l’environnement de votre choix pour le champ suivant. Cliquez ensuite sur Ajouter un filtre.

    Ajouter un filtre : tableau de bord Kibana{width="500" modal="regular"}

Filtrage par nom d’hôte

Pour filtrer les journaux ingérés par nom d’hôte, procédez comme suit :

  1. Dans le tableau de bord Taux d’accès au cache du réseau CDN, cliquez sur l’icône Ajouter un filtre.

    Filtre : tableau de bord Kibana{width="500" modal="regular"}

  2. Dans la boîte de dialogue modale Ajouter un filtre, sélectionnez le champ host.keyword dans le menu déroulant, puis l’opérateur is et le nom d’hôte souhaité pour le champ suivant. Cliquez ensuite sur Ajouter un filtre.

    Filtre hôte : tableau de bord Kibana{width="500" modal="regular"}

De même, ajoutez d’autres filtres au tableau de bord en fonction des exigences d’analyse.

Option 2 : utilisation d’un outil de tableau de bord Splunk

Splunk est un outil d’analyse de journaux populaire qui permet d’agréger, d’analyser les journaux et de créer des visualisations à des fins de surveillance et de dépannage.

Pour identifier les détails clés, nous allons utiliser le projet AEMCS-CDN-Log-Analysis-Tooling. Ce projet fournit un tableau de bord Splunk pour analyser les journaux CDN.

  1. Suivez les étapes de Tableau de bord Splunk pour l’analyse de journaux de réseau CDN AEMCS et veillez à importer le tableau de bord Splunk Taux d’accès au cache du réseau CDN.

  2. Si nécessaire, mettez à jour les valeurs de filtre index, type de source et autres dans le tableau de bord Splunk.

    Tableau de bord Splunk{width="500" modal="regular"}

NOTE
L’interface d’utilisation et les graphiques du tableau de bord Splunk diffèrent du tableau de bord ELK, mais les détails clés sont similaires.

Option 3 : utilisation de Jupyter Notebook

Pour les personnes qui préfèrent ne pas installer de logiciel localement (c’est-à-dire les outils de tableau de bord ELK de la section précédente), il existe une autre option, mais elle nécessite une licence Adobe Experience Platform.

Jupyter Notebook est une application web open source qui permet de créer des documents contenant du code, du texte et des visualisations. Elle est utilisée pour la transformation, la visualisation et la modélisation statistique des données. Elle est accessible à distance dans le cadre d’Adobe Experience Platform.

Télécharger le fichier Interactive Python Notebook

Téléchargez d’abord le fichier AEM-as-a-CloudService - CDN Logs Analysis - Jupyter Notebook qui facilite l’analyse des journaux CDN. Le fichier « Interactive Python Notebook » est explicite, mais les points forts de chaque section sont les suivants :

  • Installation de bibliothèques supplémentaires  : installe les bibliothèques Python termcolor et tabulate.
  • Chargement des journaux de réseau CDN  : charge le fichier journal de réseau CDN à l’aide de la valeur de variable log_file. Veillez à mettre à jour sa valeur. Il transforme également ce journal de réseau CDN en pandas DataFrame.
  • Exécution de l’analyse  : le premier bloc de code est Afficher le résultat de l’analyse pour les requêtes totales, HTML, JS/CSS et Image. Il fournit le pourcentage, des diagrammes à barres et des diagrammes circulaires pour le taux d’accès au cache.
    Le second bloc de code est 5 principales URL de requête MISS et PASS pour HTML, JS/CSS et Image. Il affiche les URL et leur nombre au format tableau.

Exécution de Jupyter Notebook

Exécutez ensuite Jupyter Notebook dans Adobe Experience Platform, en suivant les étapes ci-dessous :

  1. Connectez-vous à Adobe Experience Cloud. Sur la page d’accueil > Accès rapide  > cliquez sur l’icône Experience Platform.

    Experience Platform.{width="500" modal="regular"}

  2. Sur la page d’accueil d’Adobe Experience Platform > section Science des données, cliquez sur l’élément de menu Notebooks. Pour démarrer l’environnement Jupyter Notebooks, cliquez sur le bouton JupyterLab.

    Mise à jour de la valeur du fichier journal Notebook.{width="500" modal="regular"}

  3. Dans le menu JupyterLab, à l’aide de l’icône Chargement de fichiers, chargez le fichier journal de réseau CDN et le fichier aemcs_cdn_logs_analysis.ipynb téléchargés.

    Chargement des fichiers : JupyterLab{width="500" modal="regular"}

  4. Ouvrez le fichier aemcs_cdn_logs_analysis.ipynb en double-cliquant dessus.

  5. Dans la section Charger le fichier journal de réseau CDN du Notebook, mettez à jour la valeur log_file.

    Mise à jour de la valeur du fichier journal Notebook.{width="500" modal="regular"}

  6. Pour exécuter la cellule sélectionnée et avancer, cliquez sur l’icône de lecture.

    Mise à jour de la valeur du fichier journal Notebook.{width="500" modal="regular"}

  7. Après avoir exécuté la cellule de code Afficher le résultat de l’analyse pour les requêtes totales, HTML, JS/CSS et Image, le résultat affiche le pourcentage, des diagrammes à barres et des diagrammes circulaires pour le taux d’accès au cache.

    Mise à jour de la valeur du fichier journal Notebook.{width="500" modal="regular"}

  8. Après avoir exécuté la cellule de code 5 principales URL de requêtes MISS et PASS pour HTML, JS/CSS et Image, la sortie affiche les 5 principales URL de requêtes MISS et PASS.

    Mise à jour de la valeur du fichier journal Notebook.{width="500" modal="regular"}

Vous pouvez améliorer Jupyter Notebook de sorte à analyser les journaux de réseau CDN en fonction de vos besoins.

Optimisation de la configuration du cache de réseau CDN

Après avoir analysé les journaux de réseau CDN, vous pouvez optimiser la configuration du cache de réseau CDN pour améliorer les performances du site. La bonne pratique AEM consiste à obtenir un taux d’accès au cache de 90 % ou plus.

Pour plus d’informations, voir Optimisation de la configuration du cache de réseau CDN.

Le projet AEM WKND comporte une configuration de réseau CDN de référence. Pour plus d’informations, voir Configuration du réseau CDN dans le fichier wknd.vhost.

recommendation-more-help
4859a77c-7971-4ac9-8f5c-4260823c6f69