Analyse du taux d’accès au cache du réseau CDN

Dernière mise à jour : 2024-01-26
  • Créé pour :
  • Intermediate
    Admin
    Developer

Le contenu mis en cache sur le réseau de diffusion de contenu réduit la latence vécue par les utilisateurs du site web, qui n’ont pas besoin d’attendre que la demande revienne vers Apache/dispatcher ou AEM publication. Dans ce contexte, il est utile d’optimiser le taux d’accès au cache du réseau CDN pour maximiser la quantité de contenu pouvant être mise en cache sur le réseau CDN.

Découvrez comment analyser l’AEM as a Cloud Service fournie Journaux CDN et obtenir des informations telles que taux d’accès au cache, et URL principales de MISS et PASS types de cache, à des fins d’optimisation.

Les journaux CDN sont disponibles au format JSON, qui contient divers champs, y compris url, cache. Pour plus d’informations, voir Format de journal CDN. Le champ cache fournit des informations sur l’état du cache. Ses valeurs possibles sont HIT, MISS ou PASS. Examinons les détails des valeurs possibles.

État du cache
Valeur possible
Description
HIT Les données demandées sont récupérées dans le cache du réseau CDN et ne nécessitent pas d’effectuer une requête de récupération auprès du serveur AEM.
MISS Les données requises sont introuvables dans le cache du réseau CDN et doivent faire l’objet d’une requête au serveur AEM.
PASS Les données requises sont explicitement définies pour ne pas être mises en cache et toujours récupérées à partir du serveur AEM.

Pour les besoins de ce tutoriel, le AEM projet WKND est déployé dans l’environnement as a Cloud Service AEM et un petit test de performance est déclenché à l’aide de Apache JMeter.

Ce tutoriel est structuré de manière à vous guider dans le processus suivant :

  1. Téléchargement des journaux CDN via Cloud Manager
  2. L’analyse de ces journaux CDN, qui peuvent être réalisés avec deux méthodes : un tableau de bord installé localement ou un notebook Jupityer accessible à distance (pour ceux qui disposent d’une licence Adobe Experience Platform)
  3. Optimisation de la configuration du cache CDN

Télécharger les journaux de réseau CDN

Pour télécharger les journaux de réseau CDN, procédez comme suit :

  1. Connectez-vous à Cloud Manager à l’adresse my.cloudmanager.adobe.com et sélectionnez votre organisation et votre programme.

  2. Pour un environnement AEMCS souhaité, sélectionnez Télécharger les journaux dans le menu représentant des points de suspension.

    Télécharger les journaux : Cloud Manager
  3. Dans la boîte de dialogue Télécharger les journaux, sélectionnez le service de Publication dans le menu déroulant, puis cliquez sur l’icône de téléchargement en regard de la ligne cdn.

    Journaux de réseau CDN : Cloud Manager

Si le fichier journal téléchargé date d’aujourd’hui, l’extension de fichier est .log. Sinon, pour les fichiers journaux précédents, l’extension est .log.gz.

Analyser les journaux de réseau CDN téléchargés

Pour obtenir des informations telles que le taux d’accès au cache et les URL principales des types de cache MISS et PASS, analysez le fichier de journal CDN téléchargé. Ces informations permettent d’optimiser la Configuration du cache de réseau CDN et d’améliorer les performances du site.

Pour analyser les journaux CDN, cet article présente deux options : Elasticsearch, Logstash et Kibana (ELK) Outils du tableau de bord et Notebook Jupyter. L’outil de tableau de bord ELK peut être installé localement sur votre ordinateur portable, tandis que l’outil Notebook Jupityr est accessible à distance. dans Adobe Experience Platform sans installer de logiciel supplémentaire, pour ceux qui disposent d’une licence Adobe Experience Platform.

Option 1 : utilisation des outils de tableau de bord ELK

La pile ELK est un ensemble d’outils fournissant une solution évolutive et permettant de rechercher, d’analyser et de visualiser les données. Elle se compose d’Elasticsearch, de Logstash et de Kibana.

Pour identifier les détails clés, nous allons utiliser le projet d’outils de tableau de bord AEMCS-CDN-Log-Analysis-ELK-Tool. Ce projet fournit un conteneur Docker de la pile ELK et un tableau de bord Kibana préconfiguré pour analyser les journaux de réseau CDN.

  1. Suivez les étapes de Configuration du conteneur ELK Docker et veillez à importer le tableau de bord Kibana Taux d’accès au cache du réseau CDN.

  2. Pour identifier le taux d’accès au cache du réseau CDN et aux URL principales, procédez comme suit :

    1. Copiez le ou les fichiers journaux de réseau CDN téléchargés dans le dossier spécifique à l’environnement.

    2. Ouvrez le Taux d’accès au cache du réseau CDN en cliquant sur le coin supérieur gauche du menu de navigation > Analytics > Tableau de bord > Rapport d’accès au cache CDN.

      Taux d’accès au cache du réseau CDN : tableau de bord Kibana
    3. Sélectionnez la période souhaitée dans le coin supérieur droit.

      Période : tableau de bord Kibana
    4. Le tableau de bord Taux d’accès au cache du réseau CDN est explicite.

    5. La section Analyse totale des requêtes affiche les détails suivants :

      • Taux de cache par type de cache
      • Nombre de mises en cache par type de cache
      Analyse totale des requêtes : tableau de bord Kibana
    6. L’analyse par type de requête ou MIME affiche les détails suivants :

      • Taux de cache par type de cache
      • Nombre de mises en cache par type de cache
      • Principales URL MISS et PASS
      Analyse par type de requête ou MIME : tableau de bord Kibana

Filtrage par nom d’environnement ou identifiant de programme

Pour filtrer les journaux ingérés par nom d’environnement, procédez comme suit :

  1. Dans le tableau de bord Taux d’accès au cache du réseau CDN, cliquez sur l’icône Ajouter un filtre.

    Filtre : tableau de bord Kibana
  2. Dans la boîte de dialogue modale Ajouter un filtre, sélectionnez le champ aem_env_name.keyword dans le menu déroulant, puis l’opérateur is et le nom de l’environnement de votre choix pour le champ suivant. Cliquez ensuite sur Ajouter un filtre.

    Ajouter un filtre : tableau de bord Kibana

Filtrage par nom d’hôte

Pour filtrer les journaux ingérés par nom d’hôte, procédez comme suit :

  1. Dans le tableau de bord Taux d’accès au cache du réseau CDN, cliquez sur l’icône Ajouter un filtre.

    Filtre : tableau de bord Kibana
  2. Dans la boîte de dialogue modale Ajouter un filtre, sélectionnez le champ host.keyword dans le menu déroulant, puis l’opérateur is et le nom d’hôte souhaité pour le champ suivant. Cliquez ensuite sur Ajouter un filtre.

    Filtre hôte : tableau de bord Kibana

De même, ajoutez d’autres filtres au tableau de bord en fonction des exigences d’analyse.

Option 2 : utilisation du notebook Jupyter

Pour ceux qui préfèrent ne pas installer de logiciel localement (c’est-à-dire l’outil de tableau de bord ELK de la section précédente), il existe une autre option, mais elle nécessite une licence pour Adobe Experience Platform.

Jupyter Notebook est une application web open source qui permet de créer des documents contenant du code, du texte et des visualisations. Il est utilisé pour la transformation des données, la visualisation et la modélisation statistique. Il est accessible à distance dans Adobe Experience Platform.

Téléchargement du fichier notebook Python interactif

Tout d’abord, téléchargez le AEM-as-a-CloudService - Analyse des journaux CDN - notebook Jupyter qui facilite l’analyse des journaux CDN. Ce fichier "Interactive Python Notebook" s’explique parfaitement, cependant, les points forts de chaque section sont les suivants :

  • Installation de bibliothèques supplémentaires : installe les bibliothèques Python termcolor et tabulate.
  • Chargement des journaux CDN: charge le fichier journal du réseau de diffusion de contenu à l’aide de log_file de la variable. Veillez à mettre à jour sa valeur. Il transforme également ce journal de réseau CDN en pandas DataFrame.
  • Exécution de l’analyse: le premier bloc de code est Afficher le résultat de l’analyse pour les demandes totales, de HTML, JS/CSS et d’image; il fournit des graphiques en pourcentage du taux d’accès au cache, en barres et en secteurs.
    Le second bloc de code est 5 premières URL de demande MISS et PASS pour HTML, JS/CSS et image; il affiche les URL et leur nombre au format tableau.

Exécution du notebook Jupyter

Exécutez ensuite le notebook Jupyter dans Adobe Experience Platform en procédant comme suit :

  1. Connectez-vous à Adobe Experience Cloud. Sur la page d’accueil > Accès rapide > cliquez sur l’icône Experience Platform.

    Experience Platform.
  2. Sur la page d’accueil d’Adobe Experience Platform > section Science des données, cliquez sur l’élément de menu Notebooks. Pour démarrer l’environnement Jupyter Notebooks, cliquez sur le bouton JupyterLab.

    Mise à jour de la valeur du fichier journal Notebook.
  3. Dans le menu JupyterLab, à l’aide de l’icône Chargement de fichiers, chargez le fichier journal de réseau CDN et le fichier aemcs_cdn_logs_analysis.ipynb téléchargés.

    Chargement des fichiers : JupyterLab
  4. Ouvrez le fichier aemcs_cdn_logs_analysis.ipynb en double-cliquant dessus.

  5. Dans la section Charger le fichier journal de réseau CDN du Notebook, mettez à jour la valeur log_file.

    Mise à jour de la valeur du fichier journal Notebook.
  6. Pour exécuter la cellule sélectionnée et avancer, cliquez sur l’icône de lecture.

    Mise à jour de la valeur du fichier journal Notebook.
  7. Après avoir exécuté la cellule de code Afficher le résultat de l’analyse pour les requêtes totales, HTML, JS/CSS et Image, le résultat affiche le pourcentage, des diagrammes à barres et des diagrammes circulaires pour le taux d’accès au cache.

    Mise à jour de la valeur du fichier journal Notebook.
  8. Après avoir exécuté la cellule de code 5 principales URL de requêtes MISS et PASS pour HTML, JS/CSS et Image, la sortie affiche les 5 principales URL de requêtes MISS et PASS.

    Mise à jour de la valeur du fichier journal Notebook.

Vous pouvez améliorer Jupyter Notebook de sorte à analyser les journaux de réseau CDN en fonction de vos besoins.

Optimisation de la configuration du cache CDN

Après avoir analysé les journaux de réseau CDN, vous pouvez optimiser la configuration du cache de réseau CDN pour améliorer les performances du site. La bonne pratique AEM consiste à obtenir un taux d’accès au cache de 90 % ou plus.

Pour plus d’informations, voir Optimisation de la configuration du cache de réseau CDN.

Le projet AEM WKND comporte une configuration de réseau CDN de référence. Pour plus d’informations, voir Configuration du réseau CDN dans le fichier wknd.vhost.

Sur cette page