Analyse du taux d’accès au cache du réseau CDN
Le contenu mis en cache sur le réseau CDN réduit la latence subie par les utilisateurs et les utilisatrices du site web, qui n’ont pas besoin d’attendre que la requête revienne vers Apache/Dispatcher ou l’instance de publication AEM. Dans ce contexte, il est utile d’optimiser le taux d’accès au cache du réseau CDN pour maximiser la quantité de contenu pouvant être mise en cache sur le réseau CDN.
Découvrez comment analyser les journaux de réseau CDN fournis par AEM as a Cloud Service et comment obtenir des informations telles que le taux d’accès au cache et les URL principales de types de cache MISS et PASS à des fins d’optimisation.
Les journaux de réseau CDN sont disponibles au format JSON, qui contient divers champs, y compris url
et cache
. Pour plus d’informations, voir Format des journaux de réseau CDN. Le champ cache
fournit des informations sur l’état du cache. Ses valeurs possibles sont HIT, MISS ou PASS. Examinons les détails des valeurs possibles.
Valeur possible
Pour les besoins de ce tutoriel, le projet AEM WKND est déployé dans l’environnement AEM as a Cloud Service et un petit test de performance est déclenché à l’aide d’Apache JMeter.
Ce tutoriel est structuré de manière à vous guider dans le processus suivant :
- Téléchargement des journaux de réseau CDN via Cloud Manager
- L’analyse de ces journaux CDN peut être effectuée avec deux méthodes : un tableau de bord installé localement ou un notebook Splunk ou Jupityer accessible à distance (pour ceux qui disposent d’une licence Adobe Experience Platform).
- Optimisation de la configuration du cache de réseau CDN
Télécharger les journaux de réseau CDN
Pour télécharger les journaux de réseau CDN, procédez comme suit :
-
Connectez-vous à Cloud Manager à l’adresse my.cloudmanager.adobe.com et sélectionnez votre organisation et votre programme.
-
Pour un environnement AEMCS souhaité, sélectionnez Télécharger les journaux dans le menu représentant des points de suspension.
{width="500" modal="regular"}
-
Dans la boîte de dialogue Télécharger les journaux, sélectionnez le service Publish dans le menu déroulant, puis cliquez sur l’icône de téléchargement en regard de la ligne CDN.
{width="500" modal="regular"}
Si le fichier journal téléchargé date d’aujourd’hui, l’extension de fichier est .log
. Sinon, pour les fichiers journaux précédents, l’extension est .log.gz
.
Analyser les journaux de réseau CDN téléchargés
Pour obtenir des informations telles que le taux d’accès au cache et les URL principales des types de cache MISS et PASS, analysez le fichier journal de réseau CDN téléchargé. Ces informations permettent d’optimiser la Configuration du cache de réseau CDN et d’améliorer les performances du site.
Pour analyser les journaux CDN, ce tutoriel présente trois options :
- Elasticsearch, Logstash et Kibana (ELK) : l’ outil de tableau de bord ELK peut être installé localement.
- Splunk : l’ outil de tableau de bord Splunk nécessite l’accès à Splunk et le transfert de journal AEMCS activé pour ingérer les journaux CDN.
- Jupyter Notebook : il est accessible à distance dans le cadre de Adobe Experience Platform sans installer de logiciel supplémentaire, pour les clients qui disposent d’une licence Adobe Experience Platform.
Option 1 : utilisation des outils de tableau de bord ELK
La pile ELK est un ensemble d’outils fournissant une solution évolutive et permettant de rechercher, d’analyser et de visualiser les données. Elle se compose d’Elasticsearch, de Logstash et de Kibana.
Pour identifier les détails clés, nous allons utiliser le projet AEMCS-CDN-Log-Analysis-Tooling. Ce projet fournit un conteneur Docker de la pile ELK et un tableau de bord Kibana préconfiguré pour analyser les journaux de réseau CDN.
-
Suivez les étapes de Configuration du conteneur ELK Docker et assurez-vous d’importer le tableau de bord Rapport d’accès au cache CDN de Kibana.
-
Pour identifier le taux d’accès au cache du réseau CDN et aux URL principales, procédez comme suit :
-
Copiez le ou les fichiers journaux CDN téléchargés dans le dossier des journaux spécifiques à l’environnement, par exemple
ELK/logs/stage
. -
Ouvrez le tableau de bord Rapport d’accès au cache CDN en cliquant sur le coin supérieur gauche Menu de navigation > Analytics > Tableau de bord > Rapport d’accès au cache CDN.
{width="500" modal="regular"}
-
Sélectionnez la période souhaitée dans le coin supérieur droit.
{width="500" modal="regular"}
-
Le tableau de bord Taux d’accès au cache du réseau CDN est explicite.
-
La section Analyse totale des requêtes affiche les détails suivants :
- Taux de cache par type de cache
- Nombre de mises en cache par type de cache
{width="500" modal="regular"}
-
L’analyse par type de requête ou MIME affiche les détails suivants :
- Taux de cache par type de cache
- Nombre de mises en cache par type de cache
- Principales URL MISS et PASS
{width="500" modal="regular"}
-
Filtrage par nom d’environnement ou identifiant de programme
Pour filtrer les journaux ingérés par nom d’environnement, procédez comme suit :
-
Dans le tableau de bord Taux d’accès au cache du réseau CDN, cliquez sur l’icône Ajouter un filtre.
{width="500" modal="regular"}
-
Dans la boîte de dialogue modale Ajouter un filtre, sélectionnez le champ
aem_env_name.keyword
dans le menu déroulant, puis l’opérateuris
et le nom de l’environnement de votre choix pour le champ suivant. Cliquez ensuite sur Ajouter un filtre.{width="500" modal="regular"}
Filtrage par nom d’hôte
Pour filtrer les journaux ingérés par nom d’hôte, procédez comme suit :
-
Dans le tableau de bord Taux d’accès au cache du réseau CDN, cliquez sur l’icône Ajouter un filtre.
{width="500" modal="regular"}
-
Dans la boîte de dialogue modale Ajouter un filtre, sélectionnez le champ
host.keyword
dans le menu déroulant, puis l’opérateuris
et le nom d’hôte souhaité pour le champ suivant. Cliquez ensuite sur Ajouter un filtre.{width="500" modal="regular"}
De même, ajoutez d’autres filtres au tableau de bord en fonction des exigences d’analyse.
Option 2 : utilisation des outils du tableau de bord Splunk
Splunk est un outil d’analyse de journaux populaire qui permet d’agréger, d’analyser les journaux et de créer des visualisations à des fins de surveillance et de dépannage.
Pour identifier les détails clés, nous allons utiliser le projet AEMCS-CDN-Log-Analysis-Tooling. Ce projet fournit un tableau de bord Splunk pour analyser les journaux CDN.
-
Suivez les étapes de Tableaux de bord Splunk pour l’analyse du journal CDN AEMCS et veillez à importer le tableau de bord Splunk Rapport d’accès au cache CDN.
-
Si nécessaire, mettez à jour les valeurs de filtre Index, Source Type et autres dans le tableau de bord Splunk.
{width="500" modal="regular"}
Option 3 : utilisation de Jupyter Notebook
Pour ceux qui préfèrent ne pas installer de logiciel localement (c’est-à-dire l’outil de tableau de bord ELK de la section précédente), il existe une autre option, mais elle nécessite une licence pour Adobe Experience Platform.
Jupyter Notebook est une application web open source qui permet de créer des documents contenant du code, du texte et des visualisations. Elle est utilisée pour la transformation, la visualisation et la modélisation statistique des données. Elle est accessible à distance dans le cadre d’Adobe Experience Platform.
Télécharger le fichier Interactive Python Notebook
Téléchargez d’abord le fichier AEM-as-a-CloudService - CDN Logs Analysis - Jupyter Notebook qui facilite l’analyse des journaux CDN. Le fichier « Interactive Python Notebook » est explicite, mais les points forts de chaque section sont les suivants :
- Installation de bibliothèques supplémentaires : installe les bibliothèques Python
termcolor
ettabulate
. - Chargement des journaux de réseau CDN : charge le fichier journal de réseau CDN à l’aide de la valeur de variable
log_file
. Veillez à mettre à jour sa valeur. Il transforme également ce journal de réseau CDN en pandas DataFrame. - Exécution de l’analyse : le premier bloc de code est Afficher le résultat de l’analyse pour les requêtes totales, HTML, JS/CSS et Image. Il fournit le pourcentage, des diagrammes à barres et des diagrammes circulaires pour le taux d’accès au cache.
Le second bloc de code est 5 principales URL de requête MISS et PASS pour HTML, JS/CSS et Image. Il affiche les URL et leur nombre au format tableau.
Exécution de Jupyter Notebook
Exécutez ensuite Jupyter Notebook dans Adobe Experience Platform, en suivant les étapes ci-dessous :
-
Connectez-vous à Adobe Experience Cloud. Sur la page d’accueil > Accès rapide > cliquez sur l’icône Experience Platform.
{width="500" modal="regular"}
-
Sur la page d’accueil d’Adobe Experience Platform > section Science des données, cliquez sur l’élément de menu Notebooks. Pour démarrer l’environnement Jupyter Notebooks, cliquez sur le bouton JupyterLab.
{width="500" modal="regular"}
-
Dans le menu JupyterLab, à l’aide de l’icône Chargement de fichiers, chargez le fichier journal de réseau CDN et le fichier
aemcs_cdn_logs_analysis.ipynb
téléchargés.{width="500" modal="regular"}
-
Ouvrez le fichier
aemcs_cdn_logs_analysis.ipynb
en double-cliquant dessus. -
Dans la section Charger le fichier journal de réseau CDN du Notebook, mettez à jour la valeur
log_file
.{width="500" modal="regular"}
-
Pour exécuter la cellule sélectionnée et avancer, cliquez sur l’icône de lecture.
{width="500" modal="regular"}
-
Après avoir exécuté la cellule de code Afficher le résultat de l’analyse pour les requêtes totales, HTML, JS/CSS et Image, le résultat affiche le pourcentage, des diagrammes à barres et des diagrammes circulaires pour le taux d’accès au cache.
{width="500" modal="regular"}
-
Après avoir exécuté la cellule de code 5 principales URL de requêtes MISS et PASS pour HTML, JS/CSS et Image, la sortie affiche les 5 principales URL de requêtes MISS et PASS.
{width="500" modal="regular"}
Vous pouvez améliorer Jupyter Notebook de sorte à analyser les journaux de réseau CDN en fonction de vos besoins.
Optimisation de la configuration du cache de réseau CDN
Après avoir analysé les journaux de réseau CDN, vous pouvez optimiser la configuration du cache de réseau CDN pour améliorer les performances du site. La bonne pratique AEM consiste à obtenir un taux d’accès au cache de 90 % ou plus.
Pour plus d’informations, voir Optimisation de la configuration du cache de réseau CDN.
Le projet AEM WKND comporte une configuration de réseau CDN de référence. Pour plus d’informations, voir Configuration du réseau CDN dans le fichier wknd.vhost
.