Analyse des CDN-Cache-Trefferverhältnisses
Inhalte, die im CDN zwischengespeichert werden, reduzieren die Latenz, mit der Benutzende der Website konfrontiert sind, sodass sie nicht warten müssen, bis die Anfrage wieder zu Apache/Dispatcher oder zu AEM Publish gelangt. Vor diesem Hintergrund ist es sinnvoll, das CDN-Cache-Trefferverhältnis zu optimieren, um die im CDN zwischenspeicherbare Menge an Inhalten zu maximieren.
Erfahren Sie, wie Sie die von AEM as a Cloud Service bereitgestellten CDN-Protokolle analysieren und für Optimierungszwecke Erkenntnisse wie das Cache-Trefferverhältnis oder die Top-URLs der Cache-Typen MISS und PASS gewinnen.
Die CDN-Protokolle sind im JSON-Format verfügbar, das verschiedene Felder enthält, darunter url
, cache
. Weitere Informationen finden Sie unter CDN-Protokollformat. Das Feld cache
liefert Informationen über den Zustand des Cache mit den möglichen Werten „HIT“, „MISS“ oder „PASS“. Sehen wir uns die Details der möglichen Werte an.
Möglicher Wert
Für dieses Tutorial wird das AEM WKND-Projekt in der AEM as a Cloud Service-Umgebung bereitgestellt und ein kleiner Leistungstest mit Apache JMeter ausgelöst.
Dieses Tutorial ist so strukturiert, dass Sie den folgenden Prozess durchlaufen:
- Herunterladen von CDN-Protokollen über Cloud Manager
- Analyse dieser CDN-Protokolle, die mit zwei Ansätzen durchgeführt werden kann: ein lokal installiertes Dashboard oder ein Splunk oder Jupyter Notebook mit Fernzugriff (für diejenigen, die eine Adobe Experience Platform-Lizenz besitzen)
- Optimieren der CDN-Cache-Konfiguration
Herunterladen von CDN-Protokollen
Gehen Sie wie folgt vor, um die CDN-Protokolle herunterzuladen:
-
Melden Sie sich bei Cloud Manager unter my.cloudmanager.adobe.com an und wählen Sie Ihre Organisation und Ihr Programm aus.
-
Wählen Sie für eine gewünschte AEMCS-Umgebung Protokolle herunterladen aus dem Menü mit den Auslassungspunkten.
{width="500" modal="regular"}
-
Wählen Sie im Dialogfeld Protokolle herunterladen den Publish-Service aus dem Dropdown-Menü aus und klicken Sie dann neben der Zeile CDN auf das Download-Symbol.
{width="500" modal="regular"}
Wenn die heruntergeladene Protokolldatei von heute ist, lautet die Dateierweiterung .log
, bei früheren Protokolldateien lautet die Erweiterung .log.gz
.
Analysieren von heruntergeladenen CDN-Protokollen
Um Einblicke beispielsweise in das Cache-Trefferverhältnis und die Top-URLs der Cache-Typen „MISS“ und „PASS“ zu erhalten, analysieren Sie die heruntergeladene CDN-Protokolldatei. Diese Erkenntnisse helfen, die CDN-Cache-Konfiguration zu optimieren und die Leistung der Site zu verbessern.
Um die CDN-Protokolle zu analysieren, bietet dieses Tutorial drei Optionen:
- Elasticsearch, Logstash und Kibana (ELK): Die ELK-Dashboard-Tools können lokal installiert werden.
- Splunk: Die Splunk-Dashboard-Tools benötigen Zugriff auf Splunk und eine aktivierte AEMCS-Protokollweiterleitung, um die CDN-Protokolle aufzunehmen.
- Jupyter Notebook: Für Kundinnen und Kunden, die über eine Lizenz von Adobe Experience Platform verfügen, ist der Fernzugriff als Teil von Adobe Experience Platform möglich, ohne dass zusätzliche Software installiert werden muss.
Option 1: Verwenden der ELK-Dashboard-Tools
Der ELK-Stack ist eine Reihe von Tools, die eine skalierbare Lösung für die Suche, Analyse und Visualisierung von Daten bieten. Er besteht aus Elasticsearch, Logstash und Kibana.
Um die wichtigsten Details zu ermitteln, verwenden wir das Projekt AEMCS-CDN-Log-Analysis-Tooling. Dieses Projekt stellt einen Docker-Container des ELK-Stacks und ein vorkonfiguriertes Kibana-Dashboard zur Analyse der CDN-Protokolle bereit.
-
Folgen Sie den Schritten zum Einrichten des ELK-Docker-Containers und stellen Sie sicher, dass Sie das Kibana-Dashboard namens CDN Cache Hit Ratio (CDN-Cache-Trefferverhältnis) importieren.
-
Gehen Sie wie folgt vor, um das CDN-Cache-Trefferverhältnis und die Top-URLs zu identifizieren:
-
Kopieren Sie die heruntergeladenen CDN-Protokolldateien in den umgebungsspezifischen Protokollordner, z. B.
ELK/logs/stage
. -
Öffnen Sie das Dashboard CDN-Cache-Trefferverhältnis, indem Sie oben links auf das Navigationsmenü klicken und „Analyse“ > „Dashboard“ > „CDN-Cache-Trefferverhältnis“ auswählen.
{width="500" modal="regular"}
-
Wählen Sie oben rechts den gewünschten Zeitraum aus.
{width="500" modal="regular"}
-
Das Dashboard CDN-Cache-Trefferverhältnis erklärt sich von selbst.
-
Die Gesamtanfragen-Analyse zeigt die folgenden Details an:
- Cache-Verhältnisse nach Cache-Typ
- Cache-Zählungen nach Cache-Typ
{width="500" modal="regular"}
-
Die Analyse nach Anfrage- oder Mime-Typen zeigt die folgenden Details an:
- Cache-Verhältnisse nach Cache-Typ
- Cache-Zählungen nach Cache-Typ
- Die wichtigsten MISS- und PASS-URLs
{width="500" modal="regular"}
-
Filtern nach Umgebungsnamen oder Programm-ID
Gehen Sie wie folgt vor, um die erfassten Protokolle nach Umgebungsnamen zu filtern:
-
Klicken Sie im Dashboard „CDN-Cache-Trefferverhältnis“ auf das Symbol Filter hinzufügen.
{width="500" modal="regular"}
-
Wählen Sie im Modal Filter hinzufügen das Feld
aem_env_name.keyword
aus dem Dropdown-Menü und den Operatoris
sowie den gewünschten Umgebungsnamen für das nächste Feld, und klicken Sie schließlich auf Filter hinzufügen.{width="500" modal="regular"}
Filtern nach Host-Namen
Gehen Sie wie folgt vor, um die erfassten Protokolle nach Host-Namen zu filtern:
-
Klicken Sie im Dashboard „CDN-Cache-Trefferverhältnis“ auf das Symbol Filter hinzufügen.
{width="500" modal="regular"}
-
Wählen Sie im Modal Filter hinzufügen das Feld
host.keyword
aus dem Dropdown-Menü und den Operatoris
sowie den gewünschten Host-Namen für das nächste Feld, und klicken Sie schließlich auf Filter hinzufügen.{width="500" modal="regular"}
Fügen Sie entsprechend den Analyseanfragen weitere Filter zum Dashboard hinzu.
Option 2: Verwenden der ELK-Dashboard-Tools
Splunk ist ein beliebtes Tool zur Protokollanalyse, mit dem Sie Protokolle zusammenfassen und analysieren sowie Visualisierungen für die Überwachung und Fehlerbehebung erstellen können.
Um die wichtigsten Details zu ermitteln, verwenden wir das Projekt AEMCS-CDN-Log-Analysis-Tooling. Dieses Projekt bietet ein Splunk-Dashboard zur Analyse der CDN-Protokolle.
-
Folgen Sie den Schritten aus Splunk-Dashboards für AEMCS CDN Log Analysis und stellen Sie sicher, dass Sie das Splunk-Dashboard CDN-Cache-Trefferverhältnis importieren.
-
Aktualisieren Sie bei Bedarf den Index, den Quellentyp und andere Filterwerte im Splunk-Dashboard.
{width="500" modal="regular"}
Option 3: Verwenden von Jupyter Notebook
Wenn Sie keine Software lokal installieren möchten (d. h. die ELK-Dashboard-Tools aus dem vorherigen Abschnitt), haben Sie eine andere Option, für die jedoch eine Lizenz für Adobe Experience Platform erforderlich ist.
Das Jupyter Notebook ist eine Open-Source-Web-Anwendung, mit der Sie Dokumente erstellen können, die Code, Text und Visualisierungen enthalten. Sie wird für die Datenumwandlung, Visualisierung und statistische Modellierung verwendet. Der Zugriff ist als Teil von Adobe Experience Platform remote möglich.
Herunterladen der interaktiven Python Notebook-Datei
Laden Sie zunächst die Datei AEM-as-a-CloudService – CDN Logs Analysis – Jupyter Notebook herunter, die bei der Analyse der CDN-Protokolle hilfreich ist. Diese heruntergeladene interaktive Python Notebook-Datei ist zwar selbsterklärend, die wichtigsten Punkte der einzelnen Abschnitte sind jedoch hier aufgeführt:
- Install additional libraries: installiert die
termcolor
- undtabulate
-Python-Bibliotheken. - Load CDN Log File: lädt die CDN-Protokolldatei mit dem Variablenwert
log_file
. Stellen Sie sicher, dass der Wert aktualisiert wird. Außerdem wird dieses CDN-Protokoll in den Pandas DataFrame umgewandelt. - Perform Analysis: Der erste Code-Block ist Display Analysis Result for Total, HTML, JS/CSS and Image Requests. Er stellt das Cache-Trefferverhältnis in Prozent sowie in Balken- und Kreisdiagrammen dar.
Der zweite Code-Block ist Top 5 MISS and PASS Request URLs for HTML, JS/CSS, and Image. Er zeigt die URLs und ihre Anzahl in Tabellenform an.
Ausführen von Jupyter Notebook
Gehen Sie als Nächstes wie folgt vor, um Jupyter Notebook unter Adobe Experience Platform auszuführen:
-
Melden Sie sich bei Adobe Experience Cloud an und klicken Sie von der Startseite aus auf Schnellzugriff > Experience Platform
{width="500" modal="regular"}
-
Klicken Sie auf der Adobe Experience Platform-Startseite auf den Abschnitt „Datenwissenschaft“ und dann auf den Menüpunkt Notebooks. Um die Jupyter Notebooks-Umgebung zu starten, klicken Sie auf die Registerkarte JupyterLab.
{width="500" modal="regular"}
-
Laden Sie im Menü „JupyterLab“ über das Symbol Dateien hochladen die heruntergeladene CDN-Protokolldatei und die Datei
aemcs_cdn_logs_analysis.ipynb
hoch.{width="500" modal="regular"}
-
Öffnen Sie die Datei
aemcs_cdn_logs_analysis.ipynb
durch Doppelklick. -
Aktualisieren Sie im Abschnitt Load CDN Log File des Notizbuchs den Wert
log_file
.{width="500" modal="regular"}
-
Um die ausgewählte Zelle auszuführen und weiterzugehen, klicken Sie auf das Symbol Abspielen.
{width="500" modal="regular"}
-
Nach der Ausführung der Code-Zelle Display Analysis Result for Total, HTML, JS/CSS, and Image Requests zeigt die Ausgabe das prozentuale Cache-Trefferverhältnis sowie ein Balken- und Kreisdiagramm an.
{width="500" modal="regular"}
-
Nach der Ausführung der Code-Zelle Top 5 MISS and PASS Request URLs for HTML, JS/CSS, and Image zeigt die Ausgabe die wichtigsten 5 MISS- und PASS-Anfrage-URLs an.
{width="500" modal="regular"}
Sie können das Jupyter Notebook erweitern, um die CDN-Protokolle basierend auf Ihren Anforderungen zu analysieren.
Optimieren der CDN-Cache-Konfiguration
Nach der Analyse der CDN-Protokolle können Sie die CDN-Cache-Konfiguration optimieren, um die Site-Performance zu verbessern. Die Best Practice für AEM ist, ein Cache-Trefferverhältnis von 90 % oder höher zu erreichen.
Weitere Informationen finden Sie unter Optimieren der CDN-Cache-Konfiguration.
Das AEM WKND-Projekt verfügt über eine CDN-Referenzkonfiguration. Weitere Informationen finden Sie unter CDN-Konfiguration in der Datei wknd.vhost
.