Analisi del rapporto di hit della cache CDN
Il contenuto memorizzato nella cache della rete CDN riduce la latenza per gli utenti del sito web che non devono attendere che la richiesta torni ad Apache/Dispatcher o che venga pubblicata l’AEM. Tenendo presente questo aspetto, vale la pena ottimizzare il rapporto di hit della cache CDN per massimizzare la quantità di contenuto memorizzabile in cache sulla CDN.
Scopri come analizzare i registri CDN forniti da AEM as a Cloud Service e ottenere informazioni quali proporzioni di hit della cache e URL principali di tipi di cache MISS e PASS, a scopo di ottimizzazione.
I registri CDN sono disponibili in formato JSON, che contiene vari campi tra cui url
, cache
. Per ulteriori informazioni, vedere Formato di registro CDN. Il campo cache
fornisce informazioni sullo stato della cache e i valori possibili sono HIT, MISS o PASS. Esaminiamo i dettagli dei valori possibili.
valore possibile
Ai fini di questa esercitazione, il progetto WKND AEM viene distribuito nell'ambiente AEM as a Cloud Service e viene attivato un piccolo test delle prestazioni utilizzando Apache JMeter.
Questo tutorial è strutturato in modo da illustrare il processo seguente:
- Download dei registri CDN tramite Cloud Manager
- L’analisi di questi registri CDN può essere eseguita con due approcci: un dashboard installato localmente o un notebook Splunk o Jupityer accessibile in remoto (per chi ha una licenza di Adobe Experience Platform)
- Ottimizzazione della configurazione della cache CDN
Scarica registri CDN
Per scaricare i registri CDN, effettua le seguenti operazioni:
-
Accedi a Cloud Manager all'indirizzo my.cloudmanager.adobe.com e seleziona l'organizzazione e il programma.
-
Per un ambiente AEMCS desiderato, seleziona Scarica registri dal menu con i puntini di sospensione.
{width="500" modal="regular"}
-
Nella finestra di dialogo Scarica registri, seleziona il servizio Publish dal menu a discesa, quindi fai clic sull'icona di download accanto alla riga CDN.
{width="500" modal="regular"}
Se il file di registro scaricato è di today, l'estensione del file è .log
. In caso contrario, per i file di registro passati l'estensione è .log.gz
.
Analizzare i registri CDN scaricati
Per ottenere informazioni approfondite, ad esempio il rapporto hit della cache e i principali URL dei tipi di cache di tipo MISS e PASS, analizza il file di registro CDN scaricato. Queste informazioni consentono di ottimizzare la configurazione della cache CDN e migliorare le prestazioni del sito.
Per analizzare i registri CDN, questa esercitazione presenta tre opzioni:
- Elasticsearch, Logstash e Kibana (ELK): è possibile installare localmente gli strumenti del dashboard ELK.
- Splunk: Gli strumenti del dashboard Splunk richiedono l'accesso a Splunk e l'inoltro dei registri AEMCS è abilitato per acquisire i registri CDN.
- Jupyter Notebook: è possibile accedervi in remoto come parte di Adobe Experience Platform senza installare software aggiuntivo, per i clienti che hanno concesso in licenza Adobe Experience Platform.
Opzione 1: utilizzo degli strumenti del dashboard ELK
Lo stack ELK è un insieme di strumenti che forniscono una soluzione scalabile per la ricerca, l'analisi e la visualizzazione dei dati. È costituito da Elasticsearch, Logstash e Kibana.
Per identificare i dettagli chiave, utilizziamo il progetto AEMCS-CDN-Log-Analysis-Tooling. Questo progetto fornisce un contenitore Docker dello stack ELK e un dashboard Kibana preconfigurato per analizzare i registri CDN.
-
Segui i passaggi da Impostare il contenitore Docker ELK e assicurati di importare il dashboard Kibana Rapporto riscontri cache CDN.
-
Per identificare la percentuale di riscontri nella cache CDN e i primi URL, effettua le seguenti operazioni:
-
Copiare i file di registro CDN scaricati all'interno della cartella dei registri specifica dell'ambiente, ad esempio
ELK/logs/stage
. -
Apri il dashboard Rapporto hit cache CDN facendo clic sull'angolo in alto a sinistra Menu di navigazione > Analytics > Dashboard > Rapporto hit cache CDN.
{width="500" modal="regular"}
-
Seleziona l’intervallo di tempo desiderato dall’angolo in alto a destra.
{width="500" modal="regular"}
-
Il dashboard Rapporto riscontri cache CDN è auto-esplicativo.
-
Nella sezione Analisi totale richieste sono visualizzati i dettagli seguenti:
- Rapporti cache per tipo di cache
- Conteggi cache per tipo di cache
{width="500" modal="regular"}
-
L'Analisi per richiesta o tipi MIME visualizza i dettagli seguenti:
- Rapporti cache per tipo di cache
- Conteggi cache per tipo di cache
- Primi URL mancanti e passati
{width="500" modal="regular"}
-
Filtraggio per nome di ambiente o ID programma
Per filtrare i registri acquisiti per nome dell’ambiente, segui i passaggi seguenti:
-
Nel dashboard Rapporto riscontri cache CDN, fai clic sull'icona Aggiungi filtro.
{width="500" modal="regular"}
-
Nel modale Aggiungi filtro, seleziona il campo
aem_env_name.keyword
dal menu a discesa, quindi l'operatoreis
e il nome dell'ambiente desiderato per il campo successivo e infine fai clic su Aggiungi filtro.{width="500" modal="regular"}
Filtraggio per nome host
Per filtrare i registri acquisiti per nome host, segui i passaggi seguenti:
-
Nel dashboard Rapporto riscontri cache CDN, fai clic sull'icona Aggiungi filtro.
{width="500" modal="regular"}
-
Nel modale Aggiungi filtro, seleziona il campo
host.keyword
dal menu a discesa, quindi l'operatoreis
e il nome host desiderati per il campo successivo e infine fai clic su Aggiungi filtro.{width="500" modal="regular"}
Allo stesso modo, aggiungi altri filtri al dashboard in base ai requisiti di analisi.
Opzione 2: utilizzo degli strumenti del dashboard Splunk
Splunk è un popolare strumento di analisi dei registri che consente di aggregare, analizzare i registri e creare visualizzazioni a scopo di monitoraggio e risoluzione dei problemi.
Per identificare i dettagli chiave, utilizziamo il progetto AEMCS-CDN-Log-Analysis-Tooling. Questo progetto fornisce un dashboard Splunk per analizzare i registri CDN.
-
Segui i passaggi da Dashboard Splunk per l'analisi del registro CDN di AEMCS e assicurati di importare il dashboard Splunk con Proporzioni hit cache CDN.
-
Se necessario, aggiornare i valori del filtro Index, Source Type e altri nel dashboard Splunk.
{width="500" modal="regular"}
Opzione 3: utilizzo di Jupyter Notebook
Per coloro che preferiscono non installare il software localmente (ovvero, gli strumenti del dashboard ELK della sezione precedente), esiste un'altra opzione, ma richiede una licenza per Adobe Experience Platform.
Jupyter Notebook è un'applicazione Web open source che consente di creare documenti contenenti codice, testo e visualizzazione. Viene utilizzato per la trasformazione dei dati, la visualizzazione e la modellazione statistica. È possibile accedervi in remoto come parte di Adobe Experience Platform.
Download del file del blocco appunti Python interattivo
Scarica innanzitutto il file AEM-as-a-CloudService - Analisi dei registri CDN - Jupyter Notebook, utile per l'analisi dei registri CDN. Questo file "Interactive Python Notebook" è auto-esplicativo, tuttavia, gli elementi di rilievo di ogni sezione sono:
- Installa librerie aggiuntive: installa le librerie Python
termcolor
etabulate
. - Carica registri CDN: carica il file di registro CDN utilizzando il valore della variabile
log_file
. Assicurarsi di aggiornarne il valore. Trasforma inoltre questo registro CDN in DataFrame Pandas. - Esegui analisi: il primo blocco di codice è Visualizza risultati analisi per richieste totali, HTML, JS/CSS e immagini. Fornisce i grafici percentuale hit nella cache, a barre e a torta.
Il secondo blocco di codice è Primi 5 URL di richiesta non recapitati e passati per HTML, JS/CSS e Image. Vengono visualizzati gli URL e i relativi conteggi in formato tabella.
Esecuzione del blocco appunti Jupyter
Quindi, esegui Jupyter Notebook in Adobe Experience Platform, seguendo questi passaggi:
-
Accedi a Adobe Experience Cloud, nella home page > sezione Accesso rapido > fai clic sull'Experience Platform
{width="500" modal="regular"}
-
Nella home page di Adobe Experience Platform > sezione Data Science >, fai clic sulla voce di menu Notebooks. Per avviare l'ambiente Jupyter Notebooks, fare clic sulla scheda JupyterLab.
{width="500" modal="regular"}
-
Nel menu JupyterLab, utilizzando l'icona Carica file, caricare il file di registro CDN scaricato e il file
aemcs_cdn_logs_analysis.ipynb
.{width="500" modal="regular"}
-
Aprire il file
aemcs_cdn_logs_analysis.ipynb
facendo doppio clic. -
Nella sezione Load CDN Log File del blocco appunti, aggiornare il valore
log_file
.{width="500" modal="regular"}
-
Per eseguire la cella selezionata e avanzare, fare clic sull'icona Riproduci.
{width="500" modal="regular"}
-
Dopo aver eseguito la cella di codice Visualizza risultati analisi per totali, HTML, JS/CSS e richieste di immagini, l'output visualizza i grafici percentuale di hit della cache, a barre e a torta.
{width="500" modal="regular"}
-
Dopo aver eseguito i Primi 5 URL di richieste MISS e PASS per la cella di codice HTML, JS/CSS e Image, nell'output vengono visualizzati i primi 5 URL di richieste MISS e PASS.
{width="500" modal="regular"}
Puoi migliorare Jupyter Notebook per analizzare i registri CDN in base alle tue esigenze.
Ottimizzazione della configurazione della cache CDN
Dopo aver analizzato i registri CDN, puoi ottimizzare la configurazione della cache CDN per migliorare le prestazioni del sito. La best practice per l’AEM prevede un rapporto di hit della cache pari o superiore al 90%.
Per ulteriori informazioni, vedere Ottimizzare la configurazione della cache CDN.
Il progetto WKND AEM dispone di una configurazione CDN di riferimento. Per ulteriori informazioni, vedere Configurazione CDN dal file wknd.vhost
.