Análise da taxa de acertos do cache do CDN
O conteúdo armazenado em cache na CDN reduz a latência experimentada pelos usuários do site, que não precisam aguardar a solicitação para retornar à publicação do Apache/Dispatcher ou do AEM. Com isso em mente, vale a pena otimizar a taxa de ocorrência do cache do CDN para maximizar a quantidade de conteúdo armazenável em cache no CDN.
Saiba como analisar os logs de CDN fornecidos pela AEM as a Cloud Service e obter insights, como taxa de acertos de cache e principais URLs de MISS e PASS tipos de cache, para fins de otimização.
Os logs CDN estão disponíveis no formato JSON, que contém vários campos, incluindo url
, cache
. Para obter mais informações, consulte o Formato de Log da CDN. O campo cache
fornece informações sobre o estado do cache e seus valores possíveis são HIT, MISS ou PASS. Vamos analisar os detalhes de valores possíveis.
Valor Possível
Para fins deste tutorial, o projeto WKND de AEM é implantado no ambiente do AEM as a Cloud Service e um pequeno teste de desempenho é acionado usando o Apache JMeter.
Este tutorial está estruturado para orientá-lo pelo seguinte processo:
- Download de logs CDN por meio do Cloud Manager
- A análise desses logs de CDN pode ser executada com duas abordagens: um painel instalado localmente ou um Splunk ou Jupityer Notebook acessado remotamente (para aqueles que licenciam o Adobe Experience Platform)
- Otimização da configuração do cache da CDN
Baixar logs CDN
Para baixar os logs de CDN, siga estas etapas:
-
Faça logon no Cloud Manager em my.cloudmanager.adobe.com e selecione sua organização e programa.
-
Para um ambiente AEMCS desejado, selecione Baixar logs no menu de reticências.
{width="500" modal="regular"}
-
Na caixa de diálogo Baixar Logs, selecione o Serviço Publish no menu suspenso e clique no ícone de download ao lado da linha CDN.
{width="500" modal="regular"}
Se o arquivo de log baixado for de hoje, a extensão de arquivo será .log
; caso contrário, para arquivos de log anteriores, a extensão será .log.gz
.
Analisar logs de CDN baixados
Para obter insights, como a taxa de acertos do cache e os principais URLs dos tipos de cache MISS e PASS, analise o arquivo de log de CDN baixado. Esses insights ajudam a otimizar a configuração de cache da CDN e aprimorar o desempenho do site.
Para analisar os logs de CDN, este tutorial apresenta três opções:
- Elasticsearch, Logstash e Kibana (ELK): a ferramenta do painel ELK pode ser instalada localmente.
- Splunk: a ferramenta do painel Splunk requer acesso ao Splunk e ao encaminhamento de logs do AEMCS habilitado para assimilar os logs de CDN.
- Jupyter Notebook: ele pode ser acessado remotamente como parte do Adobe Experience Platform sem instalar software adicional para clientes que possuem Adobe Experience Platform licenciado.
Opção 1: usar ferramentas de painel ELK
A pilha de ELK é um conjunto de ferramentas que fornecem uma solução escalável para pesquisar, analisar e visualizar os dados. Consiste em Elasticsearch, Logstash e Kibana.
Para identificar os detalhes principais, vamos usar o projeto AEMCS-CDN-Log-Analysis-Tooling. Este projeto fornece um contêiner Docker da pilha ELK e um painel Kibana pré-configurado para analisar os logs CDN.
-
Siga as etapas de Como configurar o contêiner ELK Docker e certifique-se de importar o painel Kibana da Taxa de Acertos do Cache do CDN.
-
Para identificar a taxa de acertos do cache do CDN e os URLs principais, siga estas etapas:
-
Copie o(s) arquivo(s) de log de CDN baixado(s) dentro da pasta de logs específicos do ambiente, por exemplo,
ELK/logs/stage
. -
Abra o painel Taxa de Acertos do Cache do CDN clicando no canto superior esquerdo Menu de Navegação > Analytics > Painel > Taxa de Acertos do Cache do CDN.
{width="500" modal="regular"}
-
Selecione o intervalo de tempo desejado no canto superior direito.
{width="500" modal="regular"}
-
O painel Taxa de Acertos do Cache do CDN é autoexplicativo.
-
A seção Análise de Solicitação Total exibe os seguintes detalhes:
- Taxas de cache por tipo de cache
- Contagens de cache por tipo de cache
{width="500" modal="regular"}
-
A Análise por Solicitação ou Tipos MIME exibe os seguintes detalhes:
- Taxas de cache por tipo de cache
- Contagens de cache por tipo de cache
- Principais URLs MISS e PASS
{width="500" modal="regular"}
-
Filtrar por nome de ambiente ou ID de programa
Para filtrar os logs assimilados por nome de ambiente, siga as etapas abaixo:
-
No painel Taxa de Acertos do Cache CDN, clique no ícone Adicionar Filtro.
{width="500" modal="regular"}
-
Na modal Adicionar filtro, selecione o campo
aem_env_name.keyword
no menu suspenso e o operadoris
e o nome de ambiente desejado para o próximo campo e, por fim, clique em Adicionar filtro.{width="500" modal="regular"}
Filtrar por nome de host
Para filtrar os logs assimilados por nome de host, siga as etapas abaixo:
-
No painel Taxa de Acertos do Cache CDN, clique no ícone Adicionar Filtro.
{width="500" modal="regular"}
-
No modal Adicionar filtro, selecione o campo
host.keyword
no menu suspenso e o operadoris
e o nome de host desejado para o próximo campo e, por fim, clique em Adicionar filtro.{width="500" modal="regular"}
Da mesma forma, adicione mais filtros ao painel com base nos requisitos de análise.
Opção 2: usar a ferramenta Painel do Splunk
O Splunk é uma ferramenta de análise de log popular que ajuda a agregar, analisar logs e criar visualizações para fins de monitoramento e solução de problemas.
Para identificar os detalhes principais, vamos usar o projeto AEMCS-CDN-Log-Analysis-Tooling. Este projeto fornece um painel do Splunk para analisar os logs do CDN.
-
Siga as etapas dos painéis do Splunk para a Análise de Log da CDN do AEMCS e importe o painel Taxa de Acertos do Cache do CDN.
-
Se necessário, atualize o Índice , o Tipo de Source e outros valores de filtro no painel do Splunk.
{width="500" modal="regular"}
Opção 3: usar o Jupyter Notebook
Para aqueles que preferem não instalar o software localmente (ou seja, a ferramenta do painel ELK da seção anterior), há outra opção, mas ela requer uma licença para a Adobe Experience Platform.
O Jupyter Notebook é um aplicativo web de código aberto que permite criar documentos que contêm código, texto e visualização. Ele é usado para transformação de dados, visualização e modelagem estatística. Ele pode ser acessado remotamente como parte do Adobe Experience Platform.
Baixando o arquivo de Bloco de Anotações Python Interativo
Primeiro, baixe o arquivo AEM-as-a-CloudService - CDN Logs Analysis - Jupyter Notebook, que ajudará na análise de logs CDN. Esse arquivo "Interative Python Notebook" é autoexplicativo, no entanto, os principais destaques de cada seção são:
- Instalar bibliotecas adicionais: instala as bibliotecas Python
termcolor
etabulate
. - Carregar logs CDN: carrega o arquivo de log CDN usando o valor de variável
log_file
. Atualize seu valor. Ele também transforma este log de CDN no DataFrame Pandas. - Executar análise: o primeiro bloco de código é Exibir Resultado da Análise para Total, HTML, JS/CSS e Solicitações de Imagem; ele fornece gráficos de porcentagem de taxa de acertos de cache, de barras e de pizza.
O segundo bloco de código é Top 5 URLs de Solicitação MISS e PASS para HTML, JS/CSS e Image; ele exibe URLs e suas contagens em formato de tabela.
Execução do Jupyter Notebook
Em seguida, execute o Jupyter Notebook no Adobe Experience Platform, seguindo estas etapas:
-
Faça logon no Adobe Experience Cloud, na página inicial > seção Acesso rápido > clique no Experience Platform
{width="500" modal="regular"}
-
Na página inicial do Adobe Experience Platform > seção Data Science >, clique no item de menu Blocos de anotações. Para iniciar o ambiente do Jupyter Notebooks, clique na guia JupyterLab.
{width="500" modal="regular"}
-
No menu do JupyterLab, usando o ícone Carregar Arquivos, carregue o arquivo de log CDN baixado e o arquivo
aemcs_cdn_logs_analysis.ipynb
.{width="500" modal="regular"}
-
Abra o arquivo
aemcs_cdn_logs_analysis.ipynb
clicando duas vezes. -
Na seção Carregar Arquivo de Log da CDN do bloco de anotações, atualize o valor
log_file
.{width="500" modal="regular"}
-
Para executar a célula selecionada e avançar, clique no ícone Reproduzir.
{width="500" modal="regular"}
-
Após executar a célula de código Exibir Resultado da Análise para Total, HTML, JS/CSS e Solicitações de Imagem, a saída exibe os gráficos de porcentagem de taxa de acertos do cache, barra e pizza.
{width="500" modal="regular"}
-
Depois de executar os Top 5 URLs de solicitação de MISS e PASS para a célula de código HTML, JS/CSS e Image, a saída exibe os 5 principais URLs de solicitação de MISS e PASS.
{width="500" modal="regular"}
Você pode aprimorar o Jupyter Notebook para analisar os logs de CDN com base em seus requisitos.
Otimização da configuração do cache da CDN
Depois de analisar os logs de CDN, você pode otimizar a configuração do cache de CDN para melhorar o desempenho do site. A prática recomendada do AEM é ter uma taxa de acerto de cache de 90% ou mais.
Para obter mais informações, consulte Otimizar a configuração do cache da CDN.
O projeto WKND AEM tem uma configuração de CDN de referência. Para obter mais informações, consulte Configuração de CDN do arquivo wknd.vhost
.