Análise da taxa de acertos do cache do CDN

O conteúdo armazenado em cache na CDN reduz a latência experimentada pelos usuários do site, que não precisam aguardar a solicitação para retornar à publicação do Apache/Dispatcher ou do AEM. Com isso em mente, vale a pena otimizar a taxa de ocorrência do cache do CDN para maximizar a quantidade de conteúdo armazenável em cache no CDN.

Saiba como analisar os logs de CDN fornecidos pela AEM as a Cloud Service e obter insights, como taxa de acertos de cache e principais URLs de MISS e PASS tipos de cache, para fins de otimização.

Os logs CDN estão disponíveis no formato JSON, que contém vários campos, incluindo url, cache. Para obter mais informações, consulte o Formato de Log da CDN. O campo cache fornece informações sobre o estado do cache e seus valores possíveis são HIT, MISS ou PASS. Vamos analisar os detalhes de valores possíveis.

Estado de Cache
Valor Possível
Descrição
HIT
Os dados solicitados são encontrados no cache da CDN e não requerem uma solicitação de busca para o servidor AEM.
SENHORITA
Os dados solicitados são não encontrados no cache CDN e devem ser solicitados do servidor AEM.
PASS
Os dados solicitados são explicitamente definidos para não serem armazenados em cache e sempre serem recuperados do servidor AEM.

Para fins deste tutorial, o projeto WKND de AEM é implantado no ambiente do AEM as a Cloud Service e um pequeno teste de desempenho é acionado usando o Apache JMeter.

Este tutorial está estruturado para orientá-lo pelo seguinte processo:

  1. Download de logs CDN por meio do Cloud Manager
  2. A análise desses logs de CDN pode ser executada com duas abordagens: um painel instalado localmente ou um Splunk ou Jupityer Notebook acessado remotamente (para aqueles que licenciam o Adobe Experience Platform)
  3. Otimização da configuração do cache da CDN

Baixar logs CDN

Para baixar os logs de CDN, siga estas etapas:

  1. Faça logon no Cloud Manager em my.cloudmanager.adobe.com e selecione sua organização e programa.

  2. Para um ambiente AEMCS desejado, selecione Baixar logs no menu de reticências.

    Baixar Logs - Cloud Manager {width="500" modal="regular"}

  3. Na caixa de diálogo Baixar Logs, selecione o Serviço Publish no menu suspenso e clique no ícone de download ao lado da linha CDN.

    Logs da CDN - Cloud Manager {width="500" modal="regular"}

Se o arquivo de log baixado for de hoje, a extensão de arquivo será .log; caso contrário, para arquivos de log anteriores, a extensão será .log.gz.

Analisar logs de CDN baixados

Para obter insights, como a taxa de acertos do cache e os principais URLs dos tipos de cache MISS e PASS, analise o arquivo de log de CDN baixado. Esses insights ajudam a otimizar a configuração de cache da CDN e aprimorar o desempenho do site.

Para analisar os logs de CDN, este tutorial apresenta três opções:

  1. Elasticsearch, Logstash e Kibana (ELK): a ferramenta do painel ELK pode ser instalada localmente.
  2. Splunk: a ferramenta do painel Splunk requer acesso ao Splunk e ao encaminhamento de logs do AEMCS habilitado para assimilar os logs de CDN.
  3. Jupyter Notebook: ele pode ser acessado remotamente como parte do Adobe Experience Platform sem instalar software adicional para clientes que possuem Adobe Experience Platform licenciado.

Opção 1: usar ferramentas de painel ELK

A pilha de ELK é um conjunto de ferramentas que fornecem uma solução escalável para pesquisar, analisar e visualizar os dados. Consiste em Elasticsearch, Logstash e Kibana.

Para identificar os detalhes principais, vamos usar o projeto AEMCS-CDN-Log-Analysis-Tooling. Este projeto fornece um contêiner Docker da pilha ELK e um painel Kibana pré-configurado para analisar os logs CDN.

  1. Siga as etapas de Como configurar o contêiner ELK Docker e certifique-se de importar o painel Kibana da Taxa de Acertos do Cache do CDN.

  2. Para identificar a taxa de acertos do cache do CDN e os URLs principais, siga estas etapas:

    1. Copie o(s) arquivo(s) de log de CDN baixado(s) dentro da pasta de logs específicos do ambiente, por exemplo, ELK/logs/stage.

    2. Abra o painel Taxa de Acertos do Cache do CDN clicando no canto superior esquerdo Menu de Navegação > Analytics > Painel > Taxa de Acertos do Cache do CDN.

      Taxa de acertos do cache do CDN - Painel Kibana {width="500" modal="regular"}

    3. Selecione o intervalo de tempo desejado no canto superior direito.

      Intervalo de tempo - Painel Kibana {width="500" modal="regular"}

    4. O painel Taxa de Acertos do Cache do CDN é autoexplicativo.

    5. A seção Análise de Solicitação Total exibe os seguintes detalhes:

      • Taxas de cache por tipo de cache
      • Contagens de cache por tipo de cache

      Análise de Solicitação Total - Painel Kibana {width="500" modal="regular"}

    6. A Análise por Solicitação ou Tipos MIME exibe os seguintes detalhes:

      • Taxas de cache por tipo de cache
      • Contagens de cache por tipo de cache
      • Principais URLs MISS e PASS

      Análise por Solicitação ou Tipos Mime - Painel Kibana {width="500" modal="regular"}

Filtrar por nome de ambiente ou ID de programa

Para filtrar os logs assimilados por nome de ambiente, siga as etapas abaixo:

  1. No painel Taxa de Acertos do Cache CDN, clique no ícone Adicionar Filtro.

    Filtro - Painel Kibana {width="500" modal="regular"}

  2. Na modal Adicionar filtro, selecione o campo aem_env_name.keyword no menu suspenso e o operador is e o nome de ambiente desejado para o próximo campo e, por fim, clique em Adicionar filtro.

    Adicionar filtro - Painel Kibana {width="500" modal="regular"}

Filtrar por nome de host

Para filtrar os logs assimilados por nome de host, siga as etapas abaixo:

  1. No painel Taxa de Acertos do Cache CDN, clique no ícone Adicionar Filtro.

    Filtro - Painel Kibana {width="500" modal="regular"}

  2. No modal Adicionar filtro, selecione o campo host.keyword no menu suspenso e o operador is e o nome de host desejado para o próximo campo e, por fim, clique em Adicionar filtro.

    Filtro de Host - Painel do Kibana {width="500" modal="regular"}

Da mesma forma, adicione mais filtros ao painel com base nos requisitos de análise.

Opção 2: usar a ferramenta Painel do Splunk

O Splunk é uma ferramenta de análise de log popular que ajuda a agregar, analisar logs e criar visualizações para fins de monitoramento e solução de problemas.

Para identificar os detalhes principais, vamos usar o projeto AEMCS-CDN-Log-Analysis-Tooling. Este projeto fornece um painel do Splunk para analisar os logs do CDN.

  1. Siga as etapas dos painéis do Splunk para a Análise de Log da CDN do AEMCS e importe o painel Taxa de Acertos do Cache do CDN.

  2. Se necessário, atualize o Índice , o Tipo de Source e outros valores de filtro no painel do Splunk.

    Painel do Splunk {width="500" modal="regular"}

NOTE
A interface e os gráficos no painel do splunk diferem do painel ELK, no entanto, os detalhes principais são semelhantes.

Opção 3: usar o Jupyter Notebook

Para aqueles que preferem não instalar o software localmente (ou seja, a ferramenta do painel ELK da seção anterior), há outra opção, mas ela requer uma licença para a Adobe Experience Platform.

O Jupyter Notebook é um aplicativo web de código aberto que permite criar documentos que contêm código, texto e visualização. Ele é usado para transformação de dados, visualização e modelagem estatística. Ele pode ser acessado remotamente como parte do Adobe Experience Platform.

Baixando o arquivo de Bloco de Anotações Python Interativo

Primeiro, baixe o arquivo AEM-as-a-CloudService - CDN Logs Analysis - Jupyter Notebook, que ajudará na análise de logs CDN. Esse arquivo "Interative Python Notebook" é autoexplicativo, no entanto, os principais destaques de cada seção são:

  • Instalar bibliotecas adicionais: instala as bibliotecas Python termcolor e tabulate.
  • Carregar logs CDN: carrega o arquivo de log CDN usando o valor de variável log_file. Atualize seu valor. Ele também transforma este log de CDN no DataFrame Pandas.
  • Executar análise: o primeiro bloco de código é Exibir Resultado da Análise para Total, HTML, JS/CSS e Solicitações de Imagem; ele fornece gráficos de porcentagem de taxa de acertos de cache, de barras e de pizza.
    O segundo bloco de código é Top 5 URLs de Solicitação MISS e PASS para HTML, JS/CSS e Image; ele exibe URLs e suas contagens em formato de tabela.

Execução do Jupyter Notebook

Em seguida, execute o Jupyter Notebook no Adobe Experience Platform, seguindo estas etapas:

  1. Faça logon no Adobe Experience Cloud, na página inicial > seção Acesso rápido > clique no Experience Platform

    Experience Platform {width="500" modal="regular"}

  2. Na página inicial do Adobe Experience Platform > seção Data Science >, clique no item de menu Blocos de anotações. Para iniciar o ambiente do Jupyter Notebooks, clique na guia JupyterLab.

    Atualização de Valor do Arquivo de Log do Bloco de Anotações {width="500" modal="regular"}

  3. No menu do JupyterLab, usando o ícone Carregar Arquivos, carregue o arquivo de log CDN baixado e o arquivo aemcs_cdn_logs_analysis.ipynb.

    Carregar arquivos - JupyteLab {width="500" modal="regular"}

  4. Abra o arquivo aemcs_cdn_logs_analysis.ipynb clicando duas vezes.

  5. Na seção Carregar Arquivo de Log da CDN do bloco de anotações, atualize o valor log_file.

    Atualização de Valor do Arquivo de Log do Bloco de Anotações {width="500" modal="regular"}

  6. Para executar a célula selecionada e avançar, clique no ícone Reproduzir.

    Atualização de Valor do Arquivo de Log do Bloco de Anotações {width="500" modal="regular"}

  7. Após executar a célula de código Exibir Resultado da Análise para Total, HTML, JS/CSS e Solicitações de Imagem, a saída exibe os gráficos de porcentagem de taxa de acertos do cache, barra e pizza.

    Atualização de Valor do Arquivo de Log do Bloco de Anotações {width="500" modal="regular"}

  8. Depois de executar os Top 5 URLs de solicitação de MISS e PASS para a célula de código HTML, JS/CSS e Image, a saída exibe os 5 principais URLs de solicitação de MISS e PASS.

    Atualização de Valor do Arquivo de Log do Bloco de Anotações {width="500" modal="regular"}

Você pode aprimorar o Jupyter Notebook para analisar os logs de CDN com base em seus requisitos.

Otimização da configuração do cache da CDN

Depois de analisar os logs de CDN, você pode otimizar a configuração do cache de CDN para melhorar o desempenho do site. A prática recomendada do AEM é ter uma taxa de acerto de cache de 90% ou mais.

Para obter mais informações, consulte Otimizar a configuração do cache da CDN.

O projeto WKND AEM tem uma configuração de CDN de referência. Para obter mais informações, consulte Configuração de CDN do arquivo wknd.vhost.

recommendation-more-help
4859a77c-7971-4ac9-8f5c-4260823c6f69