Entender as solicitações de conteúdo do Cloud Service
Introdução introduction
As solicitações de conteúdo incluem solicitações enviadas ao AEM Sites. Essas solicitações podem ser roteadas por meio do Edge Delivery Services ou de sistemas de cache fornecidos pelo cliente, como uma Rede de entrega de conteúdo (CDN). Essas solicitações fornecem dados estruturados no formato HTML ou JSON e oferecem suporte a exibições de página (por exemplo, páginas e Fragmentos de experiência) ou retornos JSON por meio de APIs de forma headless.
O sistema conta as solicitações de conteúdo quando um usuário visualiza uma página usando o HTML ou JSON. Ele mede a solicitação no ponto em que o primeiro sistema de cache a recebe. Certas solicitações HTTP são incluídas ou excluídas para fins de contagem de solicitações de conteúdo. Veja a lista completa de HTTP solicitações de conteúdo incluídas e solicitações de conteúdo excluídas.
Sobre solicitações de conteúdo do Cloud Service understanding-cloud-service-content-requests
Uma solicitação de página refere-se a uma solicitação HTTP que recupera o conteúdo estruturado principal (por exemplo, HTML ou JSON) necessário para renderizar a experiência da página principal. Ela não inclui solicitações de ativos, como imagens ou scripts.
Para clientes que usam o CDN pronto para uso, o AEM as a Cloud Service conta as solicitações de conteúdo conforme medido no nível do servidor. Essa medição ocorre automaticamente e não depende do rastreamento de análises do cliente.
O AEM (Adobe Experience Manager) as a Cloud Service identifica solicitações de conteúdo com base nos tipos de resposta gerados pela instância do AEM e recebidas na CDN. Especificamente, as solicitações que retornam HTML (text/html) ou JSON (application/json) são contadas. Esses formatos normalmente fornecem conteúdo principal da página para renderização tradicional do site ou entrega headless.
As solicitações de ativos estáticos, como arquivos JavaScript, folhas de estilos CSS e imagens, não são contadas como solicitações de conteúdo.
As solicitações de conteúdo são medidas independentemente de a resposta ter sido fornecida pelo cache do CDN ou encaminhada para o ambiente de origem do AEM.
Variações de solicitações de conteúdo do Cloud Service content-requests-variances
As solicitações de conteúdo podem ter variações nas ferramentas de relatório de análise de uma organização, conforme resumido na tabela a seguir. Em geral, evite usar ferramentas de análise que dependam de instrumentação do lado do cliente para relatar o número de solicitações de conteúdo para um site. Essas ferramentas geralmente perdem uma grande parte do tráfego porque dependem do consentimento do usuário para serem ativadas. As ferramentas do Analytics que reúnem dados do lado do servidor em arquivos de log ou relatórios CDN para clientes que adicionam seu próprio CDN sobre o AEM as a Cloud Service fornecem contagens melhores.
Consulte o Painel de Licenças para obter informações sobre como visualizar e rastrear o uso de solicitações de conteúdo em relação aos limites da sua licença.
Regras de coleção do lado do servidor serverside-collection
O AEM as a Cloud Service aplica regras de coleção do lado do servidor para contar solicitações de conteúdo. Essas regras excluem bots conhecidos (como rastreadores de mecanismo de pesquisa) e um conjunto de serviços de monitoramento que fazem ping regular no site. Outro tráfego do tipo sintético ou de monitoramento que não esteja nessa lista de exclusão é contado como solicitações de conteúdo faturável.
As tabelas a seguir listam os tipos de solicitações de conteúdo incluídas e excluídas, com breves descrições de cada uma.
Tipos de solicitações de conteúdo incluídas included-content-requests
Código HTTP 206: essas solicitações fornecem apenas uma parte do conteúdo completo. Por exemplo, um vídeo ou uma imagem grande. As solicitações de conteúdo parcial são incluídas quando entregam parte de uma resposta HTML ou JSON usada na renderização do conteúdo da página.
· Amazon CloudFront
· Apache Http Client
· Axios
· Azureus
· Curl
· Busca de Nó GitHub
· Guzzle
· Go-http-client
· Headless Chrome
· Java™ Client
· Jersey
· Node Oembed
· okhttp
· Solicitações Python
· Reator Netty
· Wget
· WinHTTP
· HTTP
· Busca de Nó GitHub
· Netty de Reator
Consulte Tipos de solicitações de conteúdo excluídas.
Os exemplos incluem o seguinte:
·
Amazon-Route53-Health-Check-Service· EyeMonIT_bot_version_0.1_(https://eyemonit.com/)
· Investis-Site24x7
· Mozilla/5.0+(compatível; UptimeRobot/2.0; https://uptimerobot.com/)
· ThousandEyes-Dragonfly-x1
· OmtrBot/1.0
· WebMon/2.0.0
<link rel="prefetch"> solicitações<link rel="prefetch">), o sistema conta essas solicitações do lado do servidor. Observe que essa abordagem pode aumentar o tráfego, dependendo de quantas dessas páginas são buscadas previamente.Consulte também Painel de licenças.
Tipos de solicitações de conteúdo excluídas excluded-content-request
/libs/*/system/probes/healthExemplos:
· AddSearchBot
· AhrefsBot
· Applebot
· Ask Jeeves Corporate Spider
· Bingbot
· BingPreview
· BLEXBot
· BuiltWith
· Bytespider
· CrawlerKengo
· Facebookexternalhit
· Google AdsBot Google
· AdsBot Mobile
· Googlebot
· Googlebot Mobile
· lmspider
· LucidWorks
·
MJ12bot· SemrushBot
· SiteImprove
· StashBot
· StatusCake
· YandexBot
· ContentKing
· Claudebot
/api/graphql — para evitar dupla contagem, elas não são faturáveis para o Cloud Service.manifest.json/etc.clientlibs/*/manifest.jsonfavicon.ico/content/experience-fragments/...) de páginas hospedadas no mesmo domínio (conforme identificado pelo cabeçalho Referenciador correspondente ao host da solicitação).Exemplo: uma página inicial em
aem.customer.com que obtém um XF para um banner ou cartão do mesmo domínio.· A URL corresponde a /content/experience-fragments/…
· O domínio referenciador corresponde a
request_x_forwarded_hostObservação: Se o caminho do Fragmento de Experiência for personalizado (por exemplo, usando
/XFrags/... ou qualquer caminho fora de /content/experience-fragments/), a solicitação não será excluída e poderá ser contada, mesmo que seja do mesmo domínio. Recomendamos usar a estrutura de caminho XF padrão do Adobe para garantir que a lógica de exclusão se aplique corretamente.Gerenciamento de solicitações de conteúdo managing-content-requests
Conforme mencionado na seção Variações de solicitações de conteúdo do Cloud Service, as solicitações de conteúdo podem ser maiores do que o esperado devido a vários motivos, com um thread comum sendo direcionado ao tráfego na CDN. Como cliente do AEM, você pode monitorar e gerenciar suas solicitações de conteúdo para que se ajustem ao orçamento de licença. O gerenciamento de solicitações de conteúdo geralmente é uma combinação de técnicas de implementação e regras de filtro de tráfego.
Técnicas de implementação para gerenciar solicitações de conteúdo implementation-techniques-to-manage-crs
- Certifique-se de que todas as respostas de Página não encontrada sejam entregues com o status HTTP 404. Se forem retornados com um status 200, eles serão contabilizados nas solicitações de conteúdo.
- Rotear a verificação de integridade ou as ferramentas de monitoramento para o URL /system/probes/health ou usar o método HEAD em vez do GET para evitar a ocorrência de solicitações de conteúdo.
- Equilibre suas necessidades de atualização de conteúdo com o custo de licença da AEM para qualquer rastreador de pesquisa personalizado que você integrou ao seu site. Um rastreador excessivamente agressivo pode consumir muitas solicitações de conteúdo.
- Procure qualquer redirecionamento no lado do servidor (status 301 ou 302) em vez de no lado do cliente (status 200 com redirecionamento do javascript) para evitar duas solicitações de conteúdo separadas.
- Combine ou reduza chamadas de API, que são respostas JSON do AEM que podem ser carregadas para renderizar a página.
Regras de filtro de tráfego para gerenciar solicitações de conteúdo traffic-filter-rules-to-manage-crs
- Um padrão de bot comum é usar um agente de usuário vazio. Será necessário analisar os padrões de implementação e tráfego para ver se o agente de usuário vazio é útil ou não. Se você quiser bloquear esse tráfego, a sintaxe recomendada é:
trafficFilters:
rules:
- name: block-missing-user-agent
when:
anyOf:
- { reqHeader: user-agent, exists: false }
- { reqHeader: user-agent, equals: '' }
action: block
- Alguns bots atingem um site muito fortemente um dia e desaparecem no seguinte. Isso pode frustrar qualquer tentativa de bloquear um endereço IP ou agente do usuário específico. Uma abordagem genérica é introduzir uma regra de limite de taxa. Revise os exemplos e crie uma regra que corresponda à sua tolerância para uma taxa rápida de solicitações. Revise a sintaxe Estrutura de Condição para quaisquer exceções que você queira permitir para um limite de taxa genérico.