Présentation des requêtes de contenu Cloud Service
Présentation introduction
Les demandes de contenu se rapportent aux demandes effectuées à AEM Sites, y compris celles liées aux Edge Delivery Services ou aux systèmes de mise en cache fournis par le client, tels qu’un réseau de diffusion de contenu. Ces requêtes diffusent du contenu ou des données au format HTML par le biais de pages vues (par exemple, des pages et des fragments d’expérience) ou au format JSON par le biais d’appels API sans en-tête. Les demandes de contenu sont comptabilisées sous la forme d’une page vue ou de cinq appels d’API et sont mesurées à l’entrée du premier système de mise en cache qui reçoit une demande de contenu. Certaines requêtes HTTP sont incluses ou exclues à des fins de comptage des requêtes de contenu. La liste complète de ces requêtes HTTP incluses et exclues, ainsi que leurs définitions techniques, sont disponibles dans la documentation.
A propos des requêtes de contenu Cloud Service understanding-cloud-service-content-requests
Pour les clients qui utilisent le réseau de diffusion de contenu prêt à l’emploi, les demandes de contenu du Cloud Service sont mesurées par le biais d’une collecte de données côté serveur. Cette collection est activée via l’analyse des logs CDN. AEM (Adobe Experience Manager) collecte automatiquement les demandes de contenu côté serveur à la périphérie. Il analyse les fichiers journaux générés par le réseau de diffusion de contenu AEM as a Cloud Service. Ce processus est effectué en isolant les demandes renvoyant du contenu d’HTML (text/html)
ou JSON (application/json)
du CDN et est basé sur plusieurs règles d’inclusion et d’exclusion détaillées ci-dessous. Une demande de contenu se produit, que le contenu soit diffusé à partir des caches CDN ou renvoyé à l’origine CDN (AEM les dispatchers).
Variations des demandes de contenu de Cloud Service content-requests-variances
Les demandes de contenu peuvent présenter des variations dans les outils de création de rapports Analytics d’une organisation, comme illustré dans le tableau suivant. En règle générale, évitez d’utiliser des outils d’analyse qui reposent sur l’instrumentation côté client pour signaler le nombre de demandes de contenu pour un site. Ces outils manquent souvent une grande partie du trafic, car ils dépendent du consentement de l’utilisateur pour être activés. Les outils Analytics qui collectent les données côté serveur dans des fichiers journaux ou les rapports CDN pour les clients qui ajoutent leur propre CDN au-dessus d’AEM as a Cloud Service offrent de meilleurs décomptes.
Voir aussi Tableau de bord de la licence.
Règles de collecte côté serveur serverside-collection
Il existe des règles pour exclure les robots les plus connus, notamment les services les plus connus qui visitent régulièrement le site pour actualiser leur index ou service de recherche.
Types de requêtes de contenu incluses included-content-requests
・ Amazon CloudFront
・ Apache Http Client
・ Asynchrone HTTP Client
Axios
Azureus
Curl
GitHub Node Fetch
Guzzle
Go-http-client
Chrome sans affichage
Java™ Client
Jersey
Noeud Oembed
okhttp
Requêtes Python
Netty de réacteur
Wget de
WinHTTP
HTTP
Récupération de noeud GitHub de
Netty de réacteur
/system/probes/health
pour les contrôles de l’intégrité, Adobe vous recommande d’utiliser le point de terminaison /system/probes/health
et non les pages d’HTML réelles du site. Voir ci-dessousExemples :
・
Amazon-Route53-Health-Check-Service
・ EyeMonIT_bot_version_0.1_(https://eyemonit.com/)
・ Investis-Site24x7
Mozilla/5.0+(compatible ; UptimeRobot/2.0 ; https://uptimerobot.com/)
Thouset0} yes-Dragonfly-x1
OmtrBot/1.0
WebMon/2.0.0
<link rel="prefetch">
requêtesVoir aussi Tableau de bord de la licence.
Types de requêtes de contenu exclues excluded-content-request
/system/probes/health
Exemples :
・ AddSearchBot
・ AhrefsBot
・ Applebot
Google Ask Jeeves Corporate Spider
Pinterest Bingbot
BingPreview
BLEXBot
pider
CrawlerKengo
Facebook externalhit
AdsBot
Google AdsBot Mobile
Googlebot
Google Lmspider
LucidWorks
MJ12bot
SemrushBot
SiteAméliorer
StashBot
StatusCake
YandexBot
Claudebot
/api/graphql
) pour éviter le double comptage, ne sont pas facturables au Cloud Service.manifest.json
/etc.clientlibs/*/manifest.json
favicon.ico