Inhoudsverzoeken van Cloud Service begrijpen
Inleiding introduction
Inhoudsverzoeken omvatten aanvragen die naar AEM Sites worden verzonden. Deze verzoeken kunnen door Edge Delivery Services of klant-verstrekt caching systemen zoals een Netwerk van de Levering van de Inhoud (CDN) leiden. Deze verzoeken leveren gestructureerde gegevens in HTML- of JSON-indeling en ondersteunen paginaweergaven (bijvoorbeeld pagina's en ervaringsfragmenten) of JSON retourneert zonder kop via API's.
Het systeem telt inhoudsverzoeken wanneer een gebruiker een pagina gebruikend HTML of JSON bekijkt. Het meet het verzoek op het punt waar het eerste caching systeem het ontvangt. Bepaalde HTTP-aanvragen worden opgenomen of uitgesloten voor het tellen van inhoudsaanvragen. Zie de volledige lijst van HTTP inbegrepen inhoudsverzoeken en uitgesloten inhoudsverzoeken .
Over Cloud Service-inhoudsaanvragen understanding-cloud-service-content-requests
A paginaverzoek verwijst naar een HTTP- verzoek dat kern gestructureerde inhoud (bijvoorbeeld, HTML of JSON) noodzakelijk terugwint om de belangrijkste paginaervaring terug te geven. Het omvat geen verzoeken om elementen, zoals afbeeldingen of scripts.
Voor klanten die uit-van-de-doos CDN gebruiken, telt AEM as a Cloud Service inhoudsverzoeken zoals die op het server-zijniveau worden gemeten. Deze meting wordt automatisch uitgevoerd en is niet afhankelijk van het bijhouden van analyses op de client.
AEM (Adobe Experience Manager) as a Cloud Service identificeert inhoudsverzoeken die op de reactietypes worden gebaseerd die door de instantie van AEM worden geproduceerd en bij CDN worden ontvangen. Specifiek, verzoeken dat de terugkeer HTML (text/html) of JSON (application/json) wordt geteld. Deze indelingen leveren doorgaans inhoud op de primaire pagina, voor traditionele rendering van sites of voor levering zonder kop.
Aanvragen voor statische elementen zoals JavaScript-bestanden, CSS-stijlpagina's en afbeeldingen worden niet geteld als aanvragen voor inhoud.
De verzoeken van de inhoud worden gemeten ongeacht of de reactie van het CDN geheime voorgeheugen of door:sturen aan het milieu van oorsprong AEM werd gediend.
Variaties in Cloud Service-inhoudsaanvragen content-requests-variances
Inhoudsverzoeken kunnen variaties hebben binnen de analytische rapportagehulpprogramma's van een organisatie, zoals wordt samengevat in de volgende tabel. In het algemeen geldt dat u geen analyseprogramma's moet gebruiken die afhankelijk zijn van instrumenten aan de clientzijde om het aantal aanvragen voor inhoud voor een site te melden. Deze hulpmiddelen missen vaak een groot deel van verkeer omdat zij van gebruikerstoestemming afhangen om worden geactiveerd. De hulpmiddelen van de analyse die gegevensserver-kant in logboekdossiers verzamelen, of CDN- rapporten voor klanten die hun eigen CDN bovenop AEM as a Cloud Service toevoegen, verstrekken betere tellingen.
Zie het dashboard van de Vergunning voor informatie over het bekijken en het volgen gebruik van de inhoudsverzoek tegen uw vergunningsgrenzen.
Regels voor verzamelingen op de server serverside-collection
AEM as a Cloud Service past verzamelingsregels aan de serverzijde toe op aanvragen voor telinhoud. Deze regels sluiten bekende bots (zoals zoekmachinecrawlers) en een reeks controlediensten uit die regelmatig de plaats pingelen. Ander synthetisch of controle-type verkeer niet op deze uitsluitingslijst wordt geteld als factureerbare inhoudverzoeken.
In de volgende tabellen worden de typen opgenomen en uitgesloten inhoudsaanvragen vermeld, met korte beschrijvingen van elk.
Typen opgenomen inhoudsaanvragen included-content-requests
Code 206 van HTTP: Deze verzoeken leveren slechts een gedeelte van de volledige inhoud. Bijvoorbeeld een video of een grote afbeelding. Gedeeltelijke inhoudsaanvragen worden opgenomen wanneer ze een deel van een HTML- of JSON-reactie leveren die wordt gebruikt bij het renderen van pagina-inhoud.
・ Amazon CloudFront
・ Apache Http Client
・ Asynchronous HTTP Client
・ Axios
・ Azureus
・ Curl
・ GitHub Node Fetch
・ Guzzle
・ Go-http-client
・ Headless Chrome
・ Java™ Client {1
・ Jersey
・ Node Oembed
・ okhttp
・ Python-verzoeken
・ Reactor Netty
・ Wget
・ WinHTTP
・ Fast HTTP
・ GitHub Node Fetch
・ Reactor Netty
zie Types van uitgesloten inhoudsverzoeken .
Voorbeelden omvatten het volgende:
・
Amazon-Route53-Health-Check-Service・ EyeMonIT_bot_version_0.1_ (https://eyemonit.com/)
・ Investis-Site24x7
・ Mozilla/5.0+ (compatibel; UptimeRobot/2.0; https://uptimerobot.com/ )
・ ThousandEyes-gonfly-x1
・ OmtrBot/1.0
・ WebMon/2.0.0
<link rel="prefetch"> aanvragen<link rel="prefetch">), telt het systeem die serververzoeken. Let erop dat deze benadering het verkeer kan verhogen, afhankelijk van het aantal van deze pagina's dat vooraf is ingesteld.Zie ook Dashboard van de Vergunning .
Typen verzoeken om uitgesloten inhoud excluded-content-request
/libs/*/system/probes/healthVoorbeelden:
・ AddSearchBot
・ AhrefsBot
・ Applebot
・ Vraag Jeeves Corporate Spider
・ Bingbot
・ BingPreview
・ BLEXBot
・ BouwtWith
・ CrawlerKengo
・ Facebookexternalhit
・ Google AdsBot
・ Google AdsBot Mobile
・ Googlebot
・ Googlebot Mobile
・ lmspin
・ LucidWorks
・
MJ12bot・ SembrushBot
・ SiteImproved
・ StashBot
・ StatusCake
・ YandexBot
・ ContentKing
・ Claudebot
/api/graphql—om dubbeltellingen te voorkomen, kunnen niet worden gefactureerd voor Cloud Service.manifest.json/etc.clientlibs/*/manifest.jsonfavicon.ico/content/experience-fragments/... ) die zijn gedaan vanaf pagina's die worden gehost op hetzelfde domein (zoals wordt aangegeven door de verwijzingsheader die overeenkomt met de aanvraaghost).Voorbeeld: een homepage van
aem.customer.com die in een XF voor een banner of kaart van het zelfde domein trekt.・ URL gelijken /content/experience-fragments/…
・ het domeinovereenkomsten van de Verwijzing
request_x_forwarded_hostNota: als de weg van het Fragment van de Ervaring wordt aangepast (bijvoorbeeld gebruikend
/XFrags/... of om het even welk weg buiten /content/experience-fragments/), zal het verzoek niet worden uitgesloten en kan worden geteld, zelfs als het zelfde-domein is. We raden u aan de standaard XF-padstructuur van Adobe te gebruiken om te zorgen dat de uitsluitingslogica correct wordt toegepast.Inhoudsverzoeken beheren managing-content-requests
Zoals vermeld in de bovengenoemde sectie Varianties van de inhoudsverzoeken van Cloud Service , kunnen de inhoudsverzoeken hoger zijn dan verwacht toe te schrijven aan een aantal redenen, met een gemeenschappelijke draad die verkeer dat CDN raakt. Het is voor u als AEM-klant nuttig om uw inhoudsaanvragen te controleren en te beheren om binnen uw licentiebudget te passen. Het beheren van inhoudverzoeken is over het algemeen een combinatie implementatietechnieken en regels van de verkeersfilter .
Implementatietechnieken voor het beheer van inhoudsaanvragen implementation-techniques-to-manage-crs
- Zorg ervoor dat de niet-gevonden reacties op de pagina worden geleverd met de HTTP-status 404. Als ze worden geretourneerd met de status 200, tellen ze voor inhoudsaanvragen.
- De de gezondheidscontrole of controlehulpmiddelen van de route aan /system/sonds/gezondheid URL of gebruik de methode van HEAD in plaats van GET om het veroorzaken van inhoudsverzoeken te vermijden.
- Breng uw behoeften aan versheid van inhoud in evenwicht met AEM-licentiekosten voor elke aangepaste zoekfunctie die u met uw site hebt geïntegreerd. Een al te agressieve krawler kan veel inhoudsverzoeken consumeren.
- Omleiding als server-side (status 301 of 302) in plaats van client-side (status 200 met javascript redirect) afhandelen om twee afzonderlijke inhoudsaanvragen te voorkomen.
- Combineer of verminder API vraag, die JSON reacties van AEM zijn die kunnen worden geladen om de pagina terug te geven.
De filterregels van het verkeer om inhoudsverzoeken te beheren traffic-filter-rules-to-manage-crs
- Een gemeenschappelijk beide patroon is het gebruiken van een lege gebruikersagent. U zult uw implementatie en verkeerspatronen moeten herzien om te zien of is de lege gebruikersagent nuttig of niet. Als u dit verkeer zou willen blokkeren, geadviseerde syntaxis is:
trafficFilters:
rules:
- name: block-missing-user-agent
when:
anyOf:
- { reqHeader: user-agent, exists: false }
- { reqHeader: user-agent, equals: '' }
action: block
- Sommige brouten raakten op een dag erg zwaar en verdwijnen de volgende. Dit kan om het even welke pogingen om een specifiek IP adres of een gebruikersagent te blokkeren dwarsbomen. Één generische benadering moet de regel van de a tariefgrens introduceren. Herzie de voorbeelden en vecht een regel die uw tolerantie voor een snel tarief van verzoeken aanpast. Herzie de syntaxis van de Structuur van de Voorwaarde voor om het even welke uitzonderingen u aan een generische tariefgrens kunt wensen toe te staan.