Comprendere le richieste di contenuto di Cloud Service
Introduzione introduction
Le richieste di contenuto includono le richieste inviate ad AEM Sites. Queste richieste possono essere indirizzate tramite Edge Delivery Services o sistemi di caching forniti dal cliente, ad esempio una rete CDN (Content Delivery Network). Queste richieste forniscono dati strutturati in formato HTML o JSON e supportano le visualizzazioni di pagina (ad esempio, pagine e frammenti di esperienza) o i resi JSON tramite API in modo headless.
Il sistema conta le richieste di contenuto quando un utente visualizza una pagina utilizzando HTML o JSON. Misura la richiesta nel punto in cui il primo sistema di caching la riceve. Alcune richieste HTTP sono incluse o escluse ai fini del conteggio delle richieste di contenuto. Vedi l'elenco completo delle richieste di contenuto incluse e richieste di contenuto escluse HTTP.
Informazioni sulle richieste di contenuto di Cloud Service understanding-cloud-service-content-requests
Una richiesta di pagina fa riferimento a una richiesta HTTP che recupera il contenuto strutturato di base (ad esempio, HTML o JSON) necessario per eseguire il rendering dell'esperienza della pagina principale. Non include le richieste di risorse, ad esempio immagini o script.
Per i clienti che utilizzano la rete CDN preconfigurata, AEM as a Cloud Service conta le richieste di contenuto come misurate a livello di server. Questa misurazione viene eseguita automaticamente e non si basa sul tracciamento delle analisi lato client.
AEM (Adobe Experience Manager) as a Cloud Service identifica le richieste di contenuto in base ai tipi di risposta generati dall’istanza di AEM e ricevuti dalla rete CDN. In particolare, vengono conteggiate le richieste che restituiscono HTML (text/html) o JSON (application/json). In genere, questi formati forniscono contenuti di pagina principali sia per il rendering tradizionale del sito che per la distribuzione headless.
Le richieste di risorse statiche come file JavaScript, fogli di stile CSS e immagini non vengono conteggiate come richieste di contenuto.
Le richieste di contenuto vengono misurate indipendentemente dal fatto che la risposta sia stata servita dalla cache CDN o inoltrata all’ambiente AEM di origine.
Varianze nelle richieste di contenuto Cloud Service content-requests-variances
Le richieste di contenuto possono presentare varianze all’interno degli strumenti di reporting di analisi di un’organizzazione, come riepilogato nella tabella seguente. In generale, evita di utilizzare strumenti di analisi che si basano su strumenti lato client per segnalare il numero di richieste di contenuto per un sito. Questi strumenti spesso perdono una grande parte del traffico perché dipendono dal consenso degli utenti per essere attivati. Gli strumenti di Analytics che raccolgono i dati lato server nei file di registro, o i rapporti CDN per i clienti che aggiungono la propria CDN oltre ad AEM as a Cloud Service, forniscono conteggi migliori.
Per informazioni su come visualizzare e tenere traccia dell'utilizzo delle richieste di contenuto rispetto ai limiti di licenza, consulta la Dashboard delle licenze.
Regole di raccolta lato server serverside-collection
AEM as a Cloud Service applica le regole di raccolta lato server per conteggiare le richieste di contenuto. Queste regole escludono bot noti (come crawler di motori di ricerca) e un set di servizi di monitoraggio che eseguono regolarmente il ping del sito. L’altro traffico sintetico o di tipo monitoraggio non presente in questo elenco di esclusione viene conteggiato come richieste di contenuto fatturabili.
Nelle tabelle seguenti sono elencati i tipi di richieste di contenuto incluse ed escluse, con brevi descrizioni di ciascuna.
Tipi di richieste di contenuto incluse included-content-requests
Codice HTTP 206: queste richieste forniscono solo una parte del contenuto completo. Ad esempio, un video o un’immagine di grandi dimensioni. Le richieste di contenuto parziale sono incluse quando distribuiscono parte di una risposta HTML o JSON utilizzata nel rendering del contenuto della pagina.
· Amazon CloudFront
· Apache Http Client
· Asynchronous HTTP Client
· Axios
· Azureus
· Curl
· GitHub Node Fetch
· Guzzle
· Go-http-client
· Headless Chrome
· Java™ Client
· Jersey
· Node Oembed
· okhttp
· Python Requests
· Reactor Netty
· Wget
· WinHTTP
· Fast HTTP
· GitHub Node Fetch
· Reactor Netty
Consulta Tipi di richieste di contenuto escluse.
Gli esempi includono:
·
Amazon-Route53-Health-Check-Service· EyeMonIT_bot_version_0.1_(https://eyemonit.com/)
· Investis-Site24x7
· Mozilla/5.0+(compatibile; UptimeRobot/2.0; https://uptimerobot.com/)
· ThousandEyes-Dragonfly-x1
· OmtrBot/1.0
· WebMon/2.0.0
<link rel="prefetch"> richieste<link rel="prefetch">), il sistema conta tali richieste lato server. Tieni presente che questo approccio può aumentare il traffico, a seconda di quante di queste pagine vengono preacquisite.Vedi anche Dashboard delle licenze.
Tipi di richieste di contenuto escluse excluded-content-request
/libs/*/system/probes/healthEsempi:
· AddSearchBot
· AhrefsBot
· Applebot
· Chiedi a Jeeves Corporate Spider
· Bingbot
· BingPreview
· BLEXBot
· BuiltWith
· Bytespider
· CrawlerKengo
· Facebookexternalhit
· Google Google AdsBot
AdsBot Mobile
· Googlebot
· Googlebot Mobile
· lmspider
· LucidWorks
·
MJ12bot· SemrushBot
· SiteImprove
· StashBot
· StatusCake
· YandexBot
· ContentKing
· Claudebot
/api/graphql, per evitare un doppio conteggio, non sono fatturabili per Cloud Service.manifest.json/etc.clientlibs/*/manifest.jsonfavicon.ico/content/experience-fragments/...) da pagine ospitate sullo stesso dominio (come identificato dall'intestazione Referer che corrisponde all'host della richiesta).Esempio: una home page su
aem.customer.com che richiama un XF per un banner o una scheda dello stesso dominio.· URL matches /content/experience-fragments/…
· Il dominio di riferimento corrisponde a
request_x_forwarded_hostNota: Se il percorso del frammento di esperienza è personalizzato (ad esempio utilizzando
/XFrags/... o un percorso esterno a /content/experience-fragments/), la richiesta non verrà esclusa e potrebbe essere conteggiata, anche se si tratta dello stesso dominio. È consigliabile utilizzare la struttura di percorso XF standard di Adobe per garantire che la logica di esclusione venga applicata correttamente.Gestione delle richieste di contenuto managing-content-requests
Come indicato nella sezione precedente Varianze delle richieste di contenuto di Cloud Service, le richieste di contenuto possono essere più elevate del previsto per una serie di motivi, con un thread comune che genera traffico sul CDN. In qualità di cliente di AEM, è a tuo vantaggio monitorare e gestire le richieste di contenuti in base al budget delle licenze. La gestione delle richieste di contenuto è in genere una combinazione di tecniche di implementazione e regole del filtro del traffico.
Tecniche di implementazione per gestire le richieste di contenuto implementation-techniques-to-manage-crs
- Assicurati che tutte le risposte Page Not Found (Pagina non trovata) siano consegnate con uno stato HTTP 404. Se vengono restituiti con lo stato 200, verranno conteggiati per le richieste di contenuto.
- Indirizza gli strumenti di controllo o di verifica dello stato all'URL /system/probes/health oppure utilizza il metodo HEAD invece di GET per evitare di inviare richieste di contenuto.
- Bilancia le tue esigenze di aggiornamento dei contenuti con i costi di licenza di AEM per qualsiasi crawler di ricerca personalizzato integrato con il tuo sito. Un crawler eccessivamente aggressivo può richiedere molti contenuti.
- Per evitare due richieste di contenuto separate, gestisci i reindirizzamenti come lato server (stato 301 o 302) anziché lato client (stato 200 con reindirizzamento JavaScript).
- Combina o riduci le chiamate API, che sono risposte JSON da AEM che possono essere caricate per eseguire il rendering della pagina.
- Assicurati che l’agente utente del browser sia passato correttamente ad AEM per sfruttare la regola di esclusione di richieste di contenuto "motore di ricerca noto" descritta in precedenza. A volte l’agente utente di origine viene perso con determinate implementazioni headless o configurazioni CDN che possono impedire l’esclusione e causare richieste di contenuto più elevate rispetto a quando l’agente utente viene trasmesso.
Regole di filtro del traffico per gestire le richieste di contenuto traffic-filter-rules-to-manage-crs
- Un pattern comune di bot consiste nell’utilizzare un agente utente vuoto. È necessario rivedere l’implementazione e i pattern di traffico per verificare se l’agente utente vuoto è utile o meno. Se vuoi bloccare questo traffico, la sintassi consigliata è:
trafficFilters:
rules:
- name: block-missing-user-agent
when:
anyOf:
- { reqHeader: user-agent, exists: false }
- { reqHeader: user-agent, equals: '' }
action: block
- Alcuni bot colpiscono pesantemente un sito un giorno e scompaiono il giorno successivo. Questo può vanificare qualsiasi tentativo di bloccare un indirizzo IP o un agente utente specifico. Un approccio generico consiste nell'introdurre una regola del limite di frequenza. Rivedi i esempi e crea una regola che corrisponda alla tua tolleranza per un tasso di richieste rapido. Esaminare la sintassi Struttura condizione per individuare eventuali eccezioni che si desidera consentire a un limite di tasso generico.