Panoramica di Dispatcher dispatcher-overview

NOTE
Le versioni di Dispatcher sono indipendenti da AEM (Adobe Experience Manager). Se hai seguito un collegamento alla documentazione di Dispatcher, potresti essere stato reindirizzato a questa pagina. Tale collegamento è stato incorporato nella documentazione di una versione precedente di AEM.

Dispatcher è uno strumento di memorizzazione in cache e/o bilanciamento del carico di Adobe Experience Manager che può essere utilizzato insieme a un server Web di classe Enterprise.

iIl processo di distribuzione del Dispatcher è indipendente dal server web e dalla piattaforma del sistema operativo scelti:

  1. Scopri di più su Dispatcher (questa pagina). Inoltre, consulta le domande frequenti sul Dispatcher.
  2. Installa un server web supportato in base alla documentazione di quel server web.
  3. Installa il modulo Dispatcher nel server web e configura di conseguenza il server web.
  4. Configura Dispatcher (il file dispatcher.any).
  5. Configura AEM in modo che gli aggiornamenti del contenuto invalidino la cache.
NOTE
Per capire meglio come funziona Dispatcher con AEM:

Utilizza le seguenti informazioni come richiesto:

NOTE
Dispatcher viene utilizzato in genere per memorizzare in cache le risposte di un’istanza AEM Publish, per aumentare la capacità di risposta e la sicurezza del sito web pubblicato che interfaccia con l’esterno. La maggior parte della discussione è incentrata su questo caso specifico.
Ma Dispatcher può essere utilizzato anche per aumentare la reattività dell’istanza di authoring. Questo vale in particolare se hai un gran numero di utenti che modificano e aggiornano il sito web. Per i dettagli specifici di questo caso, vedi Utilizzo di Dispatcher con Author Server più avanti.

Perché usare Dispatcher per implementare il caching? why-use-dispatcher-to-implement-caching

Sono due gli approcci di base alla pubblicazione sul web:

  • Server web statici: come Apache o IIS, che sono molto semplici, ma veloci.
  • Server di gestione del contenuto: che forniscono contenuti intelligenti, dinamici e in tempo reale, ma richiedono un tempo di calcolo maggiore e altre risorse.

Dispatcher permette di realizzare un ambiente al tempo stesso veloce e dinamico. Viene utilizzato parte come parte un server HTML statico, ad esempio Apache, con lo scopo di:

  • Archiviare (o “memorizzare in cache”) la maggior parte del contenuto del sito sotto forma di sito web statico
  • Accedere il meno possibile al motore di layout.

Questo significa che:

  • Il contenuto statico viene gestito con la stessa velocità e facilità di un server web statico. Inoltre, puoi utilizzare gli strumenti di amministrazione e di sicurezza disponibili per i server web statici.

  • Il contenuto dinamico viene generato in base alle necessità, senza rallentare il sistema più del necessario.

Dispatcher contiene meccanismi per generare e aggiornare il codice HTML statico in base al contenuto del sito dinamico. È possibile specificare in dettaglio quali documenti vengono archiviati come file statici e quali vengono sempre generati in modo dinamico.

Questa sezione illustra i principi alla base di tale funzionamento.

Server web statico static-web-server

Un server web statico, come Apache o IIS, viene utilizzato per distribuire file HTML statici ai visitatori del sito web. Le pagine statiche vengono create una sola volta, quindi a ogni richiesta verrà distribuito lo stesso contenuto.

Questo processo è semplice ed efficiente. Se un visitatore richiede un file, ad esempio una pagina HTML, in genere il file viene prelevato direttamente dalla memoria o nel peggiore dei casi viene letto dall’unità locale. I server web statici sono disponibili da tempo. Perciò, è disponibile una vasta gamma di strumenti per l’amministrazione e la gestione della sicurezza. Questi strumenti sono ben integrati con le infrastrutture di rete.

Server di gestione dei contenuti content-management-servers

Se utilizzi un CMS (server di gestione dei contenuti), come AEM, la richiesta di un visitatore viene elaborata da un motore di layout avanzato. Il motore legge il contenuto da un archivio che, insieme a stili, formati e diritti di accesso, trasforma il contenuto in un documento personalizzato in base alle esigenze e ai diritti del visitatore.

Questo flusso di lavoro ti permette di creare contenuti più ricchi e dinamici, che aumentano la flessibilità e la funzionalità del tuo sito web. Tuttavia, il motore di layout richiede una potenza di elaborazione maggiore rispetto a un server statico, pertanto questa configurazione potrebbe essere soggetta a rallentamenti, se molti visitatori utilizzano il sistema.

Funzionamento del caching in Dispatcher how-dispatcher-performs-caching

Directory della cache Per il caching il modulo Dispatcher utilizza la funzionalità del server web che consente di distribuire contenuto statico. Dispatcher inserisce i documenti memorizzati nella cache nella radice del server web.

NOTE
Se manca la configurazione per la memorizzazione in cache delle intestazioni HTTP, Dispatcher archivia solo il codice HTML della pagina e non le intestazioni HTTP. Questo comportamento può costituire un problema, se utilizzi codifiche diverse all’interno del sito web, in quanto queste codifiche potrebbero andare perse. Per abilitare il caching delle intestazioni HTTP, consulta Configurazione della cache di Dispatcher.
NOTE
Se la directory principale dei documenti del server web si trova su Network Attached Storage (NAS), potresti riscontrare un degrado delle prestazioni. Inoltre, quando una directory principale dei documenti che si trova nel NAS viene condivisa tra più server web, possono verificarsi blocchi intermittenti durante l’esecuzione di azioni di replica.
NOTE
Dispatcher archivia il documento memorizzato in cache in una struttura uguale all’URL richiesto.
Possono esserci limitazioni a livello di sistema operativo per la lunghezza del nome dei file. Cioè, se hai un URL con numerosi selettori.

Metodi di caching

In Dispatcher sono disponibili due metodi principali per aggiornare il contenuto della cache quando vengono apportate modifiche al sito web.

  • Aggiornamenti del contenuto: le pagine modificate e i file che sono direttamente associati ad esse vengono rimossi.
  • Annullamento automatico della validità: le parti della cache che potrebbero risultare obsolete dopo un aggiornamento vengono invalidate automaticamente. Ad esempio, le pagine ritenute obsolete vengono chiaramente contrassegnate, ma non eliminate.

Aggiornamenti del contenuto

In un aggiornamento del contenuto uno o più documenti AEM cambiano. AEM invia una richiesta di distribuzione del contenuto (syndication) a Dispatcher, che aggiorna la cache di conseguenza:

  1. Elimina i file modificati dalla cache.
  2. Elimina dalla cache tutti i file che iniziano con la stessa gestione. Ad esempio, se viene aggiornato il file /en/index.html, tutti i file che iniziano con /en/index. sono cancellati. Questo meccanismo consente di progettare siti efficienti in termini di cache, soprattutto per la navigazione tra le immagini.
  3. Il cosiddetto statfile viene toccato e la sua marca temporale viene aggiornata per indicare la data dell’ultima modifica.

Tieni presente le seguenti considerazioni:

  • Gli aggiornamenti di contenuto vengono in genere utilizzati insieme a un sistema di authoring che “sa” cosa deve essere sostituito.
  • Gli aggiornamenti del contenuto che interessano i file vengono rimossi, ma non sostituiti immediatamente. La volta successiva in cui un tale file viene richiesto, Dispatcher lo recupera dall’istanza AEM e lo inserisce nella cache, sovrascrivendo il vecchio contenuto.
  • In genere, le immagini generate automaticamente che incorporano testo di una pagina vengono archiviate in file di immagine che iniziano con lo stesso handle, in modo da garantire l’associazione per l’eliminazione. Ad esempio, puoi archiviare il testo del titolo della pagina mypage.html come immagine mypage.titlePicture.gif nella stessa cartella. In questo modo l’immagine viene eliminata automaticamente dalla cache ogni volta che la pagina viene aggiornata e potrai essere sicuro che l’immagine rispecchierà sempre la versione corrente della pagina.
  • Possono esistere diversi statfile, ad esempio uno per cartella della lingua. Se una pagina viene aggiornata, AEM cerca la cartella padre successiva contenente uno statfile e tocca tale file.

Annullamento automatico della validità

Con l’annullamento automatico della validità, parti della cache vengono automaticamente invalidate, ma non viene fisicamente eliminato alcun file. A ogni aggiornamento del contenuto, il cosiddetto statfile viene toccato e la marca temporale corrispondente rispecchia quindi l’ultimo aggiornamento del contenuto.

In Dispatcher è disponibile un elenco di file soggetti ad annullamento automatico della validità. Quando viene richiesto un documento da tale elenco, Dispatcher confronta la data del documento memorizzato in cache con la marca temporale dello statfile:

  • Se il documento memorizzato in cache è più recente, Dispatcher lo restituisce.
  • Se è precedente, Dispatcher recupera la versione corrente dall’istanza di AEM.

Anche in questo caso, tieni presente le seguenti considerazioni:

  • L’annullamento automatico della validità viene utilizzato in genere quando le interrelazioni sono complesse, ad esempio per le pagine HTML. Queste pagine contengono collegamenti e voci di navigazione e in genere devono essere aggiornate dopo un aggiornamento del contenuto. Se sono presenti file PDF o di immagine generati automaticamente, puoi scegliere di annullarne automaticamente anche la validità.
  • L’annullamento automatico della validità non richiede alcuna azione da parte del Dispatcher al momento dell’aggiornamento, se non quella di toccare lo statfile. Tuttavia, quando lo statfile viene toccato, il contenuto della cache diventa automaticamente obsoleto, anche se non viene rimosso fisicamente dalla cache.

Restituzione dei documenti in Dispatcher how-dispatcher-returns-documents

Stabilire se un documento è soggetto a caching

Nel file di configurazione puoi definire quali documenti Dispatcher deve memorizzare in cache. Dispatcher confronta la richiesta con l’elenco dei documenti memorizzabili in cache. Se il documento non è incluso in questo elenco, Dispatcher richiede il documento dall’istanza di AEM.

Dispatcher richiede sempre il documento direttamente dall’istanza AEM nei seguenti casi:

  • L’URI della richiesta contiene un punto interrogativo ?. In genere questo segno indica una pagina dinamica, ad esempio un risultato della ricerca, che non deve essere memorizzata in cache.
  • Se manca l’estensione del file. Il server web ha bisogno dell’estensione per determinare il tipo di documento (tipo MIME).
  • L’intestazione di autenticazione è impostata (configurabile).
NOTE
Dispatcher può memorizzare in cache i metodi GET o HEAD (per l’intestazione HTTP). Per ulteriori informazioni sul caching delle intestazioni di risposta, vedi la sezione Caching delle intestazioni di risposta HTTP.

Stabilire se un documento è memorizzato in cache

Dispatcher archivia nel server web i file memorizzati in cache come se facessero parte di un sito web statico. Se un utente richiede un documento memorizzabile in cache, il Dispatcher verifica se tale documento è presente nel file system del server web:

  • Se il documento è memorizzato in cache, Dispatcher restituisce il file.
  • Se non è memorizzato in cache, Dispatcher richiede il documento dall’istanza di AEM.

Determinare se un documento è aggiornato

Per verificare se un documento è aggiornato, Dispatcher esegue due passaggi:

  1. Verifica se il documento è soggetto ad annullamento automatico della validità. In caso contrario, il documento viene considerato aggiornato.
  2. Se il documento è configurato per l’annullamento automatico della validità, Dispatcher controlla se è più o meno recente dell’ultima modifica disponibile. Se è meno recente, Dispatcher richiede la versione corrente dall’istanza di AEM e sostituisce la versione nella cache.
NOTE
I documenti senza annullamento automatico della validità rimangono nella cache fino a quando non vengono fisicamente eliminati. Ad esempio, tramite un aggiornamento del contenuto del sito web.

Vantaggi del bilanciamento del carico the-benefits-of-load-balancing

Per bilanciamento del carico si intende la distribuzione del carico di elaborazione del sito web tra più istanze di AEM.

I vantaggi di questa pratica sono i seguenti:

  • Maggiore potenza di elaborazione
    In pratica, questa fa sì che il Dispatcher condivida le richieste di documenti tra diverse istanze AEM. Poiché il numero di documenti da elaborare per ogni istanza è ridotto, i tempi di risposta risultano inferiori. Dispatcher mantiene statistiche interne per ogni categoria di documenti, in modo da poter stimare il carico e distribuire le query in modo efficiente.

  • Maggiore copertura in caso di errore
    Se non riceve risposte da un’istanza, il Dispatcher inoltrerà automaticamente le richieste a una delle altre istanze. Pertanto, se un’istanza risulta non disponibile, l’unico effetto è un rallentamento del sito, proporzionato alla potenza di elaborazione persa. Tuttavia, l’elaborazione di tutti i servizi non subirà interruzioni.

  • È anche possibile gestire siti web diversi sullo stesso server web statico.

NOTE
Mentre il bilanciamento del carico consente di distribuire il carico in modo efficiente, il caching contribuisce a ridurlo. Prova quindi a ottimizzare il caching e a ridurre il carico complessivo prima di configurare il bilanciamento del carico. Un caching appropriato può contribuire a migliorare le prestazioni del load balancer oppure rendere superfluo il bilanciamento del carico.
CAUTION
Anche se un singolo Dispatcher è in grado di assorbire da solo la capacità delle istanze di pubblicazione disponibili, per alcune rare applicazioni può anche essere utile bilanciare il carico tra due istanze di Dispatcher. Le configurazioni con più istanze di Dispatcher devono essere considerate con attenzione. Infatti, un’ulteriore istanza di Dispatcher può far aumentare il carico sulle istanze di pubblicazione disponibili e può facilmente causare un calo delle prestazioni nella maggior parte delle applicazioni.

Bilanciamento del carico in Dispatcher how-the-dispatcher-performs-load-balancing

Statistiche sulle prestazioni

Dispatcher mantiene statistiche interne sulla velocità di elaborazione dei documenti in ogni istanza di AEM. In base a questi dati, il Dispatcher può stimare quale istanza è in grado di fornire il tempo di risposta più rapido quando risponde a una richiesta e quindi riserva il tempo di elaborazione necessario a tale istanza.

I diversi tipi di richieste possono avere diversi tempi medi di completamento, pertanto il Dispatcher consente di specificare le categorie dei documenti. Queste categorie vengono quindi considerate per calcolare i tempi stimati. Ad esempio, puoi fare una distinzione tra pagine HTML e immagini, poiché i tempi di risposta tipici possono essere molto diversi.

Se utilizzi una funzione di ricerca complessa, puoi creare una categoria per le query di ricerca. In questo modo il Dispatcher può inviare le query di ricerca all’istanza che risponde più velocemente. Inoltre, ciò impedisce a un’istanza più lenta di rimanere in sospeso quando riceve diverse query di ricerca “onerose”, mentre altre istanze ricevono altre richieste “meno onerose”.

Contenuto personalizzato (connessioni permanenti)

Con le connessioni permanenti è possibile garantire che i documenti di un utente siano tutti composti nella stessa istanza di AEM. Questa funzione è importante, se utilizzi pagine e dati di sessione personalizzati. I dati vengono archiviati nell’istanza, per cui le richieste successive dello stesso utente devono tornare a quell’istanza, altrimenti i dati andranno persi.

Poiché con le connessioni permanenti la capacità di Dispatcher di ottimizzare le richieste risulta limitata, è consigliabile utilizzarle solo quando necessario. Puoi specificare la cartella che contiene i documenti “permanenti”, in modo da garantire che tutti i documenti in tale cartella vengano composti nella stessa istanza per ogni utente.

NOTE
Per la maggior parte delle pagine che utilizzano connessioni permanenti è necessario disattivare la cache, altrimenti la pagina risulterà uguale per tutti gli utenti, indipendentemente dal contenuto della sessione.
Per alcune applicazioni, può essere possibile utilizzare sia connessioni permanenti che il caching, ad esempio, se si visualizza un modulo che scrive i dati nella sessione.

Utilizzo di più istanze di Dispatcher using-multiple-dispatchers

In configurazioni complesse è possibile utilizzare più istanze di Dispatcher. Ad esempio, puoi utilizzare:

  • Un’istanza di Dispatcher per pubblicare un sito web nella Intranet.
  • Una seconda istanza di Dispatcher, con indirizzo e impostazioni di sicurezza diversi, per pubblicare lo stesso contenuto in Internet.

In questo caso, accertati che ogni richiesta venga gestita tramite un’unica istanza di Dispatcher. Un’istanza di Dispatcher non gestisce le richieste provenienti da un’altra istanza di Dispatcher. Accertati pertanto che entrambe le istanze di Dispatcher accedano direttamente al sito web di AEM.

Utilizzo di Dispatcher con una rete CDN using-dispatcher-with-a-cdn

Una rete CDN (Content Delivery Network), come Akamai Edge Delivery o Amazon Cloud Front, consente di distribuire contenuto da una località vicina all’utente finale. Ciò permette di:

  • Velocizzare i tempi di risposta per gli utenti finali.
  • Alleggerisce il carico dei server.

In quanto componente di un’infrastruttura HTTP, una rete CDN funziona in modo analogo a un Dispatcher. Quando un nodo della rete CDN riceve una richiesta, la distribuisce dalla propria cache, se possibile (se la risorsa è disponibile nella cache ed è valida). In caso contrario, si rivolge al server successivo più vicino per recuperare la risorsa e memorizzarla in cache per eventuali ulteriori richieste.

Il “server successivo più vicino” dipende dalla configurazione specifica. Ad esempio, in una configurazione di Akamai il percorso della richiesta può essere il seguente:

  • Nodo Akamai Edge
  • Lvello Akamai Midgress
  • Firewall dell’utente
  • Load balancer dell’utente
  • Dispatcher
  • AEM

Nella maggior parte dei casi, Dispatcher è il server successivo che può distribuire il documento da una cache e influire sulle intestazioni di risposta restituite al server della rete CDN.

Controllo di una cache della rete CDN controlling-a-cdn-cache

Esistono diversi modi per controllare per quanto tempo una rete CDN memorizza in cache una risorsa prima che venga recuperata da Dispatcher.

  1. Configurazione esplicita
    Configura per quanto tempo determinate risorse vengono mantenute nella cache della rete CDN, a seconda del tipo MIME, dell’estensione, del tipo di richiesta e così via.

  2. Intestazioni di scadenza e controllo della cache
    La maggior parte delle reti CDN rispetta le intestazioni HTTP Expires: e Cache-Control: se inviate dal server upstream. A questo scopo è possibile usare il modulo Apache mod_expires.

  3. Annullamento manuale della validità
    Le reti CDN consentono di rimuovere risorse dalla cache tramite interfacce web.

  4. Annullamento basato su API
    La maggior parte delle reti CDN offre anche un’API REST e/o SOAP che consente di rimuovere le risorse dalla cache.

In una configurazione tipica di AEM, la configurazione per estensione, per percorso o per entrambi, che può essere realizzata tramite i punti 1 e 2 già menzionati, permette di impostare periodi di memorizzazione in cache ragionevoli. Questi periodi di memorizzazione in cache sono utili per quelle risorse che vengono utilizzate spesso e che non sono soggette a frequenti modifiche, come immagini usate nei design e le librerie client. Quando vengono distribuite nuove versioni, in genere è necessario annullare manualmente la validità.

Se si utilizza questo approccio per memorizzare in cache il contenuto gestito, le modifiche apportate al contenuto diventano visibili agli utenti finali solo dopo la scadenza del periodo di caching configurato, e quando il documento viene di nuovo recuperato da Dispatcher.

Per un controllo più granulare, l’annullamento della validità basato su API consente di annullare la validità della cache di una rete CDN appena viene annullata la validità della cache di Dispatcher. In base all’API della rete CDN, puoi implementare versioni personalizzate di ContentBuilder e TransportHandler (se l’API non è basata su REST) e impostare un’agente di replica che le userà per annullare la validità della cache della rete CDN.

NOTE
Vedi anche la presentazione su Sicurezza di AEM (CQ) Dispatcher e caching di rete CDN e browser nonché la presentazione registrata sul caching in Dispatcher.

Utilizzo di un’istanza di Dispatcher con Author Server using-a-dispatcher-with-an-author-server

CAUTION
Se utilizzi AEM con interfaccia touch, non memorizzare nella cache il contenuto dell'istanza di authoring. Se è stato abilitato il caching per l’istanza di authoring, devi disabilitarlo ed eliminare il contenuto della directory cache. Per disabilitare il caching, modifica il file author_dispatcher.any e la proprietà /rule della sezione /cache nel modo seguente:
/rules
{
/0000
{ /type "deny" /glob "*"}
}

Puoi utilizzare un’istanza di Dispatcher prima di un’istanza Autore per migliorare le prestazioni di authoring. Per configurare un’istanza di Dispatcher per l’authoring, effettua le seguenti operazioni:

  1. Installa il Dispatcher in un server web (può essere un server web Apache o IIS; consulta Installazione Dispatcher).

  2. Testa il Dispatcher appena installato rispetto a un’istanza di pubblicazione AEM funzionante. In questo modo si garantisce che sia stata effettuata un’installazione corretta della linea di base.

  3. Assicurati che Dispatcher sia in grado di connettersi all’istanza di authoring tramite TCP/IP.

  4. Sostituisci il file dispatcher.any di esempio con il file author_dispatcher.any fornito con il download del Dispatcher.

  5. Apri il file author_dispatcher.any in un editor di testo e apporta le seguenti modifiche:

    1. Modifica /hostname e /port della sezione /renders in modo che puntino all’istanza di authoring.
    2. Modifica /docroot della sezione /cache in modo che punti a una directory della cache. Se utilizzi AEM con l’interfaccia utente touch, vedi l’avviso riportato sopra.
    3. Salva le modifiche.
  6. Elimina tutti i file esistenti nella directory /cache > /docroot configurata in precedenza.

  7. Riavvia il server web.

NOTE
Con la configurazione author_dispatcher.any fornita, quando installi un pacchetto di funzioni, hotfix o un pacchetto di codice dell’applicazione CQ5 che interessa un qualsiasi contenuto in /libs o /apps, devi eliminare i file memorizzati nella cache. I file si trovano in tali directory nella cache di Dispatcher. In questo modo, si assicura che alla successiva richiesta vengano recuperati i nuovi file aggiornati e non quelli vecchi memorizzati nella cache.
CAUTION
Se hai usato un Dispatcher per l’authoring configurato in precedenza e hai attivato l’agente di svuotamento del Dispatcher, effettua le seguenti operazioni:
  1. Elimina o disattiva l’agente di svuotamento del Dispatcher di authoring nell’istanza di authoring di AEM.
  2. Ripeti la configurazione del Dispatcher di authoring seguendo le nuove istruzioni riportate sopra.
recommendation-more-help
ce382601-480f-4a99-8be7-73178d4b6ef5