Configurazione Solr per SRP

Solr for AEM Platform

Un'installazione Apache Solr può essere condivisa tra lo store nodi (Oak) e lo store comune (SRP) utilizzando raccolte diverse.

Se le raccolte Oak e SRP vengono utilizzate intensamente, per motivi di prestazioni potrebbe essere installato un secondo Solr.

Per gli ambienti di produzione, la modalità SolrCloud offre prestazioni migliori rispetto alla modalità standalone (una singola configurazione Solr locale).

Requisiti

Scarica e installa Apache Solr:

Modalità SolrCloud

La modalità SolrCloud è consigliata per gli ambienti di produzione. In modalità SolrCloud, SolrCloud deve essere installato e configurato prima di installare MLS (Multilingual Search).

La raccomandazione è di seguire le istruzioni di SolrCloud da installare:

  • 3 nodi SolrCloud sullo stesso server.
  • Uno ZooKeeper Apache esterno.

Si consiglia inoltre di configurare JVM per ottimizzare l'utilizzo della memoria e la raccolta dei rifiuti.

Esempio di configurazione JVM

JVM_OPTS="-server -Xmx2048m -XX:MaxPermSize=768M -XX:+UseConcMarkSweepGC -XX:+CMSClassUnloadingEnabled -Xloggc:../logs/gc.log -XX:+PrintGCDetails -XX:+PrintGCDateStamps -Djava.awt.headless=true"

Comandi di impostazione di SolrCloud

In modalità SolrCloud, prima dell'installazione di MLS è necessario utilizzare e conoscere i seguenti comandi di configurazione di SolrCloud.

1. Carica una configurazione in ZooKeeper

Riferimento:
https://cwiki.apache.org/confluence/display/solr/Command+Line+Utilities

Utilizzo:
sh./scripts/cloud-scripts/zkcli.sh
-cmd upconfig
-zkhost, server:porta
-confname *myconfig-name *
-solrhome solr-home path
-confdir config-dir

2. Creare una raccolta

Riferimento:
https://cwiki.apache.org/confluence/display/solr/Solr+Start+Script+Reference#SolrStartScriptReference-Create

Utilizzo:
./bin/solr create
-c mycollection-name
-d config-dir
-n myconfig-name
-p porta
-s numero di schede
-rf numero di repliche

Collegate una raccolta a una configurazione già caricata in ZooKeeper.

Riferimento:
https://cwiki.apache.org/confluence/display/solr/Command+Line+Utilities

Utilizzo:
sh./scripts/cloud-scripts/zkcli.sh
-cmd linkconfig
-zkhost, server:porta
-collection mycollection-name
-confname myconfig-name

Confronto tra standard e Advanced MLS

La ricerca multilingue (MLS) per AEM Communities è stata creata per la piattaforma Solr per fornire una ricerca migliore in tutte le lingue supportate, incluso l'inglese.

MLS per le comunità AEM è disponibile sia come standard MLS che come Advanced MLS. MLS standard include solo le impostazioni di configurazione Solr ed esclude eventuali plug-in o file di risorse. MLS avanzato è la soluzione più completa e include le impostazioni di configurazione Solr, i plug-in e le relative risorse

MLS standard include miglioramenti per la ricerca di contenuti per le seguenti lingue:

  • Inglese: È stato migliorato lo stemmer per cercare di far corrispondere le derivazioni di parole.
  • Giapponese: Miglioramento della personalizzazione giapponese per i caratteri a mezza larghezza.

MLS avanzate include miglioramenti per la ricerca di contenuti per le seguenti lingue:

  • Inglese: Sgombro sostituito con limmatizzatore.
  • Tedesco: Aggiunto decompositunder.
  • Francese: È stata aggiunta la gestione delle immagini.
  • Cinese (semplificato): È stato aggiunto un token più intelligente.
  • Varie lingue: È stato aggiunto uno stemmer, un elenco di parole di arresto e un normalizzatore.

In tutto, le seguenti 33 lingue sono supportate in Advanced MLS.

Arabo Tedesco Norvegese
Bulgaro Greco Polacco
Cinese (semplificato) Creolo haitiano Portoghese
Cinese (tradizionale) Ebraico Rumeno
Ceco Ungherese Russo
Danese Indonesiano Slovacco
Olandese Italiano Sloveno
Inglese Giapponese Spagnolo
Estone Coreano Svedese
Finlandese Lettone Thai
Francese Lituano Turco

Confronto tra AEM 6.1 Solr search, MLS standard e MLS avanzate

Nota: AEM 6.1 si riferisce al AEM 6.1 FP3 delle Comunità europee e versioni precedenti.

compare-solr-mls

Installazione di MLS standard

Per la raccolta SRP (MSRP o DSRP), per supportare la ricerca multilingue standard (MLS) è necessario modificare due dei file di configurazione di Solr:

  • schema.xml
  • solrconfig.xml

File MLS standard (schema.xml, solrconfig.xml) per Solr 4.10.

File MLS standard (schema.xml, solrconfig.xml) per Solr 5.x.

I file MLS standard vengono memorizzati nell'archivio AEM.

Nota: Mentre i file Solr sono memorizzati nella cartella msrp/, sono anche per DSRP (non sono necessarie modifiche).

Istruzioni di download: Sostituire solrX con solr4 o solr5 secondo necessità.

  1. Utilizzando CRXDE|Lite, individuare:

    • /libs/social/config/datastore/msrp/solrX/schema.xml
    • /libs/social/config/datastore/msrp/solrX/solrconfig.xml
  2. Scaricate il file nel server locale in cui è distribuito Solr.

    • Individuare la jcr:content proprietà del jcr:data nodo.
    • Selezionate view per avviare il download.
    • Assicurarsi che i file siano salvati con i nomi e la codifica appropriati (UTF8).
  3. Seguite le istruzioni di installazione per la modalità standalone o SolrCloud.

Modalità SolrCloud - MLS standard

  1. Installa e configura Solr in modalità SolrCloud.

  2. Preparare una nuova configurazione:

    1. Create new-config-dir*, ad esempio solr-install-dir*/myconfig/

    2. Copia il contenuto della directory di configurazione Solr esistente in new-config-dir

      • Per Solr4: copy solr-install-dir/example/solr/collection1/conf/
      • Per Solr5: copy solr-install-dir/server/solr/configsets/data_driven_schema_configs/
    3. Copiate schema.xml e solrconfig.xml scaricati in new-config-dir per sovrascrivere i file esistenti.

  3. Carica la nuova configurazione in ZooKeeper.

  4. Create una raccolta specificando i parametri necessari, ad esempio il numero di frammenti, il numero di repliche e il nome della configurazione.

  5. Se il nome di configurazione non è stato *fornito durante la creazione della raccolta, collegare la raccolta appena creata con la configurazione caricata in ZooKeeper.

  6. Per MSRP, eseguite MSRP Reindex Tool, a meno che non si tratti di una nuova installazione.

Modalità standalone - MLS standard

  1. Installare Solr in modalità standalone.

  2. Se eseguite Solr5, create una raccolta1 (simile a Solr4):

    • ./bin/solr start
    • ./bin/solr create_core -c collection1 -d sample_techproducts_configs
  3. Backup schema.xml e solrconfig.xml nella directory di configurazione Solr, ad esempio:

    • Per Solr4: solr-install-dir/example/solr/collection1/conf/
    • Creato per Solr5: solr-install-dir/server/solr/collection1/conf/
  4. Copiate i file schema.xml e solrconfig.xml scaricati nella stessa directory.

  5. Riavvia Solr.

  6. Per MSRP, eseguite MSRP Reindex Tool, a meno che non si tratti di una nuova installazione.

Installazione di MLS avanzate

Affinché l'insieme SRP (MSRP o DSRP) supporti MLS avanzati, sono necessari nuovi plug-in Solr, oltre a uno schema personalizzato e a una configurazione Solr. Tutti gli elementi richiesti vengono assemblati in un file zip scaricabile. Inoltre, è incluso uno script di installazione da utilizzare quando Solr viene distribuito in modalità standalone.

Per ottenere il pacchetto MLS avanzato, consultate AEM Advanced MLS nella sezione relativa alla distribuzione della documentazione.

Per iniziare a utilizzare l'installazione per SolrCloud o la modalità standalone:

  • Scarica AEM-SOLR-MLS archivio zip sul server in cui è installato Solr.
  • Estrarre l'archivio.

Modalità SolrCloud - MLS avanzate

Istruzioni di installazione - notare alcune differenze per Solr4 e Solr5:

  1. Installa e configura Solr in modalità SolrCloud.

  2. Estrarre su disco il contenuto del pacchetto MLS avanzato. Il contenuto deve includere:

    • schema.xml
    • solrconfig.xml
    • stopwords/ cartella
    • profili/ cartella
    • libs/ cartella
  3. Preparare una nuova configurazione:

    1. Crea una nuova configurazione-dir

      • Ad esempio solr-install-dir/myconfig/
      • Creare sottocartelle stopwords/ e lang/
    2. Copia il contenuto della directory di configurazione Solr esistente in new-config-dir

      • Per Solr4: Copia solr-install-dir/example/solr/collection1/conf/
      • Per Solr5: Copia solr-install-dir/server/solr/configsets/data_driven_schema_configs/
    3. Copiate schema.xml e solrconfig.xml estratti in new-config-dir per sovrascrivere i file esistenti.

    4. Per Solr5: Copia solr_install_dir/server/solr/configsets/sample_techproducts_configs/conf/lang/*.txt in new-config-dir/lang/

    5. Copiate le parole di arresto/cartella estratte in new-config-dir e ottenete new-config-dir/stopwords/*.txt

  4. Carica la nuova configurazione in ZooKeeper

  5. Copia i nuovi profili/ cartella …

    • Per Solr4: Copia nella cartella risorse/risorse di ciascun nodo
    • Per Solr5: Copiare nella cartella server/risorse/ di ogni installazione Solr. Se tutti i nodi si trovano nella stessa directory di installazione Solr, questo passaggio viene eseguito solo una volta.
  6. Crea una cartella lib/ nella directory solr-home (contiene solr.xml) di ciascun nodo in SolrCloud. Copiare le barre dalle seguenti posizioni nella nuova cartella lib/ su ciascun nodo:

    • libs/ extra estratti dal pacchetto MLS avanzato
    • solr-install-dir/citazione/estrazione/lib/.jar
    • solr-install-dir/dist/solr-cell.jar
    • solr-install-dir/Contributo/clustering/lib/.jar
    • solr-install-dir/dist/solr-clustering.jar
    • solr-install-dir/Contributo/langid/lib/.jar
    • solr-install-dir/dist/solr-langid.jar
    • solr-install-dir/citazione/velocità/lib/.jar
    • solr-install-dir/dist/solr-velocity.jar
    • solr-install-dir/citazione/analysis-extras/lib/.jar
    • solr-install-dir/contribuzione/analysis-extras/lucene-libs/.jar
  7. Create una raccolta specificando i parametri necessari, ad esempio il numero di frammenti, il numero di repliche e il nome della configurazione.

  8. Se il nome della configurazione non è stato fornito durante la creazione della raccolta, collegate la raccolta appena creata con la configurazione caricata in ZooKeeper.

  9. Per MSRP, eseguite MSRP Reindex Tool, a meno che non si tratti di una nuova installazione.

Modalità standalone - MLS avanzato

Uno script di installazione è incluso nel pacchetto MLS avanzato.

Dopo aver estratto il contenuto del pacchetto sul server che ospita il server Solr standalone, eseguite semplicemente lo script di installazione per installare le risorse e i file di configurazione necessari.

  • Installare Solr in modalità standalone.

  • Se eseguite Solr5, create una raccolta1 (simile a Solr4):

    • ./bin/solr start
    • ./bin/solr create_core -c collection1 -d sample_techproducts_configs
  • Eseguire lo script di installazione: Install [-v 4|5] - [-d solrhome] [-c percorso]di raccolta dove:

    • -d solrhome

      Directory di installazione Solr

    • -c percorso di raccolta

      Percorso raccolta in solr

    • –aiuto

      Stampa, opzioni della riga di comando

    • -v [4|5]

      Imposta versione per solr

  • Esempio per Solr 4.10.4:

    • Install.bat -v 4 -d c:/solr-4.10.4 -c c:/solr-4.10.4/example/solr/collection1
  • Esempio per Solr 5.4.0:

    • Install.sh -v 5 -d /tmp/solr-5.4.0 -c /tmp/solr-5.4.0/server/solr/collection1

Nota:

  • Lo script di installazione eseguirà il backup di schema.xml e solrconfig.xml prima di installare nuove versioni aggiungendo ".orig"

Informazioni su solrconfig.xml

Il file solrconfig.xml controlla l'intervallo di commit automatico e la visibilità della ricerca e richiederà test e tuning.

<autoCommit>: Per impostazione predefinita, l’intervallo di AutoCommit, che è un commit rigido per lo storage stabile, è impostato su 15 secondi. Per impostazione predefinita, la visibilità della ricerca utilizza l’indice di pre-commit.

Per modificare la ricerca in modo da utilizzare un indice aggiornato per riflettere le modifiche dovute al commit, imposta il contenuto openSearcher su true.

autoSoftCommit: Un commit 'soft' garantisce che le modifiche siano visibili (l'indice viene aggiornato), ma non garantisce che le modifiche siano sincronizzate su un archivio stabile (commit rigido). Il risultato è un miglioramento delle prestazioni. Per impostazione predefinita, autoSoftCommit è disabilitato con il contenuto maxTime impostato su -1.

In questa pagina