Configurazione Solr per SRP

Solr for AEM Platform

Un'installazione Apache Solr può essere condivisa tra archivio nodi (Oak) e store comune (SRP) utilizzando raccolte diverse.

Se le raccolte Oak e SRP vengono utilizzate intensamente, per motivi di prestazioni potrebbe essere installato un secondo Solr.

Per gli ambienti di produzione, la modalità SolrCloud offre prestazioni migliori rispetto alla modalità standalone (una singola configurazione Solr locale).

Requisiti

Scarica e installa Apache Solr:

Modalità SolrCloud

La modalità SolrCloudmode è consigliata per gli ambienti di produzione. In modalità SolrCloud, SolrCloud deve essere installato e configurato prima di installare MLS (Multilingual Search).

La raccomandazione è di seguire le istruzioni di SolrCloud da installare:

  • 3 nodi SolrCloud sullo stesso server
  • Un Apache ZooKeeper esterno

Si consiglia inoltre di configurare JVM per ottimizzare l'utilizzo della memoria e la raccolta dei rifiuti.

Esempio di configurazione JVM

JVM_OPTS="-server -Xmx2048m -XX:MaxPermSize=768M -XX:+UseConcMarkSweepGC -XX:+CMSClassUnloadingEnabled -Xloggc:../logs/gc.log -XX:+PrintGCDetails -XX:+PrintGCDateStamps -Djava.awt.headless=true"  

Comandi di installazione di SolrCloud

In modalità SolrCloud, prima dell'installazione di MLS è necessario utilizzare e conoscere i seguenti comandi di configurazione di SolrCloud.

1. Carica una configurazione in ZooKeeper

Riferimento:
https://cwiki.apache.org/confluence/display/solr/Command+Line+Utilities

Utilizzo:
sh./scripts/cloud-scripts/zkcli.sh \
-cmd upconfig \
-zkhost server:porta \
-confname *myconfig-name *\
-solrhome solr-home-path \
-confdir config-dir

2. Creare una raccolta

Riferimento:
https://cwiki.apache.org/confluence/display/solr/Solr+Start+Script+Reference#SolrStartScriptReference-Create

Utilizzo:
./bin/solr create \
-c mycollection-name\
-d config-dir \
-n myconfig-name \
-p porta\
-s numero di frammenti \
-rf numero di repliche

Collegate una raccolta a una configurazione già caricata in ZooKeeper.

Riferimento:
https://cwiki.apache.org/confluence/display/solr/Command+Line+Utilities

Utilizzo:
sh./scripts/cloud-scripts/zkcli.sh \
-cmd linkconfig \
-zkhost server:porta \
-collection mycollection-name \
-confname myconfig-name

Confronto tra MLS standard e avanzato

La ricerca multilingue (MLS) per AEM Communities è stata creata per la piattaforma Solr per fornire una ricerca migliore in tutte le lingue supportate, incluso l'inglese.

MLS per le comunità AEM è disponibile sia come standard MLS che come Advanced MLS. MLS standard include solo le impostazioni di configurazione Solr ed esclude eventuali plug-in o file di risorse. MLS avanzato è la soluzione più completa e include le impostazioni di configurazione Solr, i plug-in e le relative risorse

MLS standard include miglioramenti per la ricerca di contenuti per le seguenti lingue:

  • Inglese: è stato migliorato lo stemmer per cercare di far corrispondere le derivazioni di parole
  • Giapponese: miglioramento della personalizzazione giapponese per i caratteri a mezza larghezza

MLS avanzate include miglioramenti per la ricerca di contenuti per le seguenti lingue:

  • Inglese: stelo sostituito con un limmatore
  • Tedesco: decompositore aggiunto
  • Francese: aggiunta della manipolazione delle linee
  • Cinese (semplificato): aggiunta di uno token più intelligente
  • Varie lingue: aggiunto uno stemmer, un elenco di parole di arresto e un normalizzatore.

In tutto, le seguenti 33 lingue sono supportate in Advanced MLS.

Arabo Tedesco Norvegese
Bulgaro Greco Polacco
Cinese (semplificato) Creolo haitiano Portoghese
Cinese (tradizionale) Ebraico Rumeno
Ceco Ungherese Russo
Danese Indonesiano Slovacco
Olandese Italiano Sloveno
Inglese Giapponese Spagnolo
Estone Coreano Svedese
Finlandese Lettone Thai
Francese Lituano Turco

Confronto tra AEM 6.1 Solr search, Standard MLS e Advanced MLS

Nota: AEM 6.1 si riferisce al AEM 6.1 FP3 delle Comunità europee e versioni precedenti.

chlimage_1-283

Installazione di MLS standard

Per la raccolta SRP (MSRP o DSRP), per supportare la ricerca multilingue standard (MLS) è necessario modificare due dei file di configurazione di Solr:

  • schema.xml
  • solrconfig.xml

File MLS standard (schema.xml, solrconfig.xml) per Solr 4.10

File MLS standard (schema.xml, solrconfig.xml) per Solr 5

I file MLS standard vengono memorizzati nell'archivio AEM.

Nota: Mentre i file Solr sono memorizzati nella cartella msrp/, sono anche per DSRP (non sono necessarie modifiche).

Istruzioni di download: sostituire solrX con solr4 o solr5 secondo necessità

  1. Utilizzando CRXDE|Lite, individuare

    • /libs/social/config/datastore/msrp/solrX/schema.xml
    • /libs/social/config/datastore/msrp/solrX/solrconfig.xml
  2. Scarica nel server locale in cui Solr è distribuito

    • Individuare la proprietà jcr:content del nodo jcr:data
    • Selezionare view per avviare il download
    • Assicurarsi che i file siano salvati con i nomi e la codifica appropriati (UTF8)
  3. Seguite le istruzioni di installazione per la modalità autonoma o SolrCloud

Modalità SolrCloud - MLS standard

  1. Installare e configurare Solr in modalità SolrCloud

  2. Preparare una nuova configurazione:

    1. Creare new-config-dir ad esempio solr-install-dir/myconfig/

    2. Copiare il contenuto della directory di configurazione Solr esistente in new-config-dir

      • Per Solr4: copiare solr-install-dir/example/solr/collection1/conf/*
      • Per Solr5: copiare solr-install-dir/server/solr/configsets/data_Driv_schema_configs/*
    3. Copiare schema.xml e solrconfig.xml scaricati in new-config-dir per sovrascrivere i file esistenti

  3. Carica la nuova configurazione in ZooKeeper

  4. Create una raccolta specificando i parametri necessari, ad esempio il numero di frammenti, il numero di repliche e il nome della configurazione.

  5. Se il nome di configurazione non è stato *fornito durante la creazione della raccolta, collegare la raccolta appena creata con la configurazione caricata su ZooKeeper

  6. Per MSRP, eseguire MSRP Reindex Tool, a meno che non si tratti di una nuova installazione

Modalità standalone - MLS standard

  1. Installare Solr in modalità standalone

  2. Se eseguite Solr5, create una raccolta1 (simile a Solr4):

    • ./bin/solr start
    • ./bin/solr create_core -c collection1 -d sample_techproducts_configs
  3. Eseguire il backup di schema.xml e solrconfig.xml nella directory di configurazione Solr, ad esempio:

    • Per Solr4: solr-install-dir/example/solr/collection1/conf/
    • Creato per Solr5: solr-install-dir/server/solr/collection1/conf/
  4. Copiare nella stessa directory schema.xml e solrconfig.xml scaricati

  5. Riavvia Solr

  6. Per MSRP, eseguire MSRP Reindex Tool, a meno che non si tratti di una nuova installazione

Installazione di MLS avanzate

Affinché l'insieme SRP (MSRP o DSRP) supporti MLS avanzati, sono necessari nuovi plug-in Solr, oltre a uno schema personalizzato e a una configurazione Solr. Tutti gli elementi richiesti vengono assemblati in un file zip scaricabile. Inoltre, è incluso uno script di installazione da utilizzare quando Solr viene distribuito in modalità standalone.

Per ottenere il pacchetto MLS avanzato, vedere AEM MLS avanzate nella sezione relativa alla distribuzione della documentazione.

Per iniziare a utilizzare l'installazione per SolrCloud o la modalità standalone:

  • Scarica AEM-SOLR-MLS archivio zip sul server in cui è installato Solr
  • Estrarre l'archivio

Modalità SolrCloud - MLS avanzate

Istruzioni di installazione - notare alcune differenze per Solr4 e Solr5:

  1. Installare e configurare Solr in modalità SolrCloud

  2. Estrarre su disco il contenuto del pacchetto MLS avanzato. Il contenuto deve includere:

    • schema.xml
    • solrconfig.xml
    • stopwords/ folder
    • profili/ cartella
    • libs/ folder
  3. Preparare una nuova configurazione:

    1. Creare una nuova configurazione-dir

      • Ad esempio solr-install-dir/myconfig/
      • Creare sottocartelle stopwords/ e lang/
    2. Copiare il contenuto della directory di configurazione Solr esistente su new-config-dir

      • Per Solr4: copiare solr-install-dir/example/solr/collection1/conf/*
      • Per Solr5: copiare solr-install-dir/server/solr/configsets/data_Driv_schema_configs/*
    3. Copiare schema.xml e solrconfig.xml estratti in new-config-dir per sovrascrivere i file esistenti

    4. Per Solr5: Copiare solr_install_dir/server/solr/configsets/sample_techproducts_configs/conf/lang/*.txt" in new-config-dir/lang/

    5. Copiare la cartella stopwords/ estratta in new-config-dir con conseguente new-config-dir/stopwords/*.txt

  4. Carica la nuova configurazione in ZooKeeper

  5. Copiate la nuova cartella profile/

    • Per Solr4: Copia nella cartella risorse/risorse di ciascun nodo
    • Per Solr5: Copiare nella cartella server/risorse/ di ogni installazione Solr. Se tutti i nodi si trovano nella stessa directory di installazione Solr, questo passaggio viene eseguito solo una volta.
  6. Create una cartella lib/ nella directory solr-home (contiene solr.xml) di ciascun nodo in SolrCloud. Copiare le barre dalle seguenti posizioni nella nuova cartella lib/ su ciascun nodo:

    • libs extra/ estratto dal pacchetto MLS avanzato
    • solr-install-dir/citazione/estrazione/lib/.jar
    • solr-install-dir/dist/solr-cell.jar
    • solr-install-dir/Contributo/clustering/lib/.jar
    • solr-install-dir/dist/solr-clustering.jar
    • solr-install-dir/Contributo/langid/lib/.jar
    • solr-install-dir/dist/solr-langid.jar
    • solr-install-dir/citazione/velocità/lib/.jar
    • solr-install-dir/dist/solr-velocity.jar
    • solr-install-dir/citazione/analysis-extras/lib/.jar
    • solr-install-dir/contribuzione/analysis-extras/lucene-libs/.jar
  7. Create una raccolta specificando i parametri necessari, ad esempio il numero di frammenti, il numero di repliche e il nome della configurazione.

  8. Se il nome di configurazione era not fornito durante la creazione della raccolta, collegare la raccolta appena creata con la configurazione caricata su ZooKeeper

  9. Per MSRP, eseguire MSRP Reindex Tool, a meno che non si tratti di una nuova installazione

Modalità indipendente - MLS avanzate

Uno script di installazione è incluso nel pacchetto MLS avanzato.

Dopo aver estratto il contenuto del pacchetto sul server che ospita il server Solr standalone, eseguite semplicemente lo script di installazione per installare le risorse e i file di configurazione necessari.

  • Installare Solr in modalità standalone

  • Se eseguite Solr5, create una raccolta1 (simile a Solr4):

    • ./bin/solr start
    • ./bin/solr create_core -c collection1 -d sample_techproducts_configs
  • Eseguire lo script di installazione: Installazione di [-v 4|5] [-d solrhome] [-c collectionpath]
    dove:

    • -d solrhome

      Directory di installazione Solr

    • -c percorso di raccolta

      Percorso raccolta in solr

    • –aiuto

      Stampa, opzioni della riga di comando

    • -v [4|5]

      Imposta versione per solr

  • Esempio per Solr 4.10.4:

    • Install.bat -v 4 -d c:/solr-4.10.4 -c c:/solr-4.10.4/example/solr/collection1
  • Esempio per Solr 5.4.0:

    • Install.sh -v 5 -d /tmp/solr-5.4.0 -c /tmp/solr-5.4.0/server/solr/collection1

Nota:

  • Lo script di installazione eseguirà il backup di schema.xml e solrconfig.xml prima di installare nuove versioni aggiungendo ".orig"

Informazioni su solrconfig.xml

Il file solrconfig.xml controlla l'intervallo di commit automatico e la visibilità della ricerca e richiederà test e tuning.

<autocommit>: Per impostazione predefinita, l’intervallo di AutoCommit, che è un commit rigido per lo storage stabile, è impostato su 15 secondi. Per impostazione predefinita, la visibilità della ricerca utilizza l’indice di pre-commit.

Per modificare la ricerca in modo da utilizzare un indice aggiornato per riflettere le modifiche dovute al commit, imposta su true il contenuto <openSearcher>.

<autosoftcommit>: Un commit 'soft' garantisce che le modifiche siano visibili (l'indice viene aggiornato), ma non garantisce che le modifiche siano sincronizzate su un archivio stabile (commit rigido). Il risultato è un miglioramento delle prestazioni. Per impostazione predefinita, <autoSoftCommit> è disabilitato con il contenuto <maxTime> impostato su -1.

In questa pagina