Gebruiksscenario's voor indexeren van eikenrun.jar oak-run-jar-indexing-use-cases

De eiken-looppas steunt het indexeren van gebruiksgevallen op de bevellijn zonder het moeten de uitvoering van deze gebruiksgevallen door middel van AEM JMX console ordenen.

De overkoepelende voordelen van het gebruiken van de eak-looppas.jar de bevelbenadering van het indexbevel voor het beheren van indexen van het Eak zijn:

  1. De opdracht Indexeren wordt uitgevoerd en biedt een nieuwe indexeringsgereedschapset voor AEM 6.4.
  2. De eik-run vermindert tijd-aan-herdex die herindextijden op grotere bewaarplaatsen vermindert.
  3. Door de onderbreking vermindert u het verbruik van bronnen tijdens het opnieuw indexeren in AEM, wat resulteert in betere systeemprestaties.
  4. Oak-run zorgt voor out-of-band herindexering, ondersteunende situaties waarin productie beschikbaar moet zijn, en kan onderhoud of downtime die anders vereist is om opnieuw te indexeren, niet tolereren.

Secties hieronder bieden voorbeeldopdrachten. De opdracht voor het uitvoeren van een index ondersteunt alle NodeStore- en BlobStore-instellingen. De voorbeelden hieronder zijn rond montages die FileDataStore en SegmentNodeStore hebben.

Hoofdlettergebruik 1 - Consistentiecontrole index usercase1indexconsistencycheck

Dit is een gebruiksgeval met betrekking tot indexcorruptie. Soms was het niet mogelijk om te bepalen welke indexen corrupt zijn. Daarom heeft de Adobe instrumenten verstrekt die:

  1. voert indexconsistentiecontroles op alle indexen uit en verstrekt een rapport waarop indexen geldig zijn en die ongeldig zijn;
  2. De werktuigen zijn ook bruikbaar als AEM niet toegankelijk is;
  3. Het is gebruiksvriendelijk.

Controleren op beschadigde indexen kan worden uitgevoerd door --index-consistency-check bewerking:

java -jar oak-run*.jar index --fds-path=/path/to/datastore  /path/to/segmentstore/ --index-consistency-check

Hiermee wordt een rapport gegenereerd in indexing-result/index-consistency-check-report.txt. Zie hieronder voor een voorbeeldrapport:

Valid indexes :
        - /content/oak:index/enablementResourceName
        - /oak:index/cqProjectLucene
        - /oak:index/cqTagLucene
        - /oak:index/lucene
        - /oak:index/ntBaseLucene
        - /oak:index/socialLucene
    Invalid indexes :
        - /oak:index/atDamIndex
        - /oak:index/atIndex
        - /oak:index/cqPageLucene
        - /oak:index/damAssetLucene
        - /oak:index/groups
        - /oak:index/slingeventJob
        - /oak:index/users
        - /oak:index/workflowDataLucene
    Ignored indexes as these are not of type lucene:
        - /oak:index/acPrincipalName
        - /oak:index/active

Voordelen uc1benefits

Dit hulpmiddel kan nu door Steun en de Beheerder van het Systeem worden gebruikt om snel te bepalen welke indexen corrupt zijn en dan hen opnieuw te indexeren.

Hoofdlettergebruik 2 - Indexstatistieken usecase2indexstatistics

Voor het diagnostiseren van sommige gevallen rond de Adobe van vraagprestaties vereiste vaak bestaande indexdefinitie, op index betrekking hebbende statistieken van de klantenopstelling. Tot dusverre werd deze informatie verspreid over meerdere bronnen. Om het oplossen van problemen gemakkelijker te maken, heeft de Adobe tooling gecreeerd die zal:

  1. Alle indexdefinitie in het systeem in één JSON-bestand dumpen.

  2. Belangrijke statistieken uit bestaande indexen dumpen;

  3. de inhoud van de pompindex voor offline analyse;

  4. Is bruikbaar zelfs als AEM niet toegankelijk is

De bovenstaande bewerkingen kunnen nu worden uitgevoerd met de volgende opdrachten voor de bewerkingsindex:

  • --index-info - Verzamelt en dumpt diverse statistieken met betrekking tot indexen

  • --index-definitions - Verzamelt en dumpt indexdefinities

  • --index-dump - Dumpingindex-inhoud

Zie hieronder een voorbeeld van hoe de bevelen in de praktijk werken:

java -jar oak-run*.jar index --fds-path=/path/to/datastore  /path/to/segmentstore/ --index-info --index-definitions --index-dump

De verslagen worden opgesteld in indexing-result/index-info.txt en indexing-result/index-definitions.json

Bovendien worden de zelfde details verstrekt door middel van de Console van het Web en zouden deel van de configuratiedumpit zip uitmaken. Ze kunnen op de volgende locatie worden benaderd:

https://serverhost:serverport/system/console/status-oak-index-defn

Voordelen uc2benefits

Dit hulpmiddel laat het verzamelen van alle vereiste details met betrekking tot het indexeren of vraagkwesties toe snel en vermindert de tijd besteed in het halen van deze informatie.

Hoofdlettergebruik 3 - opnieuw indexeren usecase3reindexing

Afhankelijk van de scenario'sSoms moet opnieuw indexeren worden uitgevoerd. Op dit moment wordt het opnieuw indexeren uitgevoerd door het instellen van de optie reindex markeren naar true in de knoop van de indexdefinitie door middel van CRXDE of als gebruikersinterface van de Manager van de Index. Nadat de markering is ingesteld, wordt het opnieuw indexeren asynchroon uitgevoerd.

Enkele punten die u wilt opmerken bij het opnieuw indexeren:

  • Opnieuw indexeren gaat veel langzamer DocumentNodeStore instellingen vergeleken met SegmentNodeStore instellingen waar alle inhoud lokaal is;

  • Met het huidige ontwerp, terwijl het opnieuw indexeren gebeurt, wordt async indexer geblokkeerd en alle andere async indexen worden verouderd en niet bijgewerkt tijdens het indexeren. Daarom kunnen gebruikers, als het systeem in gebruik is, geen bijgewerkte resultaten zien;

  • Bij de herindexering wordt de gehele gegevensopslagruimte doorkruist, wat een grote belasting kan betekenen voor de installatie van de AEM en zo van invloed kan zijn op de gebruikerservaring.

  • Voor een DocumentNodeStore installatie waar herindexering veel tijd in beslag kan nemen, als de verbinding met de Mongo-database halverwege de bewerking mislukt, moet de indexering vanaf nul opnieuw worden opgestart;

  • Soms kan het opnieuw indexeren veel tijd in beslag nemen door het extraheren van tekst. Dit is specifiek voor instellingen met veel PDF-bestanden, waarbij de tijd die aan tekstextractie wordt besteed invloed kan hebben op de indexatietijd.

Om deze doelstellingen te bereiken, steunt het werktuig-looppas van de indexindex verschillende wijzen voor het opnieuw indexeren die kunnen worden gebruikt zoals vereist. De opdracht voor indexeren met eikenuitvoering biedt de volgende voordelen:

  • out-of-band herindexering - het opnieuw omdraaien van de eik kan los van de AEM worden uitgevoerd, zodat de gevolgen voor de AEM in gebruik tot een minimum worden beperkt;

  • rennen buiten de rijstrook - De herindexering vindt plaats zonder gevolgen voor indexeringsbewerkingen. Dit betekent dat de asynchrone indexeerder andere indexen kan blijven indexeren;

  • Vereenvoudigde herindex voor DocumentNodeStore-installaties - Voor DocumentNodeStore installaties, herindexering kan worden uitgevoerd met één opdracht die ervoor zorgt dat herindexering op de meest optimale manier wordt uitgevoerd;

  • Ondersteunt het bijwerken van indexdefinities en het introduceren van nieuwe indexdefinities

Opnieuw indexeren - DocumentNodeStore reindexdocumentnodestore

Voor DocumentNodeStore installaties die opnieuw worden gecomprimeerd, kunnen worden uitgevoerd met één enkele opdracht voor het uitvoeren van een storing:

java -jar oak-run*.jar index --reindex --index-paths=/oak:index/lucene --read-write --fds-path=/path/to/datastore mongodb://server:port/aem

Dit biedt de volgende voordelen:

  • Minimale invloed op het uitvoeren van AEM instanties. De meeste leest kan van secundaire servers worden gedaan en het lopen AEM de geheime voorgeheugens worden niet nadelig beïnvloed wegens al die traversal die voor het opnieuw indexeren wordt vereist;
  • Gebruikers kunnen ook een JSON van een nieuwe of bijgewerkte index opgeven via de --index-definitions-file -optie.

Opnieuw indexeren - SegmentNodeStore reindexsegmentnodestore

Voor SegmentNodeStore installaties voor herkoppeling kunnen op een van de volgende manieren worden uitgevoerd :

Online opnieuw indexeren - SegmentNodeStore onlinereindexsegmentnodestore

Volg de vastgestelde manier waarop het opnieuw indexeren door middel van plaatsbepaling wordt gedaan reindex markering.

Online opnieuw indexeren - SegmentNodeStore - De AEM-instantie wordt uitgevoerd onlinereindexsegmentnodestoretheaeminstanceisrunning

Voor SegmentNodeStore installaties, kan slechts één proces tot segmentdossiers op read-write wijze toegang hebben. Daarom moeten er voor sommige bewerkingen in de indexering van eikels handmatige extra stappen worden gezet.

Dit zou het volgende inhouden:

  1. Staptekst

  2. Verbind de oak-run naar dezelfde gegevensopslagruimte die door AEM in alleen-lezen modus wordt gebruikt, en indexeren. Een voorbeeld van hoe u dit kunt bereiken:

    code language-shell
    java -jar oak-run-1.7.6.jar index --fds-path=/Users/dhasler/dev/cq/quickstart/target/crx-quickstart/repository/datastore/ --checkpoint 26b7da38-a699-45b2-82fb-73aa2f9af0e2 --reindex --index-paths=/oak:index/lucene /Users/dhasler/dev/cq/quickstart/target/crx-quickstart/repository/segmentstore/
    
  3. Importeer ten slotte de gemaakte indexbestanden via de IndexerMBean#importIndex bewerking vanaf het pad waar de indexeringsbestanden zijn opgeslagen nadat de bovenstaande opdracht is uitgevoerd.

In dit scenario, moet u niet de server van de AEM tegenhouden of om het even welke nieuwe instantie verstrekken. Als indexering echter gepaard gaat met een verplaatsing van de hele opslagplaats, zou de I/O-belasting van de installatie toenemen, wat negatieve gevolgen zou hebben voor de prestaties bij uitvoering.

Online opnieuw indexeren - SegmentNodeStore - de AEM instantie is gesloten onlinereindexsegmentnodestoreaeminstanceisdown

Voor SegmentNodeStore installaties, kan het opnieuw indexeren door één enkele eiken-loopbevel worden gedaan. De AEM instantie moet echter worden afgesloten.

U kunt het opnieuw indexeren met het volgende bevel teweegbrengen:

java -jar oak-run*.jar index --reindex --index-paths=/oak:index/lucene --read-write --fds-path=/path/to/datastore  /path/to/segmentstore/

Het verschil tussen deze aanpak en de hierboven beschreven aanpak is dat het maken van controlepunten en het importeren van indexen automatisch worden uitgevoerd. Het nadeel is dat AEM tijdens het proces omlaag moet zijn.

Opnieuw indexeren buiten bandbreedte - SegmentNodeStore outofbandreindexsegmentnodestore

In dit geval kunt u opnieuw indexeren op een gekloonde instelling om de invloed op de actieve AEM te minimaliseren:

  1. Een controlepunt maken door middel van een JMX-bewerking. Je kunt dit doen door naar de JMX-console en zoek naar CheckpointManager. Klik vervolgens op de knop createCheckpoint(long p1) een bewerking waarbij een hoge waarde wordt gebruikt voor de vervaldatum in seconden (bijvoorbeeld 2592000).

  2. De crx-quickstart naar een nieuwe computer

  3. Herindexeren uitvoeren met de opdracht Indexeren op einde

  4. De gegenereerde indexbestanden kopiëren naar AEM server

  5. Importeer de indexbestanden via JMX.

In dit geval wordt aangenomen dat de Data Store toegankelijk is op een andere instantie die mogelijk niet mogelijk is FileDataStore wordt geplaatst op een op cloud gebaseerde opslagoplossing zoals EBS. Dit sluit het scenario uit waarin FileDataStore is ook gekloond. Als de indexdefinitie geen fullText indexeren uitvoert, dan toegang tot DataStore is niet vereist.

Hoofdlettergebruik 4 - Indexdefinities bijwerken usecase4updatingindexdefinitions

U kunt indexdefinitiewijzigingen momenteel verzenden door ACS Verzeker Index pakket. Hierdoor kunnen de indexdefinities worden verzonden door middel van een inhoudspakket waarvoor later opnieuw indexeren moet worden uitgevoerd door het instellen van de reindex markeren naar true.

Dit werkt goed voor kleinere installaties waar het opnieuw indexeren niet lang duurt. Voor grote gegevensbanken gebeurt herindexering echter veel langer. In dergelijke gevallen kunnen we nu de werkset voor indexen die op een eikel worden uitgevoerd, gebruiken.

Oak-looppas steunt nu het verstrekken van indexdefinities in formaat JSON en de verwezenlijking van index in out-of-band wijze waar geen veranderingen op een levende instantie worden uitgevoerd.

Voor dit gebruiksgeval moet u rekening houden met het volgende:

  1. Een ontwikkelaar werkt de indexdefinities op een lokale instantie bij en genereert vervolgens een JSON-indexdefinitiebestand via de --index-definitions option

  2. De bijgewerkte JSON wordt vervolgens aan de systeembeheerder gegeven

  3. Systeembeheerder volgt de out-of-band-benadering en bereidt de index voor op een andere installatie

  4. Nadat dit wordt voltooid, worden de geproduceerde indexdossiers ingevoerd op een lopende AEM installatie.

recommendation-more-help
19ffd973-7af2-44d0-84b5-d547b0dffee2