Innehållssökning och indexering indexing
Ändringar i AEM as a Cloud Service changes-in-aem-as-a-cloud-service
Med AEM as a Cloud Service går Adobe från en AEM instanscentrerad modell till en tjänstebaserad vy med n-x AEM Containers, som drivs av CI/CD-ledningar i Cloud Manager. I stället för att konfigurera och underhålla index för enskilda AEM måste indexkonfigurationen anges före en distribution. Konfigurationsförändringar i produktionen bryter helt klart CI/CD-reglerna. Detsamma gäller för indexändringar eftersom det kan påverka systemets stabilitet och prestanda om det inte anges, testas och omindexeras innan de börjar produceras.
Nedan finns en lista över de viktigaste ändringarna jämfört med AEM 6.5 och tidigare versioner:
- Användare har inte åtkomst till Indexhanteraren för en enskild AEM instans för att felsöka, konfigurera eller underhålla indexering längre. Det används endast för lokal utveckling och lokal driftsättning.
- Användare ändrar inte index för en enskild AEM och behöver inte längre bekymra sig om konsekvenskontroller eller omindexering.
- I allmänhet inleds indexändringar innan produktionen påbörjas för att inte kringgå kvalitetsgatewayer i Cloud Manager CI/CD-pipelines och inte påverka affärs-KPI:er i produktionen.
- Alla relaterade mätvärden, inklusive sökresultat i produktion, är tillgängliga för kunder vid körning för att ge en helhetsbild av ämnen som sökning och indexering handlar om.
- Kunderna kan skapa varningar efter behov.
- SRE övervakar systemets hälsa dygnet runt, alla dagar i veckan och åtgärder vidtas så tidigt som möjligt.
- Indexkonfigurationen ändras via distributioner. Ändringar av indexdefinitioner konfigureras på samma sätt som andra innehållsändringar.
- På en hög nivå i AEM as a Cloud Service, med introduktionen av den löpande distributionsmodellen, finns det två uppsättningar index: en för den gamla versionen och en för den nya versionen.
- Kunderna kan se om indexeringsjobbet är klart på Cloud Manager byggsida och får ett meddelande när den nya versionen är klar för trafik.
Begränsningar:
- För närvarande stöds bara indexhantering på AEM as a Cloud Service för index av typen
lucene
. - Endast standardanalysatorer stöds (det vill säga analysatorer som levereras tillsammans med produkten). Anpassade analysatorer stöds inte.
- Internt kan andra index konfigureras och användas för frågor. Frågor som är skrivna mot indexet
damAssetLucene
kan till exempel köras mot en Elasticsearch-version av indexet på Skyline. Skillnaden är vanligtvis inte synlig för programmet och användaren, men vissa verktyg, som funktionenexplain
, rapporterar ett annat index. Skillnader mellan Lucene-index och Elastic Index finns i den elastiska dokumentationen i Apache Jackrabbit Oak. Kunderna behöver inte, och kan inte, konfigurera Elasticsearch-index direkt. - Sökning med liknande funktionsvektorer (
useInSimilarity = true
) stöds inte.
Använda how-to-use
Indexdefinitioner kan kategoriseras i tre primära användningsområden:
- Lägg till en ny anpassad indexdefinition.
- Uppdatera en befintlig indexdefinition genom att lägga till en ny version.
- Ta bort en indexdefinition som inte längre behövs.
För båda punkterna 1 och 2 ovan måste du skapa en indexdefinition som en del av din anpassade kodbas i respektive Cloud Manager-releaseplan. Mer information finns i dokumentationen för Distribuera till AEM as a Cloud Service.
Indexnamn index-names
En indexdefinition kan delas in i någon av följande kategorier:
-
OTB-index (Out-of-the-box). Till exempel:
/oak:index/cqPageLucene-2
eller/oak:index/damAssetLucene-8
. -
Anpassning av ett OOTB-index. Dessa indikeras genom att lägga till
-custom-
följt av en numerisk identifierare till det ursprungliga indexnamnet. Till exempel:/oak:index/damAssetLucene-8-custom-1
. -
Helt anpassat index: Det går att skapa ett helt nytt index från grunden. Deras namn måste ha ett prefix för att namnkonflikter ska undvikas. Till exempel:
/oak:index/acme.product-1-custom-2
, där prefixet äracme.
dam:Asset
(särskilt fulltextindex) eftersom dessa kan stå i konflikt med OOTB-funktioner, vilket kan leda till funktions- och prestandaproblem. I allmänhet är tillägg av ytterligare egenskaper till den aktuella damAssetLucene-*
-indexversionen det lämpligaste sättet att indexera frågor på dam:Asset
-nodtypen (dessa ändringar sammanfogas automatiskt till en ny produktversion av indexet om det sedan släpps). Om du är osäker kan du kontakta Adobe Support för råd.Förbereder den nya indexdefinitionen preparing-the-new-index-definition
damAssetLucene-8
, kopierar du den senaste körklara indexdefinitionen från en Cloud Service-miljö med hjälp av CRX DE Package Manager (/crx/packmgr/
). Byt namn på den till damAssetLucene-8-custom-1
(eller senare) och lägg till dina anpassningar i XML-filen. Detta säkerställer att de nödvändiga konfigurationerna inte tas bort av misstag. Exempelvis krävs noden tika
under /oak:index/damAssetLucene-8/tika
i det anpassade indexet som distribueras till en AEM Cloud Service-miljö, men den finns inte på den lokala AEM SDK:n.Om du vill anpassa ett OOTB-index skapar du ett nytt paket som innehåller den faktiska indexdefinitionen som följer namnmönstret:
<indexName>-<productVersion>-custom-<customVersion>
Om du vill skapa ett helt anpassat index skapar du ett nytt indexdefinitionspaket som innehåller indexdefinitionen som följer namnmönstret:
<prefix>.<indexName>-<productVersion>-custom-<customVersion>
properties.xml
-fil. properties.xml
skapas som standard i ett nytt paket och finns på <package_name>/META-INF/vault/properties.xml
:-
noIntermediateSaves=true
-
allowIndexDefinitions=true
Distribuera anpassade indexdefinitioner deploying-custom-index-definitions
För att illustrera distributionen av en anpassad version av det körklara indexet damAssetLucene-8
kommer vi att tillhandahålla en steg-för-steg-guide. I det här exemplet byter vi namn på det till damAssetLucene-8-custom-1
. Sedan är processen följande:
-
Skapa en ny mapp med det uppdaterade indexnamnet i katalogen
ui.apps
:- Exempel:
ui.apps/src/main/content/jcr_root/_oak_index/damAssetLucene-8-custom-1/
- Exempel:
-
Lägg till en konfigurationsfil
.content.xml
med anpassade konfigurationer i den skapade mappen. Nedan visas ett exempel på en anpassning:
Filnamn:ui.apps/src/main/content/jcr_root/_oak_index/damAssetLucene-8-custom-1/.content.xml
code language-xml <?xml version="1.0" encoding="UTF-8"?> <jcr:root xmlns:jcr="http://www.jcp.org/jcr/1.0" xmlns:dam="http://www.day.com/dam/1.0" xmlns:nt="http://www.jcp.org/jcr/nt/1.0" xmlns:oak="http://jackrabbit.apache.org/oak/ns/1.0" xmlns:rep="internal" jcr:mixinTypes="[rep:AccessControllable]" jcr:primaryType="oak:QueryIndexDefinition" async="[async,nrt]" compatVersion="{Long}2" evaluatePathRestrictions="{Boolean}true" includedPaths="[/content/dam]" maxFieldLength="{Long}100000" type="lucene"> <facets jcr:primaryType="nt:unstructured" secure="statistical" topChildren="100"/> <indexRules jcr:primaryType="nt:unstructured"> <dam:Asset jcr:primaryType="nt:unstructured"> <properties jcr:primaryType="nt:unstructured"> <cqTags jcr:primaryType="nt:unstructured" name="jcr:content/metadata/cq:tags" nodeScopeIndex="{Boolean}true" propertyIndex="{Boolean}true" useInSpellcheck="{Boolean}true" useInSuggest="{Boolean}true"/> </properties> </dam:Asset> </indexRules> <tika jcr:primaryType="nt:folder"> <config.xml jcr:primaryType="nt:file"/> </tika> </jcr:root>
-
Lägg till en post i FileVault-filtret i
ui.apps/src/main/content/META-INF/vault/filter.xml
:code language-xml <?xml version="1.0" encoding="UTF-8"?> <workspaceFilter version="1.0"> ... <filter root="/oak:index/damAssetLucene-8-custom-1"/> </workspaceFilter>
-
Lägg till en konfigurationsfil för Apache Tika i:
ui.apps/src/main/content/jcr_root/_oak_index/damAssetLucene-8-custom-1/tika/config.xml
:code language-xml <properties> <detectors> <detector class="org.apache.tika.detect.TypeDetector"/> </detectors> <parsers> <parser class="org.apache.tika.parser.DefaultParser"> <mime>text/plain</mime> </parser> </parsers> <service-loader initializableProblemHandler="ignore" dynamic="true"/> </properties>
-
Kontrollera att konfigurationen uppfyller riktlinjerna i avsnittet Projektkonfiguration. Gör nödvändiga anpassningar i enlighet med detta.
Projektkonfiguration
Vi rekommenderar starkt att du använder version >= 1.3.2
av Jackrabbit filevault-package-maven-plugin
. Så här implementerar du den i ditt projekt:
-
Uppdatera versionen på den översta nivån
pom.xml
:code language-xml <plugin> <groupId>org.apache.jackrabbit</groupId> <artifactId>filevault-package-maven-plugin</artifactId> ... <version>1.3.2</version> ... </plugin>
-
Lägg till följande på den översta nivån
pom.xml
:code language-xml <jackrabbit-packagetype> <options> <immutableRootNodeNames>apps,libs,oak:index</immutableRootNodeNames> </options> </jackrabbit-packagetype>
Här är ett exempel på projektets
pom.xml
-fil på den översta nivån med de tidigare konfigurationerna:Filnamn:
pom.xml
code language-xml <plugin> <groupId>org.apache.jackrabbit</groupId> <artifactId>filevault-package-maven-plugin</artifactId> ... <version>1.3.2</version> <configuration> ... <validatorsSettings> <jackrabbit-packagetype> <options> <immutableRootNodeNames>apps,libs,oak:index</immutableRootNodeNames> </options> </jackrabbit-packagetype> ... ... </plugin>
-
I
ui.apps/pom.xml
ochui.apps.structure/pom.xml
är det nödvändigt att aktivera alternativenallowIndexDefinitions
ochnoIntermediateSaves
ifilevault-package-maven-plugin
. Om du aktiverarallowIndexDefinitions
tillåts anpassade indexdefinitioner, medannoIntermediateSaves
ser till att konfigurationerna läggs till automatiskt.Filnamn:
ui.apps/pom.xml
ochui.apps.structure/pom.xml
code language-xml <plugin> <groupId>org.apache.jackrabbit</groupId> <artifactId>filevault-package-maven-plugin</artifactId> <configuration> <allowIndexDefinitions>true</allowIndexDefinitions> <properties> <cloudManagerTarget>none</cloudManagerTarget> <noIntermediateSaves>true</noIntermediateSaves> </properties> ... </plugin>
-
Lägg till ett filter för
/oak:index
iui.apps.structure/pom.xml
:code language-xml <filters> ... <filter><root>/oak:index</root></filter> </filters>
När du har lagt till den nya indexdefinitionen distribuerar du det nya programmet med Cloud Manager. Distributionen initierar två jobb som ansvarar för att lägga till (och sammanfoga om det behövs) indexdefinitionerna i MongoDB och Azure Segment Store för författare respektive publicering. Före bytet omindexeras de underliggande databaserna med de uppdaterade indexdefinitionerna.
Indexhantering med rullande distributioner index-management-using-rolling-deployments
Vad är indexhantering? what-is-index-management
Indexhantering handlar om att lägga till, ta bort och ändra index. Det går snabbt att ändra definition för ett index, men det tar lång tid att tillämpa ändringen (kallas ofta"skapa ett index" eller"omindexering" för befintliga index). Det är inte omedelbart: databasen måste genomsökas för att data ska kunna indexeras.
Vad är rullande distributioner? what-are-rolling-deployments
En rullande driftsättning kan minska driftstoppen. Det ger även inga driftavbrott och ger snabba återställningar. Den gamla versionen av programmet körs samtidigt som den nya versionen av programmet.
Skrivskyddade och skrivskyddade områden read-only-and-read-write-areas
Vissa delar av databasen (skrivskyddade delar av databasen) kan vara olika i den gamla och den nya versionen av programmet. De skrivskyddade områdena i databasen är vanligtvis /app
och /libs
. I följande exempel används kursiv för att markera skrivskyddade områden, medan fetstil används för skrivskyddade områden.
- /
- /apps (skrivskyddad)
- /content
- /libs (skrivskyddad)
- /oak:index
- /oak:index/acme.
- /jcr:system
- /system
- /var
Databasens läs- och skrivområden delas mellan alla programversioner, medan det för varje programversion finns en specifik uppsättning av /apps
och /libs
.
Indexhantering utan rullande distributioner index-management-without-rolling-deployments
Under utvecklingen, eller när du använder lokala installationer, kan index läggas till, tas bort eller ändras under körningen. Index används när de är tillgängliga. Om ett index ännu inte används i den gamla versionen av programmet skapas det vanligtvis under en schemalagd driftstopp. Samma sak händer när du tar bort ett index eller ändrar ett befintligt index. När du tar bort ett index blir det otillgängligt när det tas bort.
Indexhantering med rullande distributioner index-management-with-rolling-deployments
Med rullande driftsättningar sker inga driftavbrott. Under en uppdatering körs både den gamla versionen (till exempel version 1) av programmet och den nya versionen (version 2) samtidigt mot samma databas. Om version 1 kräver att ett visst index är tillgängligt får detta index inte tas bort i version 2. Indexet bör tas bort senare, t.ex. i version 3, där det är garanterat att version 1 av programmet inte längre körs. Dessutom bör program skrivas så att version 1 fungerar bra, även om version 2 körs, och om det finns index för version 2.
När uppgraderingen till den nya versionen är klar kan gamla index samlas in av systemet. De gamla indexen kan fortfarande finnas kvar en tid för att påskynda återställningen (om en återställning behövs).
Följande tabell visar fem indexdefinitioner: index cqPageLucene
används i båda versionerna medan index damAssetLucene-custom-1
bara används i version 2.
<indexName>-custom-<customerVersionNumber>
krävs för att AEM as a Cloud Service ska kunna markera det som en ersättning för ett befintligt index.Versionsnumret ökas stegvis varje gång indexvärdet ändras. För att undvika att egna indexnamn kolliderar med indexnamnen för själva produkten måste anpassade index och ändringar i körklara index sluta med -custom-<number>
.
Ändringar av färdiga index changes-to-out-of-the-box-indexes
När Adobe har ändrat ett index som inte finns med i kartongen, som "damAssetLucene" eller "cqPageLucene", skapas ett nytt index med namnet damAssetLucene-2
eller cqPageLucene-2
. Om indexet redan har anpassats sammanfogas den anpassade indexdefinitionen med ändringarna i det körklara indexet, vilket visas nedan. Ändringarna sammanfogas automatiskt. Det innebär att du inte behöver göra något om ett index som inte finns i kartongen ändras. Det går dock att anpassa indexet igen senare.
Det är viktigt att tänka på att miljöer kan finnas i olika AEM versioner. Miljön dev
är till exempel på version X+1
medan scenen och produkten fortfarande är på version X
och väntar på att uppgraderas till version X+1
efter att obligatoriska tester på dev
har utförts. Om releasen X+1
innehåller en nyare version av ett produktindex som har anpassats och en ny anpassning av det indexet krävs, kommer följande tabell att förklara vilka versioner som behöver ställas in i miljöer baserade på AEM:
Aktuella begränsningar current-limitations
Indexhantering stöds bara för index av typen lucene
, med compatVersion
inställt på 2
. Internt kan andra index konfigureras och användas för frågor, till exempel Elasticsearch-index. Frågor som skrivs mot indexet damAssetLucene
kan i AEM as a Cloud Service köras mot en Elasticsearch-version av det här indexet. Den här skillnaden är osynlig för programanvändaren, men vissa verktyg som funktionen explain
rapporterar ett annat index. Skillnader mellan index för Lucene och Elasticsearch finns i dokumentationen för Elasticsearch i Apache Jackrabbit Oak. Kunder kan inte och behöver inte konfigurera Elasticsearch-index direkt.
Endast inbyggda analysatorer stöds (det vill säga analysatorer som levereras tillsammans med produkten). Anpassade analysatorer stöds inte.
Indexering av innehållet i /oak:index
stöds inte för närvarande.
För bästa prestanda bör index inte vara alltför stora. Den totala storleken för alla index kan användas som vägledning. Om den här storleken ökar med mer än 100 % efter att anpassade index har lagts till och standardindex har justerats i en utvecklingsmiljö, bör anpassade indexdefinitioner justeras. AEM as a Cloud Service kan förhindra användning av index som skulle påverka systemets stabilitet och prestanda negativt.
Lägga till ett index adding-an-index
Om du vill lägga till ett helt anpassat index med namnet /oak:index/acme.product-custom-1
, som ska användas i en ny version av programmet och senare, måste indexet konfigureras på följande sätt:
acme.product-1-custom-1
Den här konfigurationen fungerar genom att en anpassad identifierare försätts i indexnamnet, följt av en punkt (.
). Identifieraren ska vara mellan 2 och 5 tecken lång.
Som ovan säkerställer den här konfigurationen att indexet bara används av den nya versionen av programmet.
Ändra ett index changing-an-index
När ett befintligt index ändras måste ett nytt index läggas till med den ändrade indexdefinitionen. Anta till exempel att det befintliga indexet /oak:index/acme.product-custom-1
har ändrats. Det gamla indexet lagras under /oak:index/acme.product-custom-1
och det nya indexet lagras under /oak:index/acme.product-custom-2
.
I den gamla versionen av programmet används följande konfiguration:
/oak:index/acme.product-custom-1
I den nya versionen av programmet används följande (ändrade) konfiguration:
/oak:index/acme.product-custom-2
Ångra en ändring undoing-a-change
Ibland behöver du ångra en ändring i en indexdefinition. Detta kan bero på ett oavsiktligt fel eller på att ändringen inte längre behövs. Ta till exempel indexdefinitionen damAssetLucene-8-custom-3,
som av misstag har skapats och redan har distribuerats. Därför vill du återgå till den tidigare indexdefinitionen, damAssetLucene-8-custom-2.
. För att uppnå detta måste du infoga ett nytt index med namnet damAssetLucene-8-custom-4
som innehåller definitionen från det tidigare indexet, damAssetLucene-8-custom-2.
.
Ta bort ett index removing-an-index
Följande gäller bara för anpassade index. Produktindex kan inte tas bort eftersom de används av AEM.
Ett anpassat index kan tas bort i en senare version av kundapplikationen genom att det tas bort från kunddatabasen. Ett index som tas bort från databasen används inte för frågor i AEM även om det kan finnas i instanserna under en tid. Det finns en rensningsmekanism som körs regelbundet och som rensar äldre versioner av index från instanserna.
Optimeringar av index och frågor index-query-optimizations
Med Apache Jackrabbit Oak kan du hantera sökfrågor effektivt med hjälp av flexibla indexkonfigurationer. Index är särskilt viktiga för större databaser. Se till att alla frågor backas upp av ett lämpligt index. Frågor utan lämpligt index kan läsa tusentals noder, som sedan loggas som en varning.
Mer information om hur frågor och index kan optimeras finns i det här dokumentet.