Lösa återkommande fel av typen SegmentNotFoundException i AEM Publish-instanser

Ett återkommande SegmentNotFoundException-fel orsakar att Adobe Experience Manager (AEM) Publish-instanser kraschar och slutar svara. Databaskontrollerna visar att inga fel har uppstått och problemet kvarstår efter omstarten. Problemet inträffar under underhållsaktiviteter som revisionsrensning och skräpinsamling i datalager på grund av felaktig trådhantering. Problemet åtgärdas genom att trådhantering växlas från Java native ThreadPool till Sling-provided ThreadPoolManager .

Beskrivning description

Miljö

Adobe Experience Manager (AEM) On-Premises, v6.5.22.0

Problem/symtom

  • Felet SegmentNotFoundException visas upprepade gånger i AEM Publish-instansloggarna.
  • AEM Publish-instansen kraschar och slutar svara.
  • Kontinuerlig fellogggenerering orsakar allvarlig disk-I/O-blockering.
  • Konsekvenskontroll av databaser med hjälp av körningsrapport om skador eller strukturella problem.
  • Problemet återkommer efter att AEM har startats om, även när underhållsåtgärder har schemalagts utanför kontorstid eller tillfälligt inaktiverats.

Upplösning resolution

Följ de här stegen för att lösa problemet:

  1. Granska sessionshanteringen i din egen kod och stäng alla databassessioner efter användningen.
  2. Schemalägg rensning av revisioner och skräpinsamling för datalager utanför kontorstid för att minska konflikterna.
  3. Gå till JMX-konsolen på /system/console/jmx och kontrollera SessionStatistics MBeans för långa eller inaktiva sessioner. Använd InitStackTrace för att identifiera anpassade kodursprung.
  4. Ersätt Java-inbyggt ThreadPool med Sling-provided ThreadPoolManager för alla bakgrundsprocesser i AEM-tjänster.
  5. Starta om AEM Publish-instansen när du har implementerat ändringarna.
  6. Övervaka felloggar i flera dagar för att bekräfta SegmentNotFoundException visas inte längre.
  7. Verifiera att databasåtgärderna är stabila och felfria.

Ytterligare överväganden:

  • Databasintegritetskontroller med hjälp av ekningskörning rapporterar konsekventa felfria noder och egenskaper, vilket anger att inga strukturella fel förekommer.
  • Problemet kan inte lösas genom att inaktivera revisionsrensning eller köra offlinekomprimering. Korrekt trådhantering krävs.
  • Manuella alternativ för borttagning av noder kanske inte gäller om FileDataStore har konfigurerats. Bekräfta alltid databasens hälsa innan du försöker utföra manuella åtgärder.

Relaterad läsning

recommendation-more-help
3d58f420-19b5-47a0-a122-5c9dab55ec7f