Einführung in die AEM-Plattform

Letzte Aktualisierung: 2023-07-04
  • Themen:
  • Deploying
    Weitere Informationen zu diesem Thema
  • Erstellt für:
  • Developer

Die AEM-Plattform in AEM 6 basiert auf Apache Jackrabbit Oak.

Apache Jackrabbit Oak implementiert ein skalierbares und leistungsstarkes, hierarchisches Inhalts-Repository, das als Grundlage für moderne, erstklassige Websites und andere anspruchsvolle Inhaltsanwendungen dienen soll.

Es handelt sich hierbei um die Nachfolgeversion von Jackrabbit 2 und die Lösung wird von AEM 6 als Standard-Backend für dessen Inhalts-Repository, CRX, verwendet.

Designrichtlinien und -ziele

Oak implementiert die JSR-283-Spezifikation (JCR 2.0). Die Hauptziele des Designs sind:

  • Bessere Unterstützung für große Repositorys
  • Mehrere verteilte Cluster-Knoten für hohe Verfügbarkeit
  • Bessere Leistung
  • Unterstützung für eine Vielzahl von untergeordneten Knoten und Zugriffssteuerungsebenen

Architekturkonzept

chlimage_1-84

Speicherung

Die Speicherschicht hat folgenden Zweck:

  • Implementieren des Baumstrukturmodells
  • Möglichkeit, Speicher anzuschließen
  • Bereitstellung eines Clustering-Mechanismus

Oak Core

Der Oak Core fügt mehrere Ebenen zur Speicherschicht hinzu:

  • Zugriffsstufenkontrollen
  • Suche und Indizierung
  • Beobachrung

Oak JCR

Das Hauptziel des Oak-JCR besteht darin, die JCR-Semantik in Strukturvorgängen zu transformieren. Darüber hinaus erfüllt es folgende Zwecke:

  • Implementieren der JCR-API
  • Enthält Commit-Hooks, die JCR-Einschränkungen implementieren

Darüber hinaus sind jetzt nicht-Java-basierte Implementierungen möglich, die Teil des Oak-JCR-Konzepts bilden.

Speicherübersicht

Die Oak-Speicherschicht bietet eine Abstraktionsebene für die tatsächliche Speicherung des Inhalts.

Derzeit stehen in AEM 6 zwei Speicher zur Verfügung: der TAR-Speicher und der MongoDB-Speicher.

Tar-Speicher

Der TAR-Speicher nutzt TAR-Dateien. Er speichert Inhalte als unterschiedliche Datensätze innerhalb größerer Segmente. Journale werden verwendet, um den aktuellen Status des Repositorys zu verfolgen.

Es gibt mehrere wichtige Design-Prinzipien, um die herum das System aufgebaut wurde:

  • Unveränderliche Segmente

Der Inhalt wird in Segmenten gespeichert, die bis zu 256 KB groß sein können. Sie sind unveränderlich, sodass häufig genutzte Segmente problemlos zwischengespeichert und Systemfehler vermieden werden, die das Repository beschädigen können.

Jedes Segment wird durch einen eindeutigen Bezeichner (Unique Identifier, UUID) identifiziert und enthält eine kontinuierliche Teilmenge der Inhaltsstruktur. Darüber hinaus können Segmente andere Inhalte referenzieren. Jedes Segment verwaltet eine Liste von UUIDs anderer referenzierter Segmente.

  • Lokalität

Verwandte Datensätze wie etwa ein Knoten und dessen unmittelbare, untergeordnete Elemente werden normalerweise im selben Segment gespeichert. Dadurch wird die Suche nach dem Repository beschleunigt, und es werden die meisten Cache-Fehler für typische Clients vermieden, die auf mehr als einen zugehörigen Knoten pro Sitzung zugreifen.

  • Kompaktheit

Die Formatierung von Datensätzen ist für die Größe optimiert, um E/A-Kosten zu reduzieren und so viel Inhalt wie möglich in Caches zu integrieren.

Mongo-Speicher

Der MongoDB-Speicher nutzt MongoDB für Sharding und Clustering. Die Repository-Struktur wird in einer MongoDB-Datenbank gespeichert, wobei jeder Knoten ein separates Dokument ist.

Sie weist mehrere Besonderheiten auf:

  • Revisionen

Bei jeder Aktualisierung (Commit) von Inhalten wird eine neue Revision erstellt. Eine Revision ist im Grunde eine Zeichenfolge, die aus drei Elementen besteht:

  1. Ein Zeitstempel, der von der Systemzeit des Geräts abgeleitet wird, auf dem er generiert wurde
  2. Ein Zähler, der Revisionen unterscheidet, die mit demselben Zeitstempel erstellt wurden
  3. Die ID des Clusterknotens, unter dem die Revision erstellt wurde
  • Verzweigungen

Verzweigungen werden unterstützt, was es dem Client ermöglicht, mehrfache Änderungen zu testen und sie mit einem einzigen Zusammenführungsaufruf sichtbar zu machen.

  • Frühere Dokumente

Der MongoDB-Speicher fügt bei jeder Änderung Daten zu einem Dokument hinzu. Daten werden jedoch nur gelöscht, wenn explizit eine Bereinigung ausgelöst wird. Alte Daten werden verschoben, wenn ein bestimmter Grenzwert erreicht wird. Frühere Dokumente enthalten nur unveränderliche Daten, d. h. sie enthalten nur übergebene und zusammengeführte Revisionen.

  • Metadaten des Cluster-Knotens

Daten zu aktiven und inaktiven Cluster-Knoten werden in der Datenbank gespeichert, um Cluster-Vorgänge zu erleichtern.

Eine typische AEM-Clusterkonfiguration mit MongoDB-Speicher:

chlimage_1-85

Was unterscheidet sich von Jackrabbit 2?

Da Oak abwärtskompatibel mit dem JCR 1.0-Standard ist, gibt es auf Benutzerebene fast keine Änderungen. Es gibt jedoch einige merkliche Unterschiede, die Sie beim Einrichten einer Oak-basierten AEM-Installation berücksichtigen müssen:

  • Indizes in Oak werden nicht automatisch erstellt. Daher müssen bei Bedarf benutzerdefinierte Indizes erstellt werden.
  • Im Gegensatz zu Jackrabbit 2, wo Sitzungen immer den aktuellen Status des Repositorys angegeben, zeigen Oak-Sitzungen eine unveränderte Ansicht des Repositorys zum Zeitpunkt, an dem die Sitzung erfasst wurde. Der Grund dafür ist das MVCC-Modell, auf dem Oak basiert.
  • Same Name Siblings (SNS), d. h. untergeordnete Elemente mit demselben Namen, werden in Oak nicht unterstützt.

Weitere Informationen zur AEM-Plattform finden Sie in den folgenden Artikeln:

Auf dieser Seite