Die AEM-Plattform in AEM 6 basiert auf Apache Jackrabbit Oak.
Apache Jackrabbit Oak implementiert ein skalierbares und leistungsstarkes, hierarchisches Inhalts-Repository, das als Grundlage für moderne, erstklassige Websites und andere anspruchsvolle Inhaltsanwendungen dienen soll.
Es ist die Nachfolgerin von Jackrabbit 2 und wird von AEM 6 als Standard-Backend für sein Inhalts-Repository CRX verwendet.
Oak implementiert die JSR-283-Spezifikation (JCR 2.0). Die wichtigsten Designziele der Lösung sind wie folgt:
Die Speicherschicht erfüllt folgende Zwecke:
Der Oak-Kern fügt mehrere Ebenen zur Speicherschicht hinzu:
Das Hauptziel des Oak-JCR besteht darin, die JCR-Semantik in Strukturvorgängen zu transformieren. Darüber hinaus erfüllt es folgende Zwecke:
Darüber hinaus sind jetzt nicht-Java-basierte Implementierungen möglich, die Teil des Oak-JCR-Konzepts bilden.
Die Oak-Speicherschicht stellt eine Abstraktionsschicht für die tatsächliche Speicherung der Inhalte bereit.
Zurzeit sind in AEM6 zwei Speicherimplementierungen verfügbar: Tar-Speicher und MongoDB Storage.
Der TAR-Speicher nutzt TAR-Dateien. Er speichert Inhalte als unterschiedliche Datensätze innerhalb größerer Segmente. Journale dienen dazu, den aktuellen Status des Repositorys zu verfolgen.
Diesem Speichertyp liegen mehrere zentrale Designrichtlinien zugrunde:
Die Inhalte werden in Segmenten von bis zu 256 KB gespeichert. Sie sind unveränderlich, sodass häufig genutzte Segmente problemlos zwischengespeichert und Systemfehler vermieden werden, die das Repository beschädigen können.
Jedes Segment wird durch einen eindeutigen Bezeichner (Unique Identifier, UUID) identifiziert und enthält eine kontinuierliche Teilmenge der Inhaltsstruktur. Darüber hinaus können Segmente andere Inhalte referenzieren. Jedes Segment verwaltet eine Liste von UUIDs anderer referenzierter Segmente.
Verwandte Datensätze wie etwa ein Knoten und dessen unmittelbare, untergeordnete Elemente werden normalerweise im selben Segment gespeichert. Dadurch kann das Repository sehr schnell durchsucht werden. Zudem werden die meisten Cache-Fehler für typische Clients vermieden, die pro Sitzung auf mehr als einen verwandten Knoten zugreifen.
Die Formatierung der Datensätze wurde bezüglich der Größe optimiert, um die I/O-Kosten zu senken und möglichst viele Inhalte in Caches zwischenzuspeichern.
Der MongoDB-Speicher nutzt MongoDB für Sharding und Clustering. Die Repository-Struktur wird in einer MongoDB-Datenbank gespeichert, wobei jeder Knoten ein separates Dokument ist.
Dieser Speichertyp weist mehrere Besonderheiten auf:
Bei jeder Aktualisierung (Commit) von Inhalten wird eine neue Revision erstellt. Im Wesentlichen ist eine Revision eine Zeichenfolge, die aus drei Elementen besteht:
Es werden Verzweigungen unterstützt, damit Clients mehrere Änderungen bereitstellen und mit einem einzigen Zusammenführungsaufruf sichtbar machen können.
Der MongoDB-Speicher fügt bei jeder Änderung Daten zu einem Dokument hinzu. Daten werden jedoch nur gelöscht, wenn explizit eine Bereinigung ausgelöst wird. Alte Daten werden verschoben, wenn ein bestimmter Grenzwert erreicht wird. Vorherige Dokumente enthalten nur unveränderliche Daten, d. h. sie enthalten nur übergebene und zusammengeführte Revisionen.
Daten zu aktiven und inaktiven Clusterknoten werden in der Datenbank gespeichert, um Cluster-Vorgänge zu vereinfachen.
Eine typische AEM-Clusterkonfiguration mit MongoDB-Speicher:
Da Oak für Abwärtskompatibilität mit dem JCR 1.0-Standard entwickelt wurde, gibt es auf Benutzerebene so gut wie keine Änderungen. Beim Konfigurieren einer Oak-basierten AEM-Installation muss jedoch eine Reihe wichtiger Änderungen berücksichtigt werden:
Weitere Informationen zur AEM-Plattform finden Sie zudem in den nachfolgenden Artikeln: