Catalog ServiceÜbersicht

Catalog Service ist ein Aufzeichnungssystem für Speicherort und Herkunft von Daten in Experience Platform. Während alle Daten, die in Experience Platform aufgenommen werden, im Data Lake als Dateien und Ordner gespeichert werden, enthält Catalog die Metadaten und Beschreibungen dieser Dateien und Ordner für die Suche und Überwachung.

Einfach ausgedrückt: Catalog fungiert als Metadatenspeicher oder "Katalog", in dem Sie Informationen zu Ihren Daten in Experience Platform finden können. Sie können Catalog verwenden, um die folgenden Fragen zu beantworten:

  • Wo befinden sich meine Daten?
  • Auf welcher Stufe der Verarbeitung befinden sich diese Daten?
  • Welche Systeme oder Prozesse haben Aktionen auf meine Daten ausgeführt?
  • Wie viele Daten wurden erfolgreich verarbeitet?
  • Welche Fehler sind bei der Verarbeitung aufgetreten?

Catalog stellt eine RESTful-API bereit, mit der Sie Platform Metadaten programmgesteuert mithilfe einfacher CRUD-Vorgänge verwalten können. Weitere Informationen finden Sie im Katalog-Service-Entwicklerhandbuch.

Catalog und Experience Platform Dienstleistungen

Die Ressourcen, die von Catalog Service verfolgt werden, werden von mehreren Experience Platform-Diensten verwendet. Um die Funktionen von Catalog’s optimal nutzen zu können, sollten Sie sich mit diesen Diensten und ihrer Interaktion mit Catalog vertraut machen.

Experience Data Model (XDM) System

Experience Data Model (XDM) System ist das standardisierte Framework, mit dem Kundenerlebnisdaten Platform organisiert werden. Experience PlatformXDM-Schemas dienen in zur konsistenten und wiederverwendbaren Beschreibung der Struktur von Daten.

Wenn Daten in Platform aufgenommen werden, wird die Struktur dieser Daten einem XDM-Schema zugeordnet und im Data Lake-Datensatz gespeichert. Die Metadaten für jeden Datensatz werden von Catalog Service verfolgt, was einen Verweis auf das XDM-Schema enthält, dem der Datensatz entspricht.

Informationen zum XDM-System im Allgemeinen finden Sie in der Übersicht über das XDM-System.

Data Ingestion

Experience Platform erfasst Daten aus mehreren Quellen und speichert Datensätze als Datensätze innerhalb der Data Lake. Catalog verfolgt die Metadaten für diese Datensätze, unabhängig von ihrer Quelle oder Methode der Erfassung.

Bei Verwendung der Stapelverarbeitungsmethode verfolgt Catalog auch zusätzliche Metadaten für Stapeldateien. Batches sind Dateneinheiten aus einer oder mehreren Dateien, die als Ganzes aufgenommen werden. Catalog verfolgt die Metadaten für diese Stapeldateien sowie die Datensätze, in denen sie nach der Erfassung beibehalten werden. Batch-Metadaten umfassen Informationen zur Anzahl der erfolgreich aufgenommenen Datensätze sowie zu fehlgeschlagenen Datensätzen und zugehörige Fehlermeldungen.

Weitere Informationen finden Sie in der Datenerfassung – Übersicht.

Catalog Objekte

Wie im vorherigen Abschnitt erläutert, verfolgt Catalog Metadaten für verschiedene Arten von Ressourcen und Vorgängen, die von anderen Platform-Diensten verwendet werden. Catalog verwaltet einen eigenen Speicher von "Objekten", die diese Metadaten kapseln. Catalog Objekte sind abfragliche Darstellungen von Platform Daten, mit denen Sie Ihre Daten suchen, überwachen und beschriften können, ohne selbst auf die Daten zugreifen zu müssen.

Die folgende Tabelle zeigt die verschiedenen Objekttypen, die von Catalog unterstützt werden:

Objekt API-Endpunkt Definition
Konto /accounts Beim Erstellen von Quellverbindungen müssen Authentifizierungsberechtigungen angegeben werden. Ein Konto ist eine Sammlung von Anmeldeinformationen, die zur Authentifizierung für das Herstellen einer Verbindung bestimmten Typs verwendet wurden. Jede Verbindung verfügt über einen Satz eindeutiger Parameter, die von Catalog beibehalten und in einem Azure Key Vault gesichert werden.
Batch /batches Batches sind Dateneinheiten aus einer oder mehreren Dateien, die als Ganzes aufgenommen werden. Ein Stapelobjekt in Catalog zeigt die Erfassungsmetriken des Stapels an (z. B. die Anzahl der verarbeiteten Datensätze oder die Größe auf der Festplatte) und kann auch Links zu Datensätzen, Ansichten und anderen Ressourcen enthalten, die von dem Stapelvorgang betroffen waren.
Verbindung /connections Eine Verbindung ist eine einzelne Instanz eines Quell-Connectors, die für Ihr Unternehmen eindeutig ist und unter Verwendung der entsprechenden Anmeldeinformationen zur Authentifizierung für den Connector-Typ konfiguriert wurde.
Connector /connectors Connectors definieren, wie Quellverbindungen Daten aus anderen Anwendungen der Adobe (z. B. Adobe Analytics und Adobe Audience Manager), Cloud-Datenspeicherung von Drittanbietern (z. B. Azure Blob, Amazon S3, FTP-Server und SFTP-Server) und CRM-Systemen von Drittanbietern (z. B. Microsoft Dynamics und Salesforce) erfassen sollen.
Datensatz /dataSets Ein Datensatz ist ein Konstrukt zur Datenspeicherung und -verwaltung, in dem Daten (in der Regel) in einer Tabelle erfasst werden, die ein Schema (Spalten) und Felder (Zeilen) beinhaltet. Weitere Informationen finden Sie unter Übersicht über Datensätze.
Datensatzdatei /datasetFiles Datenbearbeitungsdateien stellen Datenblöcke dar, die unter Platform gespeichert wurden. Sie stellen Aufzeichnungen von Literaldateien und liefern als solches Informationen zur Dateigröße, zur Anzahl der darin enthaltenen Datensätze und einen Verweis auf den Batch, in dem die Datei aufgenommen wurde.

Nächste Schritte

Dieses Dokument gab eine Einführung in Catalog Service und wie es im größeren Bereich von Experience Platform funktioniert. Anweisungen zur Interaktion mit den verschiedenen Endpunkten dieser Catalog-API finden Sie im Catalog Entwicklerhandbuch. Es wird empfohlen, auch das Handbuch zum Thema Filtern von Katalogdaten durchzugehen, da darin Best Practices für die Beschränkung der in API-Antworten zurückgegebenen Daten erläutert werden.

Auf dieser Seite