Catalog Service-overzicht
Catalog Service is het recordsysteem voor de gegevenslocatie en -lijn in Adobe Experience Platform. Hoewel alle gegevens die in Experience Platform worden opgenomen, in Data Lake als bestanden en mappen worden opgeslagen, bevat Catalog de metagegevens en een beschrijving van deze bestanden en mappen voor opzoekings- en controledoeleinden.
Eenvoudig gesteld, Catalog dienst als meta-gegevensopslag of "catalogus"waar u informatie over uw gegevens binnen Experience Platform kunt vinden. U kunt Catalog gebruiken om de volgende vragen te beantwoorden:
- Waar bevinden mijn gegevens zich?
- In welk stadium van verwerking bevinden deze gegevens zich?
- Welke systemen of processen hebben op mijn gegevens gehandeld?
- Hoeveel gegevens zijn verwerkt?
- Welke fouten zijn tijdens de verwerking opgetreden?
Catalog biedt een RESTful-API waarmee u Platform -metagegevens programmatisch kunt beheren met behulp van standaard-CRUD-bewerkingen. Zie de de ontwikkelaarsgids van de Catalogusvoor meer informatie.
Catalog en Experience Platform services
De bronnen die Catalog Service tracks gebruiken, worden door meerdere Experience Platform -services gebruikt. Als u de mogelijkheden van Catalog’s optimaal wilt benutten, is het raadzaam bekend te raken met deze services en te weten hoe deze werken met Catalog .
Experience Data Model (XDM)-systeem
Experience Data Model (XDM) System is het gestandaardiseerde framework waarmee Platform gegevens over de klantervaring organiseert. Experience Platform gebruikt XDM-schema's om de gegevensstructuur op een consistente en herbruikbare manier te beschrijven.
Wanneer gegevens in Platform worden opgenomen, wordt de structuur van die gegevens toegewezen aan een XDM-schema en in Data Lake opgeslagen als onderdeel van een dataset. De meta-gegevens voor elke dataset worden gevolgd door Catalog Service, die een verwijzing naar het XDM schema omvat dat de dataset met in overeenstemming is.
Voor meer algemene informatie over Systeem XDM, gelieve te zien het XDM overzicht van het Systeem.
Data Ingestion
Experience Platform neemt gegevens van veelvoudige bronnen op en handhaaft verslagen als datasets binnen Data Lake. Catalog volgt de meta-gegevens voor deze datasets, ongeacht hun bron of methode van opname.
Wanneer u de batchinvoermethode gebruikt, worden in Catalog ook aanvullende metagegevens voor batchbestanden bijgehouden. Batches zijn gegevenseenheden die bestaan uit een of meer bestanden die als één eenheid moeten worden ingevoerd. Catalog volgt de meta-gegevens voor deze partijdossiers, evenals de datasets zij binnen na opname worden voortgeduurd. De meta-gegevens van de partij omvatten informatie over het aantal met succes opgenomen verslagen, evenals om het even welke ontbroken verslagen en bijbehorende foutenmeldingen.
Zie het overzicht van de gegevensopnamevoor meer informatie.
Catalog objecten
Zoals in de vorige sectie wordt beschreven, houdt Catalog metagegevens bij voor verschillende soorten bronnen en bewerkingen die door andere Platform -services worden gebruikt. Catalog behoudt een eigen opslagruimte van 'objecten' die deze metagegevens inkapselen. Catalog -objecten zijn queryable-representaties van Platform -gegevens waarmee u gegevens kunt zoeken, controleren en labelen zonder dat u toegang hoeft te krijgen tot de gegevens zelf.
In de volgende tabel worden de verschillende objecttypen weergegeven die worden ondersteund door Catalog :
/batches
/dataSets
/datasetFiles
Volgende stappen
Dit document biedt een inleiding tot Catalog Service en de manier waarop het werkt binnen het grotere bereik van Experience Platform . Zie de Catalog ontwikkelaarsgidsvoor stappen bij het in wisselwerking staan met de verschillende eindpunten van dat Catalog API. Het wordt geadviseerd dat u ook naar de gids op het filtreren gegevens van de Catalogusverwijst om beste praktijken te volgen voor het beperken van de gegevens die in API reacties zijn teruggekeerd.