Catalog Service-overzicht

Catalog Service is het recordsysteem voor de gegevenslocatie en -lijn in Adobe Experience Platform. Hoewel alle gegevens die in Experience Platform worden opgenomen, in Data Lake als bestanden en mappen worden opgeslagen, bevat Catalog de metagegevens en een beschrijving van deze bestanden en mappen voor opzoekings- en controledoeleinden.

Eenvoudig gesteld, Catalog dienst als meta-gegevensopslag of "catalogus"waar u informatie over uw gegevens binnen Experience Platform kunt vinden. U kunt Catalog gebruiken om de volgende vragen te beantwoorden:

  • Waar bevinden mijn gegevens zich?
  • In welk stadium van verwerking bevinden deze gegevens zich?
  • Welke systemen of processen hebben op mijn gegevens gehandeld?
  • Hoeveel gegevens zijn verwerkt?
  • Welke fouten zijn tijdens de verwerking opgetreden?

Catalog biedt een RESTful-API waarmee u Platform -metagegevens programmatisch kunt beheren met behulp van standaard-CRUD-bewerkingen. Zie de de ontwikkelaarsgids van de Catalogusvoor meer informatie.

Catalog en Experience Platform services

De bronnen die Catalog Service tracks gebruiken, worden door meerdere Experience Platform -services gebruikt. Als u de mogelijkheden van Catalog’s optimaal wilt benutten, is het raadzaam bekend te raken met deze services en te weten hoe deze werken met Catalog .

Experience Data Model (XDM)-systeem

Experience Data Model (XDM) System is het gestandaardiseerde framework waarmee Platform gegevens over de klantervaring organiseert. Experience Platform gebruikt XDM-schema's om de gegevensstructuur op een consistente en herbruikbare manier te beschrijven.

Wanneer gegevens in Platform worden opgenomen, wordt de structuur van die gegevens toegewezen aan een XDM-schema en in Data Lake opgeslagen als onderdeel van een dataset. De meta-gegevens voor elke dataset worden gevolgd door Catalog Service, die een verwijzing naar het XDM schema omvat dat de dataset met in overeenstemming is.

Voor meer algemene informatie over Systeem XDM, gelieve te zien het XDM overzicht van het Systeem.

Data Ingestion

Experience Platform neemt gegevens van veelvoudige bronnen op en handhaaft verslagen als datasets binnen Data Lake. Catalog volgt de meta-gegevens voor deze datasets, ongeacht hun bron of methode van opname.

Wanneer u de batchinvoermethode gebruikt, worden in Catalog ook aanvullende metagegevens voor batchbestanden bijgehouden. Batches zijn gegevenseenheden die bestaan uit een of meer bestanden die als één eenheid moeten worden ingevoerd. Catalog volgt de meta-gegevens voor deze partijdossiers, evenals de datasets zij binnen na opname worden voortgeduurd. De meta-gegevens van de partij omvatten informatie over het aantal met succes opgenomen verslagen, evenals om het even welke ontbroken verslagen en bijbehorende foutenmeldingen.

Zie het overzicht van de gegevensopnamevoor meer informatie.

Catalog objecten

Zoals in de vorige sectie wordt beschreven, houdt Catalog metagegevens bij voor verschillende soorten bronnen en bewerkingen die door andere Platform -services worden gebruikt. Catalog behoudt een eigen opslagruimte van 'objecten' die deze metagegevens inkapselen. Catalog -objecten zijn queryable-representaties van Platform -gegevens waarmee u gegevens kunt zoeken, controleren en labelen zonder dat u toegang hoeft te krijgen tot de gegevens zelf.

In de volgende tabel worden de verschillende objecttypen weergegeven die worden ondersteund door Catalog :

Object
API-eindpunt
Definitie
Batch
/batches
Batches zijn gegevenseenheden die bestaan uit een of meer bestanden die als één eenheid moeten worden ingevoerd. Een batchobject in Catalog beschrijft de innamemetriek van de batch (zoals het aantal verwerkte records of de grootte op schijf) en kan ook koppelingen bevatten naar gegevenssets, weergaven en andere bronnen die door de batchbewerking zijn beïnvloed.
Gegevensset
/dataSets
Een dataset is een opslag en beheersconstructie die voor de inzameling van gegevens (typisch een lijst) wordt gebruikt die een schema (kolommen) en gebieden (rijen) bevat. Zie het overzicht van datasetsvoor meer informatie.
Gegevensbestand
/datasetFiles
Gegevensbestanden vertegenwoordigen gegevensblokken die zijn opgeslagen op Platform . Als verslagen van letterlijke dossiers, zijn deze waar u de grootte van het dossier, het aantal verslagen kunt vinden het bevat, en een verwijzing naar de partij die het dossier opnam.

Volgende stappen

Dit document biedt een inleiding tot Catalog Service en de manier waarop het werkt binnen het grotere bereik van Experience Platform . Zie de Catalog ontwikkelaarsgidsvoor stappen bij het in wisselwerking staan met de verschillende eindpunten van dat Catalog API. Het wordt geadviseerd dat u ook naar de gids op het filtreren gegevens van de Catalogusverwijst om beste praktijken te volgen voor het beperken van de gegevens die in API reacties zijn teruggekeerd.

recommendation-more-help
c5c02be6-79a3-4a2f-b766-136bffe8b676