Catalog Service översikt

Catalog Service är registersystemet för dataplatser och datalinje inom Adobe Experience Platform. Alla data som är inkapslade i Experience Platform lagras i Data Lake som filer och kataloger, men Catalog innehåller metadata och beskrivning av dessa filer och kataloger i söknings- och övervakningssyfte.

Kort och gott: Catalog fungerar som ett metadataarkiv eller "katalog" där du kan hitta information om dina data i Experience Platform. Du kan använda Catalog för att besvara följande frågor:

  • Var finns mina data?
  • I vilket skede av bearbetningen befinner sig dessa data?
  • Vilka system eller processer har använt mina data?
  • Hur mycket data har bearbetats?
  • Vilka fel uppstod under bearbetningen?

Catalog innehåller ett RESTful-API som gör att du kan hantera Platform metadata med hjälp av grundläggande CRUD-åtgärder. Mer information finns i Katalogutvecklarhandboken.

Catalog och Experience Platform tjänster

Resurserna som Catalog Service spår används av flera Experience Platform-tjänster. För att få ut så mycket som möjligt av Catalog’s-funktionerna rekommenderar vi att du lär dig mer om dessa tjänster och hur de interagerar med Catalog.

Experience Data Model (XDM) System

Experience Data Model (XDM) System är det standardiserade ramverk som Platform organiserar kundupplevelsedata. Experience Platform utnyttjar XDM-scheman för att beskriva datastrukturen på ett konsekvent och återanvändbart sätt.

När data hämtas till Platform mappas datastrukturen till ett XDM-schema och lagras i Data Lake som en del av en datauppsättning. Metadata för varje datauppsättning spåras av Catalog Service, som innehåller en referens till XDM-schemat som datauppsättningen följer.

Mer allmän information om XDM System finns i XDM System overview.

Data Ingestion

Experience Platform importerar data från flera källor och behåller poster som datauppsättningar i Data Lake. Catalog spårar metadata för dessa datauppsättningar, oavsett källa eller metod för intaget.

När du använder gruppbearbetningsmetoden spårar Catalog även ytterligare metadata för gruppfiler. Batchar är dataenheter som består av en eller flera filer som ska importeras som en enda enhet. Catalog spårar metadata för dessa gruppfiler samt de datauppsättningar som de sparas i efter inmatning. Batchmetadata innehåller information om antalet poster som har importerats samt eventuella poster som misslyckades och associerade felmeddelanden.

Mer information finns i översikten över dataöverföring.

Catalog objekt

Som framgår av föregående avsnitt spårar Catalog metadata för flera typer av resurser och åtgärder som används av andra Platform-tjänster. Catalog har ett eget arkiv med"objekt" som kapslar in dessa metadata. Catalog -objekt är sökbara representationer av Platform data som gör att du kan söka efter, övervaka och etikettera data utan att behöva komma åt själva data.

I följande tabell visas de olika objekttyper som stöds av Catalog:

Objekt API-slutpunkt Definition
Konto /accounts Autentiseringsuppgifter måste anges när du skapar källanslutningar. Ett konto representerar en samling autentiseringsuppgifter som användes för att skapa en anslutning av en viss typ. Varje anslutning har en uppsättning unika parametrar som bevaras av Catalog och skyddas i en Azure Key Vault.
Grupp /batches Batchar är dataenheter som består av en eller flera filer som ska importeras som en enda enhet. Ett batchobjekt i Catalog visar batchens användningsmått (till exempel antalet poster som bearbetas eller storleken på disken) och kan även innehålla länkar till datauppsättningar, vyer och andra resurser som påverkats av batchåtgärden.
Anslutning /connections En anslutning är en enda instans av en källanslutning som är unik för din organisation och konfigurerad med lämpliga autentiseringsuppgifter för anslutningstypen.
Koppling /connectors Kopplingar definierar hur källanslutningar ska samla in data från andra Adobe-program (till exempel Adobe Analytics och Adobe Audience Manager), molnlagringskällor från tredje part (till exempel Azure Blob, Amazon S3, FTP-servrar och SFTP-servrar) och CRM-system från tredje part (till exempel Microsoft Dynamics och Salesforce).
Datauppsättning /dataSets En datauppsättning är en lagrings- och hanteringskonstruktion som används för datainsamling (vanligtvis en tabell) som innehåller ett schema (kolumner) och fält (rader). Mer information finns i översikten Datamängder.
Datauppsättningsfil /datasetFiles Datauppsättningsfiler representerar datablock som har sparats på Platform. Som poster för litterala filer är det här du kan hitta filens storlek, antalet poster som den innehåller och en referens till den grupp som importerade filen.

Nästa steg

Det här dokumentet innehåller en introduktion till Catalog Service och hur det fungerar i det större omfånget Experience Platform. I Catalog utvecklarhandboken finns anvisningar om hur du interagerar med de olika slutpunkterna i det Catalog API:t. Vi rekommenderar att du också hänvisar till guiden filtrera katalogdata för att följa bästa praxis för att begränsa vilka data som returneras i API-svar.

På denna sida