Catalog Servicepanoramica

Catalog Service è il sistema di registrazione per la posizione e la derivazione dei dati in Adobe Experience Platform. Mentre tutti i dati acquisiti in Experience Platform vengono memorizzati in Data Lake come file e directory, Catalog contiene i metadati e la descrizione di tali file e directory a scopo di ricerca e monitoraggio.

In poche parole, Catalog funge da archivio di metadati o "catalogo", dove è possibile trovare informazioni sui dati all'interno di Experience Platform. Puoi utilizzare Catalog per rispondere alle seguenti domande:

  • Dove si trovano i miei dati?
  • In quale fase del trattamento si trovano questi dati?
  • Quali sistemi o processi hanno agito sui miei dati?
  • Quanti dati sono stati elaborati correttamente?
  • Quali errori si sono verificati durante l'elaborazione?

Catalog fornisce un’API RESTful che consente di gestire programmaticamente Platform i metadati utilizzando le operazioni CRUD di base. Per ulteriori informazioni, consulta la Guida per gli sviluppatori del catalogo .

Catalog e Experience Platform servizi

Le risorse che Catalog Service traccia vengono utilizzate da più servizi Experience Platform. Per sfruttare al massimo le funzionalità di Catalog’s, ti consigliamo di acquisire familiarità con questi servizi e con il modo in cui interagiscono con Catalog.

Experience Data Model Sistema (XDM)

Experience Data Model (XDM) System è il framework standardizzato tramite il quale Platform organizza i dati sulla customer experience. Experience Platform sfrutta gli schemi XDM per descrivere la struttura dei dati in modo coerente e riutilizzabile.

Quando i dati vengono acquisiti in Platform, la struttura di tali dati viene mappata su uno schema XDM e memorizzata all'interno di Data Lake come parte di un set di dati. I metadati per ogni set di dati sono tracciati da Catalog Service, che include un riferimento allo schema XDM a cui è conforme il set di dati.

Per informazioni generali sul sistema XDM, vedere la Panoramica del sistema XDM.

Data Ingestion

Experience Platform acquisisce dati da più sorgenti e persiste record come set di dati all’interno di Data Lake. Catalog tiene traccia dei metadati per questi set di dati, indipendentemente dalla loro origine o dal loro metodo di acquisizione.

Quando si utilizza il metodo di acquisizione batch, Catalog tiene traccia anche dei metadati aggiuntivi per i file batch. I batch sono unità di dati costituite da uno o più file da acquisire come una singola unità. Catalog tiene traccia dei metadati per questi file batch, nonché dei set di dati in cui vengono mantenuti dopo l’acquisizione. I metadati batch includono informazioni sul numero di record correttamente acquisiti, nonché su eventuali record con errore e relativi messaggi di errore.

Per ulteriori informazioni, consulta la panoramica sull’acquisizione dei dati .

Catalog oggetti

Come descritto nella sezione precedente, Catalog tiene traccia dei metadati per diversi tipi di risorse e operazioni utilizzate da altri servizi Platform. Catalog mantiene il proprio archivio di "oggetti" che incapsulano questi metadati. Catalog Gli oggetti sono rappresentazioni di Platform dati interrogabili che consentono di eseguire ricerche, monitorare ed etichettare i dati senza dover accedere ai dati stessi.

La tabella seguente illustra i diversi tipi di oggetti supportati da Catalog:

Oggetto Endpoint API Definizione
Account /accounts Durante la creazione delle connessioni di origine, è necessario fornire le credenziali di autenticazione. Un account rappresenta una raccolta di credenziali di autenticazione utilizzate per creare una connessione di un tipo specifico. Ogni connessione dispone di un set di parametri univoci che vengono mantenuti da Catalog e protetti in un Azure Key Vault.
Batch /batches I batch sono unità di dati costituite da uno o più file da acquisire come una singola unità. Un oggetto batch in Catalog delinea le metriche di acquisizione del batch (come il numero di record elaborati o le dimensioni su disco) e può includere anche collegamenti a set di dati, viste e altre risorse interessate dall'operazione batch.
Connessione /connections Una connessione è una singola istanza di un connettore di origine, univoca per la tua organizzazione e configurata utilizzando le credenziali di autenticazione appropriate per il tipo di connettore.
Connettore /connectors I connettori definiscono il modo in cui le connessioni di origine devono raccogliere dati da altre applicazioni di Adobe (come Adobe Analytics e Adobe Audience Manager), da sorgenti di archiviazione cloud di terze parti (come Azure Blob, Amazon S3, server FTP e server SFTP) e da sistemi CRM di terze parti (come Microsoft Dynamics e Salesforce).
Set di dati /dataSets Un set di dati è un costrutto di archiviazione e gestione utilizzato per la raccolta di dati (in genere una tabella) che contiene uno schema (colonne) e campi (righe). Per ulteriori informazioni, consulta la panoramica dei set di dati .
File set di dati /datasetFiles I file del set di dati rappresentano blocchi di dati salvati in Platform. Come record di file letterali, questi sono i punti in cui è possibile trovare le dimensioni del file, il numero di record in esso contenuti e un riferimento al batch che ha acquisito il file.

Passaggi successivi

Questo documento fornisce un'introduzione a Catalog Service e il suo funzionamento all'interno dell'ambito maggiore di Experience Platform. Consulta la Catalog guida per sviluppatori per i passaggi sull'interazione con i diversi endpoint di tale Catalog API. È consigliabile consultare anche la guida sul filtraggio dei dati del catalogo per seguire le best practice per limitare i dati restituiti nelle risposte API.

In questa pagina