Documentazione Experience Platform Guida ai connettori di origini

Abilitare Change Data Capture per le connessioni di origine nell’API

Ultimo aggiornamento: 9 luglio 2026

Argomenti:
Sources

Creato per:

Developer

AVAILABILITY

Change Data Capture è supportato per le seguenti origini: Amazon S3, Data Landing Zone, Marketo Engage, Microsoft Dynamics e Salesforce.
È inoltre possibile abilitare l'acquisizione dei dati di modifica per le origini Amazon S3 e Data Landing Zone quando si utilizza Adobe Experience Platform su Amazon Web Services (AWS) in un data center VA6. Experience Platform su AWS è attualmente disponibile per un pubblico limitato. Per ulteriori dettagli sul supporto dell'infrastruttura, consulta la panoramica multi-cloud di Experience Platform.

Utilizza l’acquisizione dei dati di modifica nelle origini Adobe Experience Platform per mantenere sincronizzati i sistemi di origine e di destinazione quasi in tempo reale.

Experience Platform attualmente supporta copia dati incrementale, che trasferisce periodicamente i record appena creati o aggiornati dal sistema di origine ai set di dati acquisiti. Questo metodo si basa su una colonna timestamp per tenere traccia delle modifiche, ma non rileva le eliminazioni, il che può causare incongruenze nei dati nel tempo.

Cambia invece acquisisce ed applica inserti, aggiornamenti ed eliminazioni quasi in tempo reale. Questo monitoraggio completo delle modifiche assicura che i set di dati rimangano completamente allineati al sistema di origine e fornisce una cronologia completa delle modifiche, oltre a ciò che supporta la copia incrementale. Tuttavia, le operazioni di eliminazione richiedono una considerazione particolare in quanto influiscono su tutte le applicazioni che utilizzano i set di dati di destinazione.

La modifica dell’acquisizione dati in Experience Platform richiede Data Mirror con schemi relazionali. È possibile fornire i dati di modifica a Data Mirror in due modi:

Rilevamento delle modifiche manuale: includi una colonna _change_request_type nel set di dati per le origini che non generano in modo nativo record di acquisizione dati di modifica
Esportazioni native di acquisizione dati di modifica: utilizza i record di acquisizione dati di modifica esportati direttamente dal sistema di origine

Entrambi gli approcci richiedono Data Mirror con schemi relazionali per preservare le relazioni e applicare l’univocità.

Data Mirror con schemi relazionali

AVAILABILITY

Data Mirror e gli schemi relazionali sono disponibili per impostazione predefinita per tutti i clienti con licenza delle edizioni B2P e B2B di Real-Time CDP.

NOTE

Utenti di campagne orchestrate: utilizza le funzionalità di Data Mirror descritte in questo documento per lavorare con i dati dei clienti mantenendo l'integrità referenziale. Anche se l'origine non utilizza la formattazione di acquisizione dati di modifica, Data Mirror supporta funzioni relazionali quali l'imposizione della chiave primaria, gli aggiornamenti a livello di record e le relazioni tra schemi. Queste funzioni garantiscono una modellazione dei dati coerente e affidabile tra i set di dati connessi.

Data Mirror utilizza gli schemi relazionali per estendere l’acquisizione dei dati sulle modifiche e abilitare funzionalità avanzate di sincronizzazione del database. Per una panoramica di Data Mirror, vedere Panoramica di Data Mirror.

Gli schemi relazionali estendono Experience Platform per applicare l’univocità della chiave primaria, tenere traccia delle modifiche a livello di riga e definire relazioni a livello di schema. Con l’acquisizione dei dati di modifica, vengono applicati inserti, aggiornamenti ed eliminazioni direttamente nel data lake, riducendo la necessità di estrarre, trasformare, caricare (ETL) o riconciliazione manuale.

Per ulteriori informazioni, vedere Panoramica sugli schemi relazionali.

Requisiti dello schema relazionale per l’acquisizione dei dati di modifica

Prima di utilizzare uno schema relazionale con Change Data Capture, configura i seguenti identificatori:

Identificare in modo univoco ogni record con una chiave primaria.
Applica gli aggiornamenti in sequenza utilizzando un identificatore di versione.
Per gli schemi di serie temporali, aggiungi un identificatore di marca temporale.

Gestione colonne di controllo control-column-handling

Utilizzare la colonna _change_request_type per specificare la modalità di elaborazione di ogni riga:

u — upsert (impostazione predefinita se la colonna è assente)
d — elimina

Questa colonna viene valutata solo durante l’acquisizione e non viene memorizzata o mappata su campi XDM.

Flusso di lavoro workflow

Per abilitare l’acquisizione dei dati di modifica con uno schema relazionale:

Creare uno schema relazionale.
Aggiungi i descrittori richiesti:
- Descrittore della chiave primaria
- Descrittore versione
- Descrittore marca temporale (solo serie temporali)
Crea un set di dati dallo schema e abilita l’acquisizione dei dati di modifica.
Solo per l’acquisizione basata su file: se devi specificare esplicitamente le operazioni di eliminazione, aggiungi la colonna _change_request_type ai file di origine. Le configurazioni di esportazione CDC gestiscono automaticamente questa situazione per le origini del database.
Completa l’impostazione della connessione di origine per abilitare l’acquisizione.

NOTE

La colonna _change_request_type è necessaria solo per le origini basate su file (Amazon S3, Azure Blob, Google Cloud Storage, SFTP) quando si desidera controllare in modo esplicito il comportamento di modifica a livello di riga. Per le origini di database con funzionalità CDC native, le operazioni di modifica vengono gestite automaticamente tramite le configurazioni di esportazione CDC. Per impostazione predefinita, l’acquisizione basata su file prevede l’esecuzione di operazioni upsert. È sufficiente aggiungere questa colonna per specificare le operazioni di eliminazione nei caricamenti di file.

IMPORTANT

È richiesta la pianificazione dell'eliminazione dei dati. Tutte le applicazioni che utilizzano schemi relazionali devono comprendere le implicazioni relative all’eliminazione prima di implementare l’acquisizione dei dati di modifica. Pianifica in che modo le eliminazioni influiranno sui set di dati correlati, sui requisiti di conformità e sui processi a valle. Consulta considerazioni sull'igiene dei dati per maggiori informazioni.

Fornitura di dati di modifica per origini basate su file file-based-sources

IMPORTANT

L'acquisizione dei dati di modifica basata su file richiede Data Mirror con schemi relazionali. Prima di seguire i passaggi di formattazione dei file riportati di seguito, assicurati di aver completato il flusso di lavoro di installazione di Data Mirror descritto in precedenza in questo documento. I passaggi seguenti descrivono come formattare i file di dati per includere le informazioni di rilevamento delle modifiche che verranno elaborate da Data Mirror.

Per le origini basate su file (Amazon S3, Azure Blob, Google Cloud Storage e SFTP), includere una colonna _change_request_type nei file.

Utilizza i valori _change_request_type definiti nella sezione precedente Gestione colonna di controllo.

IMPORTANT

Solo per origini basate su file, alcune applicazioni potrebbero richiedere una colonna _change_request_type con u (upsert) o d (delete) per convalidare le funzionalità di rilevamento delle modifiche. Ad esempio, la funzionalità Campagne orchestrate di Adobe Journey Optimizer richiede questa colonna per abilitare l'interruttore "Campagna orchestrata" e consentire la selezione del set di dati per il targeting. I requisiti di convalida specifici dell’applicazione possono variare.

Segui i passaggi specifici per l’origine riportati di seguito.

Origini archiviazione cloud cloud-storage-sources

Abilita l’acquisizione dei dati di modifica per le origini di archiviazione cloud seguendo questi passaggi:

Creare una connessione di base per l’origine:

table 0-row-2 1-row-2 2-row-2 3-row-2 4-row-2
Origine	Guida alla connessione di base
Amazon S3	Crea una Amazon S3 connessione di base
Azure Blob	Crea una Azure Blob connessione di base
Google Cloud Storage	Crea una Google Cloud Storage connessione di base
SFTP	Crea una SFTP connessione di base

Creare una connessione di origine per un’archiviazione cloud.

Tutte le origini di archiviazione cloud utilizzano lo stesso formato di colonna _change_request_type descritto nella sezione Origini basate su file precedente.

Esempio: abilitare l’acquisizione dei dati di modifica durante la creazione di una connessione all’origine dell’archiviazione cloud

Durante la creazione della connessione all’origine dell’archiviazione cloud, impostare params.cdcEnabled su true per abilitare la modifica dell’acquisizione dati. Per le origini basate su file, le operazioni di modifica si basano anche sulla colonna di controllo _change_request_type descritta sopra.

Formato API

POST /sourceConnections

Richiesta

curl -X POST \
  'https://platform.adobe.io/data/foundation/flowservice/sourceConnections' \
  -H 'Authorization: Bearer {ACCESS_TOKEN}' \
  -H 'x-api-key: {API_KEY}' \
  -H 'x-gw-ims-org-id: {ORG_ID}' \
  -H 'x-sandbox-name: {SANDBOX_NAME}' \
  -H 'Content-Type: application/json' \
  -d '{
    "name": "Cloud Storage source connection with CDC enabled",
    "description": "Source connection for ingesting change data from cloud storage",
    "baseConnectionId": "{BASE_CONNECTION_ID}",
    "data": {
      "format": "delimited"
    },
    "params": {
      "path": "/acme/cdc/account.csv",
      "type": "file",
      "cdcEnabled": true
    },
    "connectionSpec": {
      "id": "{CONNECTION_SPEC_ID}",
      "version": "1.0"
    }
  }'

Risposta

La risposta restituisce l’identificatore univoco della connessione sorgente appena creata. Puoi utilizzare questo ID nel passaggio successivo del flusso di lavoro durante la creazione di un flusso di dati.

{
  "id": "26b53912-1005-49f0-b539-12100559f0e2",
  "etag": "\"11004d97-0000-0200-0000-5f3c3b140000\""
}

Per il flusso di lavoro completo per l’archiviazione cloud, che include schema, set di dati, connessione di destinazione, mappatura e creazione di flussi di dati, consulta Creare un flusso di dati per le origini di archiviazione cloud utilizzando l’API Flow Service 2}.

Origini del database database-sources

Azure Databricks

Per utilizzare Change Data Capture con Azure Databricks, è necessario abilitare change Data Feed nelle tabelle di origine e configurare Data Mirror con schemi relazionali in Experience Platform.

Utilizzare i seguenti comandi per abilitare il feed di dati di modifica nelle tabelle:

Nuova tabella

Per applicare il feed di dati di modifica a una nuova tabella, è necessario impostare la proprietà della tabella delta.enableChangeDataFeed su TRUE nel comando CREATE TABLE.

CREATE TABLE student (id INT, name STRING, age INT) TBLPROPERTIES (delta.enableChangeDataFeed = true)

Tabella esistente

Per applicare il feed di dati di modifica a una tabella esistente, è necessario impostare la proprietà della tabella delta.enableChangeDataFeed su TRUE nel comando ALTER TABLE.

ALTER TABLE myDeltaTable SET TBLPROPERTIES (delta.enableChangeDataFeed = true)

Tutte le nuove tabelle

Per applicare il feed dati di modifica a tutte le nuove tabelle, è necessario impostare le proprietà predefinite su TRUE.

set spark.databricks.delta.properties.defaults.enableChangeDataFeed = true;

Per ulteriori informazioni, leggere la Azure Databricks guida sull’abilitazione del feed di dati di modifica.

Per i passaggi su come abilitare l’acquisizione dei dati di modifica per la connessione di origine Azure Databricks, leggere la seguente documentazione:

Data Landing Zone

Per utilizzare Change Data Capture con Data Landing Zone, è necessario abilitare change Data Feed nelle tabelle di origine e configurare Data Mirror con schemi relazionali in Experience Platform.

Per i passaggi su come abilitare l’acquisizione dei dati di modifica per la connessione di origine Data Landing Zone, leggere la seguente documentazione:

Google BigQuery

Per utilizzare Change Data Capture con Google BigQuery, è necessario abilitare la cronologia delle modifiche nelle tabelle di origine e configurare Data Mirror con schemi relazionali in Experience Platform.

Per abilitare la cronologia delle modifiche nella connessione di origine Google BigQuery, passare alla pagina Google BigQuery nella console Google Cloud e impostare enable_change_history su TRUE. Questa proprietà abilita la cronologia delle modifiche per la tabella dati.

Per ulteriori informazioni, leggere la guida sulle istruzioni del linguaggio di definizione dei dati in GoogleSQL.

Per i passaggi su come abilitare l’acquisizione dei dati di modifica per la connessione di origine Google BigQuery, leggere la seguente documentazione:

Snowflake

Per utilizzare Change Data Capture con Snowflake, è necessario abilitare rilevamento modifiche nelle tabelle di origine e configurare Data Mirror con schemi relazionali in Experience Platform.

In Snowflake, abilitare il rilevamento delle modifiche utilizzando ALTER TABLE e impostando CHANGE_TRACKING su TRUE.

ALTER TABLE mytable SET CHANGE_TRACKING = TRUE

Per ulteriori informazioni, leggere la Snowflake guida sull’utilizzo della clausola changes.

Per i passaggi su come abilitare l’acquisizione dei dati di modifica per la connessione di origine Snowflake, leggere la seguente documentazione:

Esempio: abilitare l’acquisizione dei dati di modifica durante la creazione di una connessione all’origine del database

Per le origini di database supportate, impostare params.cdcEnabled su true durante la creazione della connessione di origine per abilitare la modifica dell’acquisizione dei dati. Prima di utilizzare questa opzione, assicurati che il rilevamento delle modifiche sia abilitato nel sistema di origine e che Data Mirror con schemi relazionali sia configurato in Experience Platform.

Questo esempio si applica alle origini di database supportate che utilizzano esportazioni CDC native, ad esempio Azure Databricks, Google BigQuery e Snowflake.

Formato API

POST /sourceConnections

Richiesta

curl -X POST \
  'https://platform.adobe.io/data/foundation/flowservice/sourceConnections' \
  -H 'Authorization: Bearer {ACCESS_TOKEN}' \
  -H 'x-api-key: {API_KEY}' \
  -H 'x-gw-ims-org-id: {ORG_ID}' \
  -H 'x-sandbox-name: {SANDBOX_NAME}' \
  -H 'Content-Type: application/json' \
  -d '{
    "name": "Database source connection with CDC enabled",
    "description": "Source connection for ingesting change data from a database source",
    "baseConnectionId": "{BASE_CONNECTION_ID}",
    "data": {
      "format": "tabular"
    },
    "params": {
      "tableName": "{TABLE_NAME}",
      "columns": [
        {
          "name": "id",
          "type": "string",
          "xdm": {
            "type": "string"
          }
        },
        {
          "name": "name",
          "type": "string",
          "xdm": {
            "type": "string"
          }
        },
        {
          "name": "lastModified",
          "type": "string",
          "meta:xdmType": "date-time",
          "xdm": {
            "type": "string",
            "format": "date-time"
          }
        }
      ],
      "cdcEnabled": true
    },
    "connectionSpec": {
      "id": "{CONNECTION_SPEC_ID}",
      "version": "1.0"
    }
  }'

Risposta

{
  "id": "b7581b59-c603-4df1-a689-d23d7ac440f3",
  "etag": "\"ef05d265-0000-0200-0000-6019e0080000\""
}

Per il flusso di lavoro completo per l’acquisizione del database, che include la connessione di destinazione, la mappatura e la creazione di flussi di dati, vedere Creare un flusso di dati per le origini del database utilizzando l’API Flow Service 2}.

recommendation-more-help

experience-platform-help-sources