Documentação Experience Platform Guia dos conectores de origem

Habilitar captura de dados de alteração para conexões de origem na API

Última atualização: 9 de julho de 2026

Tópicos:
Sources

Criado para:

Developer

AVAILABILITY

A captura de dados de alteração tem suporte para as seguintes fontes: Amazon S3, Data Landing Zone, Marketo Engage, Microsoft Dynamics e Salesforce.
Você também pode habilitar a captura de dados de alteração para fontes de Amazon S3 e Data Landing Zone ao usar o Adobe Experience Platform no Amazon Web Services (AWS) em um data center VA6. Observe que o Experience Platform no AWS está disponível atualmente para um público limitado. Para obter mais detalhes sobre o suporte à infraestrutura, consulte a visão geral de várias nuvens do Experience Platform.

Use a captura de dados de alteração em origens do Adobe Experience Platform para manter seus sistemas de origem e destino sincronizados em tempo quase real.

Atualmente, o Experience Platform oferece suporte a cópia de dados incremental, que transfere periodicamente registros recém-criados ou atualizados do sistema de origem para os conjuntos de dados assimilados. Este método depende de uma coluna de carimbo de data/hora para rastrear as alterações, mas não detecta exclusões, o que pode levar a inconsistências de dados ao longo do tempo.

Por outro lado, a captura de dados de alteração captura e aplica inserções, atualizações e exclusões em tempo quase real. Esse controle abrangente de alterações garante que os conjuntos de dados permaneçam totalmente alinhados ao sistema de origem e fornece um histórico completo de alterações, além do que a cópia incremental suporta. No entanto, as operações de exclusão exigem consideração especial, pois afetam todos os aplicativos que usam os conjuntos de dados de destino.

A alteração da captura de dados no Experience Platform requer o Data Mirror com esquemas relacionais. Você pode fornecer dados de alteração ao Data Mirror de duas maneiras:

Controle manual de alterações: inclua uma coluna _change_request_type em seu conjunto de dados para fontes que não geram nativamente registros de captura de dados de alteração
Exportações de captura de dados de alteração nativa: usar registros de captura de dados de alteração exportados diretamente do sistema de origem

Ambas as abordagens exigem o Data Mirror com esquemas relacionais para preservar relacionamentos e impor exclusividade.

Data Mirror com esquemas relacionais

AVAILABILITY

O Data Mirror e os esquemas relacionais estão disponíveis por padrão para todos os clientes licenciados com as edições B2P e B2B do Real-Time CDP.

NOTE

Usuários de campanhas orquestradas: use os recursos do Data Mirror descritos neste documento para trabalhar com dados do cliente que mantenham integridade referencial. Mesmo que a origem não use a formatação de captura de dados de alteração, o Data Mirror oferece suporte a recursos relacionais, como imposição de chave primária, upserts em nível de registro e relacionamentos de esquema. Esses recursos garantem uma modelagem de dados consistente e confiável em todos os conjuntos de dados conectados.

O Data Mirror usa esquemas relacionais para estender a captura de dados de alteração e habilitar recursos avançados de sincronização de banco de dados. Para obter uma visão geral do Data Mirror, consulte visão geral do Data Mirror.

Os esquemas relacionais estendem o Experience Platform para impor a exclusividade da chave primária, rastrear alterações no nível da linha e definir relações no nível do esquema. Com a captura de dados de alteração, eles aplicam inserções, atualizações e exclusões diretamente no data lake, reduzindo a necessidade de extrair, transformar, carregar (ETL) ou reconciliação manual.

Consulte Visão geral de esquemas relacionais para obter mais informações.

Requisitos de esquema relacional para captura de dados de alteração

Antes de usar um esquema relacional com captura de dados de alteração, configure os seguintes identificadores:

Identifique exclusivamente cada registro com uma chave primária.
Aplique atualizações em sequência usando um identificador de versão.
Para esquemas de série temporal, adicione um identificador de carimbo de data e hora.

Controlar manuseio de coluna control-column-handling

Use a coluna _change_request_type para especificar como cada linha deve ser processada:

u — substituir (padrão se a coluna estiver ausente)
d — excluir

Essa coluna é avaliada somente durante a assimilação e não é armazenada ou mapeada para campos XDM.

Fluxo de trabalho workflow

Para habilitar a captura de dados de alteração com um esquema relacional:

Criar um esquema relacional.
Adicione os descritores necessários:
- Descritor de chave primária
- Descritor de versão
- Descritor de carimbo de data/hora (somente série temporal)
Crie um conjunto de dados a partir do esquema e ative a captura de dados de alteração.
Somente para assimilação baseada em arquivo: adicione a coluna _change_request_type aos arquivos de origem se precisar especificar explicitamente operações de exclusão. As configurações de exportação do CDC lidam com isso automaticamente para fontes de banco de dados.
Conclua a configuração da conexão de origem para habilitar a assimilação.

NOTE

A coluna _change_request_type só é necessária para fontes baseadas em arquivo (Amazon S3, Azure Blob, Google Cloud Storage, SFTP) quando você deseja controlar explicitamente o comportamento de alteração no nível da linha. Para fontes de banco de dados com recursos nativos do CDC, as operações de alteração são tratadas automaticamente por meio de configurações de exportação do CDC. A assimilação baseada em arquivo presume operações de substituição por padrão. Você só precisará adicionar essa coluna se quiser especificar operações de exclusão nos uploads de arquivo.

IMPORTANT

O planejamento de exclusão de dados é necessário. Todos os aplicativos que usam esquemas relacionais devem entender as implicações de exclusão antes de implementar a captura de dados de alteração. Planeje como as exclusões afetarão os conjuntos de dados relacionados, os requisitos de conformidade e os processos de downstream. Consulte considerações sobre higiene de dados para obter orientação.

Fornecendo dados de alteração para fontes baseadas em arquivo file-based-sources

IMPORTANT

A captura de dados de alteração baseada em arquivo requer o Data Mirror com esquemas relacionais. Antes de seguir as etapas de formatação de arquivo abaixo, verifique se você concluiu o fluxo de trabalho de instalação do Data Mirror descrito anteriormente neste documento. As etapas abaixo descrevem como formatar seus arquivos de dados para incluir informações de controle de alterações que serão processadas pelo Data Mirror.

Para fontes baseadas em arquivo (Amazon S3, Azure Blob, Google Cloud Storage e SFTP), inclua uma coluna _change_request_type em seus arquivos.

Use os valores _change_request_type definidos na seção Manuseio de coluna de controle acima.

IMPORTANT

Somente para fontes baseadas em arquivo, alguns aplicativos podem exigir uma coluna _change_request_type com u (substituição) ou d (exclusão) para validar os recursos de controle de alterações. Por exemplo, o recurso Campanhas orquestradas da Adobe Journey Optimizer exige essa coluna para habilitar a opção "Campanha orquestrada" e permitir a seleção de conjuntos de dados para direcionamento. Os requisitos de validação específicos do aplicativo podem variar.

Siga as etapas específicas da origem abaixo.

Fontes de armazenamento na nuvem cloud-storage-sources

Habilite a captura de dados de alteração para fontes de armazenamento na nuvem seguindo estas etapas:

Crie uma conexão básica para sua origem:

table 0-row-2 1-row-2 2-row-2 3-row-2 4-row-2
Fonte	Guia de conexão básica
Amazon S3	Criar uma Amazon S3 conexão básica
Azure Blob	Criar uma Azure Blob conexão básica
Google Cloud Storage	Criar uma Google Cloud Storage conexão básica
SFTP	Criar uma SFTP conexão básica

Criar uma conexão de origem para um armazenamento na nuvem.

Todas as fontes de armazenamento na nuvem usam o mesmo formato de coluna _change_request_type descrito na seção Fontes baseadas em arquivo acima.

Exemplo: habilitar a captura de dados de alteração ao criar uma conexão de origem de armazenamento na nuvem

Ao criar sua conexão de origem de armazenamento na nuvem, defina params.cdcEnabled como true para habilitar a captura de dados de alteração. Para origens baseadas em arquivo, as operações de alteração também dependem da coluna de controle _change_request_type descrita acima.

Formato da API

POST /sourceConnections

Solicitação

curl -X POST \
  'https://platform.adobe.io/data/foundation/flowservice/sourceConnections' \
  -H 'Authorization: Bearer {ACCESS_TOKEN}' \
  -H 'x-api-key: {API_KEY}' \
  -H 'x-gw-ims-org-id: {ORG_ID}' \
  -H 'x-sandbox-name: {SANDBOX_NAME}' \
  -H 'Content-Type: application/json' \
  -d '{
    "name": "Cloud Storage source connection with CDC enabled",
    "description": "Source connection for ingesting change data from cloud storage",
    "baseConnectionId": "{BASE_CONNECTION_ID}",
    "data": {
      "format": "delimited"
    },
    "params": {
      "path": "/acme/cdc/account.csv",
      "type": "file",
      "cdcEnabled": true
    },
    "connectionSpec": {
      "id": "{CONNECTION_SPEC_ID}",
      "version": "1.0"
    }
  }'

Resposta

A resposta retorna o identificador exclusivo da conexão de origem recém-criada. Você pode usar essa ID na próxima etapa do fluxo de trabalho ao criar um fluxo de dados.

{
  "id": "26b53912-1005-49f0-b539-12100559f0e2",
  "etag": "\"11004d97-0000-0200-0000-5f3c3b140000\""
}

Para concluir o fluxo de trabalho de armazenamento na nuvem, incluindo esquema, conjunto de dados, conexão de destino, mapeamento e criação de fluxo de dados, consulte Criar um Fluxo de Dados para Fontes de Armazenamento na Nuvem Usando a Flow Service API.

Origens de Banco de Dados database-sources

Azure Databricks

Para usar a captura de dados de alteração com o Azure Databricks, você deve habilitar o feed de dados de alteração nas tabelas de origem e configurar o Data Mirror com esquemas relacionais no Experience Platform.

Use os seguintes comandos para habilitar a alteração do feed de dados nas tabelas:

Nova tabela

Para aplicar o feed de dados de alteração a uma nova tabela, defina a propriedade de tabela delta.enableChangeDataFeed como TRUE no comando CREATE TABLE.

CREATE TABLE student (id INT, name STRING, age INT) TBLPROPERTIES (delta.enableChangeDataFeed = true)

Tabela existente

Para aplicar o feed de dados de alteração a uma tabela existente, defina a propriedade de tabela delta.enableChangeDataFeed como TRUE no comando ALTER TABLE.

ALTER TABLE myDeltaTable SET TBLPROPERTIES (delta.enableChangeDataFeed = true)

Todas as novas tabelas

Para aplicar o feed de dados de alteração a todas as novas tabelas, defina suas propriedades padrão como TRUE.

set spark.databricks.delta.properties.defaults.enableChangeDataFeed = true;

Para obter mais informações, leia o Azure Databricks guia sobre como habilitar o feed de dados de alteração.

Leia a documentação a seguir para obter as etapas sobre como habilitar a captura de dados de alteração para sua conexão de origem do Azure Databricks:

Data Landing Zone

Para usar a captura de dados de alteração com o Data Landing Zone, você deve habilitar o feed de dados de alteração nas tabelas de origem e configurar o Data Mirror com esquemas relacionais no Experience Platform.

Leia a documentação a seguir para obter as etapas sobre como habilitar a captura de dados de alteração para sua conexão de origem do Data Landing Zone:

Google BigQuery

Para usar a captura de dados de alteração com o Google BigQuery, você deve habilitar o histórico de alterações nas tabelas de origem e configurar o Data Mirror com esquemas relacionais no Experience Platform.

Para habilitar o histórico de alterações na conexão de origem do Google BigQuery, navegue até a página Google BigQuery no console Google Cloud e defina enable_change_history como TRUE. Essa propriedade ativa o histórico de alterações da tabela de dados.

Para obter mais informações, leia o manual sobre instruções de linguagem de definição de dados em GoogleSQL.

Leia a documentação a seguir para obter as etapas sobre como habilitar a captura de dados de alteração para sua conexão de origem do Google BigQuery:

Snowflake

Para usar a captura de dados de alteração com Snowflake, você deve habilitar o controle de alterações nas tabelas de origem e configurar o Data Mirror com esquemas relacionais no Experience Platform.

Em Snowflake, habilite o controle de alterações usando ALTER TABLE e definindo CHANGE_TRACKING como TRUE.

ALTER TABLE mytable SET CHANGE_TRACKING = TRUE

Para obter mais informações, leia o Snowflake guia sobre como usar a cláusula de alterações.

Leia a documentação a seguir para obter as etapas sobre como habilitar a captura de dados de alteração para sua conexão de origem do Snowflake:

Exemplo: habilitar a captura de dados de alteração ao criar uma conexão de origem de banco de dados

Para fontes de banco de dados com suporte, defina params.cdcEnabled como true ao criar sua conexão de origem para habilitar a captura de dados de alteração. Antes de usar essa opção, verifique se o controle de alterações está ativado no sistema de origem e se o Data Mirror com esquemas relacionais está configurado no Experience Platform.

Este exemplo se aplica a fontes de banco de dados com suporte que usam exportações de CDC nativas, como Azure Databricks, Google BigQuery e Snowflake.

Formato da API

POST /sourceConnections

Solicitação

curl -X POST \
  'https://platform.adobe.io/data/foundation/flowservice/sourceConnections' \
  -H 'Authorization: Bearer {ACCESS_TOKEN}' \
  -H 'x-api-key: {API_KEY}' \
  -H 'x-gw-ims-org-id: {ORG_ID}' \
  -H 'x-sandbox-name: {SANDBOX_NAME}' \
  -H 'Content-Type: application/json' \
  -d '{
    "name": "Database source connection with CDC enabled",
    "description": "Source connection for ingesting change data from a database source",
    "baseConnectionId": "{BASE_CONNECTION_ID}",
    "data": {
      "format": "tabular"
    },
    "params": {
      "tableName": "{TABLE_NAME}",
      "columns": [
        {
          "name": "id",
          "type": "string",
          "xdm": {
            "type": "string"
          }
        },
        {
          "name": "name",
          "type": "string",
          "xdm": {
            "type": "string"
          }
        },
        {
          "name": "lastModified",
          "type": "string",
          "meta:xdmType": "date-time",
          "xdm": {
            "type": "string",
            "format": "date-time"
          }
        }
      ],
      "cdcEnabled": true
    },
    "connectionSpec": {
      "id": "{CONNECTION_SPEC_ID}",
      "version": "1.0"
    }
  }'

Resposta

A resposta retorna o identificador exclusivo da conexão de origem recém-criada. Você pode usar essa ID na próxima etapa do fluxo de trabalho ao criar um fluxo de dados.

{
  "id": "b7581b59-c603-4df1-a689-d23d7ac440f3",
  "etag": "\"ef05d265-0000-0200-0000-6019e0080000\""
}

Para obter o fluxo de trabalho de assimilação de banco de dados completo, incluindo conexão de destino, mapeamento e criação de fluxo de dados, consulte Criar um fluxo de dados para fontes de banco de dados usando a Flow Service API.

recommendation-more-help

experience-platform-help-sources