Um fluxo de dados é uma tarefa programada que recupera e ingere dados de uma fonte para um conjunto de dados da plataforma. Este tutorial fornece etapas para configurar um novo fluxo de dados usando sua conta de banco de dados.
Este tutorial requer uma compreensão funcional dos seguintes componentes do Adobe Experience Platform:
Além disso, este tutorial requer que você já tenha criado uma conta de banco de dados. Uma lista de tutoriais para criar conectores de banco de dados diferentes na interface do usuário pode ser encontrada na visão geral dos conectores de origem.
Depois de criar sua conta de banco de dados, a etapa Selecionar dados é exibida, fornecendo uma interface interativa para que você explore sua hierarquia de banco de dados.
Você pode usar a opção Pesquisar na parte superior da página para identificar rapidamente os dados de origem que pretende usar.
A opção de dados da fonte de pesquisa está disponível para todos os conectores de origem baseados em tabela, excluindo os conectores Analytics, Classificações, Hubs de Evento e Kinesis.
Depois de encontrar os dados de origem, selecione o diretório e clique em Próximo.
A etapa Mapping é exibida, fornecendo uma interface interativa para mapear os dados de origem para um conjunto de dados da Plataforma.
Escolha um conjunto de dados para os dados de entrada a serem ingeridos. Você pode usar um conjunto de dados existente ou criar um novo conjunto de dados.
Para assimilar dados em um conjunto de dados existente, selecione Conjunto de dados existente e clique no ícone do conjunto de dados.
A caixa de diálogo Selecionar conjunto de dados é exibida. Encontre o conjunto de dados que deseja usar, selecione-o e clique em Continuar.
Para assimilar dados em um novo conjunto de dados, selecione Novo conjunto de dados e insira um nome e uma descrição para o conjunto de dados nos campos fornecidos.
Você pode anexar um campo de schema inserindo um nome de schema na barra de pesquisa Selecionar schema. Você também pode selecionar o ícone suspenso para ver uma lista de schemas existentes. Como alternativa, você pode selecionar Pesquisa avançada para acessar a tela de schemas existentes, incluindo seus respectivos detalhes.
Durante esta etapa, você pode ativar seu conjunto de dados para Real-time Customer Profile e criar uma visualização holística dos atributos e comportamentos de uma entidade. Os dados de todos os conjuntos de dados ativados serão incluídos em Profile e as alterações serão aplicadas quando você salvar seu fluxo de dados.
Alterne o botão conjunto de dados de Perfil para ativar o conjunto de dados de público alvo para Profile.
A caixa de diálogo Selecionar schema é exibida. Selecione o schema que deseja aplicar ao novo conjunto de dados e clique em Concluído.
Com base em suas necessidades, você pode optar por mapear os campos diretamente ou usar as funções do mapeador para transformar dados de origem para derivar valores calculados ou calculados. Para obter mais informações sobre funções de mapeamento e mapeamento de dados, consulte o tutorial em mapeamento de dados CSV para campos de schema XDM.
Platform fornece recomendações inteligentes para campos mapeados automaticamente com base no schema ou conjunto de dados do público alvo selecionado. É possível ajustar manualmente as regras de mapeamento para atender aos casos de uso.
Selecione dados de Pré-visualização para ver os resultados do mapeamento de até 100 linhas de dados de amostra do conjunto de dados selecionado.
Durante a pré-visualização, a coluna de identidade é priorizada como o primeiro campo, já que são as principais informações necessárias ao validar os resultados do mapeamento.
Depois que os dados de origem forem mapeados, selecione Close.
A etapa Agendamento é exibida, permitindo que você configure um agendamento de ingestão para assimilar automaticamente os dados de origem selecionados usando os mapeamentos configurados. A tabela a seguir descreve os diferentes campos configuráveis para programação:
Campo | Descrição |
---|---|
Frequência | As frequências selecionáveis incluem Once , Minute , Hour , Day e Week . |
Intervalo | Um número inteiro que define o intervalo para a frequência selecionada. |
hora do start | Um carimbo de data e hora UTC indicando quando a primeira ingestão está definida para ocorrer. |
Backfill | Um valor booliano que determina quais dados são inicialmente assimilados. Se Backfill estiver ativado, todos os arquivos atuais no caminho especificado serão ingeridos durante a primeira ingestão programada. Se Backfill estiver desativado, somente os arquivos que forem carregados entre a primeira execução da ingestão e a hora do start serão assimilados. Os arquivos carregados antes da hora do start não serão ingeridos. |
Coluna Delta | Uma opção com um conjunto filtrado de campos de schema de origem de tipo, data ou hora. Esse campo é usado para diferenciar entre dados novos e existentes. Os dados incrementais serão ingeridos com base no carimbo de data e hora da coluna selecionada. |
Os fluxos de dados são projetados para assimilar dados automaticamente de acordo com uma programação. Start selecionando a frequência da ingestão. Em seguida, defina o intervalo para designar o período entre duas execuções de fluxo. O valor do intervalo deve ser um número inteiro diferente de zero e deve ser definido como maior ou igual a 15.
Para definir a hora de ingestão do start, ajuste a data e a hora exibidas na caixa da hora do start. Como alternativa, você pode selecionar o ícone de calendário para editar o valor de hora do start. O tempo de start deve ser maior ou igual ao tempo UTC atual.
Selecione Carregar dados incrementais por para atribuir a coluna delta. Este campo fornece uma distinção entre dados novos e existentes.
Para configurar a ingestão única, selecione a seta suspensa de frequência e selecione Once.
Intervale Backfillare não visível durante uma ingestão única.
Depois de fornecer os valores apropriados para o agendamento, selecione Next.
A etapa Dataflow detail é exibida, permitindo que você nomeie e forneça uma breve descrição sobre seu novo dataflow.
Durante esse processo, você também pode ativar A ingestão parcial e Diagnósticos de erro. Habilitar A ingestão parcial oferece a capacidade de assimilar dados que contenham erros até um certo limite. Quando A ingestão parcial estiver ativada, arraste o seletor Limite de erro % para ajustar o limite de erro do lote. Como alternativa, você pode ajustar manualmente o limite selecionando a caixa de entrada. Para obter mais informações, consulte a visão geral da ingestão parcial de lote.
Forneça valores para o fluxo de dados e selecione Next.
A etapa Revisar é exibida, permitindo que você revise seu novo fluxo de dados antes de ele ser criado. Os detalhes são agrupados nas seguintes categorias:
Depois de revisar seu fluxo de dados, clique em Concluir e aguarde algum tempo para que o fluxo de dados seja criado.
Depois que seu fluxo de dados for criado, você poderá monitorar os dados que estão sendo assimilados por ele para ver informações sobre taxas de ingestão, sucesso e erros. Para obter mais informações sobre como monitorar o fluxo de dados, consulte o tutorial em contas de monitoramento e fluxos de dados na interface do usuário.
Você pode excluir fluxos de dados que não são mais necessários ou foram criados incorretamente usando a função Delete disponível na área de trabalho Fluxos de dados. Para obter mais informações sobre como excluir fluxos de dados, consulte o tutorial em excluir fluxos de dados na interface do usuário.
Ao seguir este tutorial, você criou com êxito um fluxo de dados para trazer dados de um banco de dados externo e obteve informações sobre o monitoramento de conjuntos de dados. Os dados recebidos agora podem ser usados por serviços downstream Platform, como Real-time Customer Profile e Data Science Workspace. Consulte os seguintes documentos para obter mais detalhes:
As seções a seguir fornecem informações adicionais para trabalhar com conectores de origem.
Quando um fluxo de dados é criado, ele imediatamente se torna ativo e ingere dados de acordo com o agendamento que foi fornecido. Você pode desativar um fluxo de dados ativo a qualquer momento seguindo as instruções abaixo.
Na área de trabalho Origens, selecione a guia Fluxos de dados. Em seguida, selecione o fluxo de dados que deseja desativar.
A coluna Propriedades aparece no lado direito da tela, incluindo um botão de alternância Ativado. Selecione a alternância para desativar o fluxo de dados. A mesma alternância pode ser usada para reativar um fluxo de dados depois que ele for desativado.
Os dados de entrada do seu conector de origem podem ser usados para enriquecer e preencher seus dados Real-time Customer Profile. Para obter mais informações sobre como preencher seus dados Real-time Customer Profile, consulte o tutorial em preenchimento do Perfil.