Documentação Experience Platform Guia do espaço de trabalho do Data Science

Criar e publicar um modelo de aprendizado de máquina

Last update: Tue Aug 06 2024 00:00:00 GMT+0000 (Coordinated Universal Time)

Tópicos:
Data Science Workspace

Criado para:

Usuário
Desenvolvedor

NOTE

O Data Science Workspace não está mais disponível para compra.

Esta documentação destina-se aos clientes existentes com direitos anteriores ao Data Science Workspace.

O guia a seguir descreve as etapas necessárias para criar e publicar um modelo de aprendizado de máquina. Cada seção contém uma descrição do que será feito e um link para a interface do usuário e a documentação da API para executar a etapa descrita.

Introdução

Antes de iniciar este tutorial, você deve ter os seguintes pré-requisitos:

Acesso a Adobe Experience Platform. Se você não tiver acesso a uma organização no Experience Platform, fale com o administrador do sistema antes de continuar.
Todos os tutoriais do Data Science Workspace usam o modelo de propensão Luma. Para acompanhar, você deve ter criado os esquemas e conjuntos de dados do modelo de propensão Luma.

Explore os dados e entenda os esquemas

Faça logon no Adobe Experience Platform e selecione Conjuntos de dados para listar todos os conjuntos de dados existentes e selecione o conjunto de dados que deseja explorar. Nesse caso, você deve selecionar o conjunto de dados Dados da Web do Luma.

selecione o conjunto de dados da Web Luma

A página de atividade do conjunto de dados é aberta, listando as informações relacionadas ao seu conjunto de dados. Você pode selecionar Visualizar conjunto de dados próximo ao canto superior direito para examinar registros de amostra. Também é possível visualizar o esquema do conjunto de dados selecionado.

visualizar dados da Web do Luma

Selecione o link do esquema no painel direito. Um popover é exibido. Selecionar o link sob nome do esquema abre o esquema em uma nova guia.

visualizar o esquema de dados da web da luma

Você pode explorar mais os dados usando o bloco de anotações da Análise de Dados Exploratórios (EDA) fornecido. Esse bloco de notas pode ser usado para ajudar a entender os padrões nos dados do Luma, verificar a integridade dos dados e resumir os dados relevantes para o modelo de propensão preditiva. Para saber mais sobre a Análise de Dados Exploratórios, visite a documentação da EDA.

Criar a fórmula de propensão do Luma author-your-model

Um componente principal do ciclo de vida de Data Science Workspace envolve a criação de Receitas e Modelos. O modelo de propensão da Luma foi projetado para gerar uma previsão sobre se os clientes têm uma alta propensão para comprar um produto da Luma.

Para criar o modelo de propensão Luma, o modelo do construtor de fórmula é usado. Receitas são a base para um Modelo, pois contêm algoritmos de aprendizado de máquina e lógica projetada para resolver problemas específicos. Mais importante ainda, as receitas permitem democratizar o aprendizado de máquina em toda a organização, permitindo que outros usuários acessem um modelo para casos de uso diferentes sem escrever nenhum código.

Siga o tutorial criar um modelo usando o JupyterLab Notebooks para criar a fórmula do modelo de propensão Luma usada nos tutoriais subsequentes.

Importar e empacotar uma fórmula de fontes externas (opcional)

Se você quiser importar e empacotar uma fórmula para uso no Data Science Workspace, será necessário empacotar os arquivos de origem em um arquivo. Siga os arquivos de origem do pacote em um tutorial de fórmula. Este tutorial mostra como empacotar arquivos de origem em uma fórmula, que é a etapa de pré-requisito para importar uma fórmula no Data Science Workspace. Depois que o tutorial for concluído, você receberá uma imagem do Docker em um Registro de contêiner do Azure, juntamente com a URL da imagem correspondente, ou seja, um arquivo morto.

Este arquivo pode ser usado para criar uma fórmula no Data Science Workspace seguindo o fluxo de trabalho de importação da fórmula com o fluxo de trabalho da interface ou o fluxo de trabalho da API.

Treinar e avaliar um modelo train-and-evaluate-your-model

Agora que seus dados estão preparados e uma fórmula está pronta, você tem a capacidade de criar, treinar e avaliar ainda mais seu modelo de aprendizado de máquina. Ao usar o Construtor de fórmula, você já deve ter treinado, pontuado e avaliado seu modelo antes de compactá-lo em uma fórmula.

A interface do usuário e a API do Data Science Workspace permitem publicar sua fórmula como modelo. Além disso, você pode ajustar ainda mais aspectos específicos do modelo, como adicionar, remover e alterar hiperparâmetros.

Criar um modelo

Para saber mais sobre como criar um modelo usando a interface do usuário, visite o treinamento e avalie um modelo no tutorial de interface do usuário ou tutorial de API do Data Science Workspace. Este tutorial fornece um exemplo sobre como criar, treinar e atualizar hiperparâmetros para ajustar seu modelo.

NOTE

Os hiperparâmetros não podem ser aprendidos, portanto, eles devem ser atribuídos antes que ocorram execuções de treinamento. Ajustar os hiperparâmetros pode alterar a precisão do seu modelo treinado. Como a otimização de um modelo é um processo iterativo, várias execuções de treinamento podem ser necessárias antes de uma avaliação satisfatória ser alcançada.

Pontuar um modelo score-a-model

A próxima etapa na criação e publicação de um modelo é operacionalizar seu modelo para pontuar e consumir insights do data lake e do Perfil do cliente em tempo real.

A pontuação no Data Science Workspace pode ser alcançada alimentando dados de entrada em um modelo treinado existente. Os resultados da pontuação são armazenados e visualizados em um conjunto de dados de saída especificado como um novo lote.

Para saber como pontuar seu modelo, visite o tutorial da interface do usuário ou o tutorial da API do modelo.

Publish um modelo pontuado como um serviço

O Data Science Workspace permite publicar seu modelo treinado como um serviço. Isso permite que os usuários em sua organização pontuem dados sem a necessidade de criar seus próprios modelos.

Para saber como publicar um modelo como um serviço, visite o tutorial da interface ou o tutorial da API.

Programar treinamento automatizado para um serviço

Depois de publicar um modelo como um serviço, você pode configurar a pontuação programada e as execuções de treinamento para seu serviço de aprendizado de máquina. A automatização do processo de treinamento e de pontuação pode ajudar a manter e melhorar a eficiência de um serviço ao longo do tempo, acompanhando os padrões dos seus dados. Visite o agendamento de um modelo no tutorial da interface do usuário do Data Science Workspace.

NOTE

Você só pode agendar um modelo para treinamento e pontuação automatizados na interface do usuário do.

Próximas etapas next-steps

O Adobe Experience Platform Data Science Workspace fornece ferramentas e recursos para criar, avaliar e utilizar modelos de aprendizado de máquina para gerar previsões e insights de dados. Quando os insights de aprendizado de máquina são assimilados em um conjunto de dados habilitado para Profile, esses mesmos dados também são assimilados como Profile registros que podem ser segmentados usando Adobe Experience Platform Segmentation Service.

À medida que os dados de perfil e série temporal são assimilados, o Perfil do cliente em tempo real decide automaticamente incluir ou excluir esses dados dos segmentos por meio de um processo contínuo chamado segmentação por transmissão, antes de mesclá-los com os dados existentes e atualizar a visualização de união. Como resultado, você pode realizar cálculos instantaneamente e tomar decisões para fornecer experiências aprimoradas e individualizadas aos clientes, à medida que eles interagem com sua marca.

Visite o tutorial para enriquecimento do Perfil do cliente em tempo real com insights de aprendizado de máquina para saber mais sobre como você pode utilizar insights de aprendizado de máquina.

recommendation-more-help

cc79fe26-64da-411e-a6b9-5b650f53e4e9