Criar e publicar um modelo de aprendizado de máquina

Fingir que você possui um site de varejo online. Quando seus clientes fazem compras em seu site de varejo, você deseja apresentar a eles recomendações personalizadas de produtos para expor uma variedade de outros produtos suas ofertas comerciais. Ao longo da existência de seu site, você coletou continuamente os dados do cliente e deseja, de alguma forma, usar esses dados para gerar recomendações personalizadas de produtos.

Adobe Experience Platform Data Science Workspace fornece os meios para atingir sua meta usando a Receita Recommendations de produto pré-criada. Siga este tutorial para ver como você pode acessar e entender seus dados de varejo, criar e otimizar um Modelo de aprendizado de máquina e gerar insights em Data Science Workspace.

Este tutorial reflete o fluxo de trabalho de Data Science Workspace e aborda as seguintes etapas para criar um Modelo de aprendizado de máquina:

  1. Preparar seus dados
  2. Criar seu modelo
  3. Treinar e avaliar seu modelo
  4. Operacionalizar seu modelo

Introdução

Antes de iniciar este tutorial, você deve ter os seguintes pré-requisitos:

  • Acesso a Adobe Experience Platform. Se você não tiver acesso a uma Organização IMS em Experience Platform, fale com o administrador do sistema antes de continuar.

  • Ativar ativos. Entre em contato com seu representante de conta para obter os seguintes itens fornecidos para você.

    • Receita do Recommendations
    • Conjunto de dados de entrada da Recommendations
    • Schema Recommendations Input
    • Conjunto de dados de saída Recommendations
    • Schema de saída Recommendations
    • PostValues do conjunto de dados dourados
    • Schema do conjunto de dados Golden
  • Baixe os três arquivos Jupyter Notebook necessários do Adobe public Git repositório, eles serão usados para demonstrar o fluxo de trabalho JupyterLab em Data Science Workspace.

  • Um entendimento prático dos seguintes conceitos-chave usados neste tutorial:

    • Experience Data Model: O esforço de padronização realizado pelo Adobe para definir schemas padrão, como Profile e ExperienceEvent, para o Gerenciamento de experiência do cliente.
    • Conjuntos de dados: Uma construção de armazenamento e gerenciamento para dados reais. Uma instância física instanciada de um Schema XDM.
    • Lotes: Os conjuntos de dados são compostos de lotes. Um lote é um conjunto de dados coletados durante um período de tempo e processados juntos como uma única unidade.
    • JupyterLab: JupyterLab é uma interface baseada na Web de código aberto para o Project Jupyter e é totalmente integrada ao Experience Platform.

Preparar seus dados

Para criar um Modelo de aprendizado de máquina que faça recomendações personalizadas de produto para seus clientes, as compras anteriores de clientes em seu site devem ser analisadas. Esta seção explora como esses dados são ingeridos em Platform até Adobe Analytics, e como esses dados são transformados em um conjunto de dados de Recurso a ser usado pelo Modelo de aprendizado da máquina.

Explore os dados e entenda os schemas

  1. Faça logon em Adobe Experience Platform e clique em Conjuntos de dados para lista de todos os conjuntos de dados existentes e selecione o conjunto de dados que deseja explorar. Nesse caso, o conjunto de dados Analytics Golden Data Set postValues.
  2. Selecione Conjunto de Dados de Pré-visualização perto da parte superior direita para examinar os registros de amostra e clique em Fechar.
  3. Selecione o link em Schema no painel direito para visualização do schema do conjunto de dados e, em seguida, retorne à página de detalhes do conjunto de dados."

Os outros conjuntos de dados foram pré-preenchidos com lotes para fins de visualização. É possível visualização desses conjuntos de dados repetindo as etapas acima.

Nome do conjunto de dados Esquema Descrição
PostValues do conjunto de dados dourados Schema do conjunto de dados Golden Analytics dados de origem de seu site
Conjunto de dados de entrada da Recommendations Schema Recommendations Input Os dados Analytics são transformados em um conjunto de dados de treinamento usando um pipeline de recursos. Esses dados são usados para treinar o Modelo de aprendizado da máquina Recommendations do Produto. itemid e userid correspondem a um produto comprado por esse cliente.
Conjunto de dados de saída Recommendations Schema de saída Recommendations O conjunto de dados para o qual os resultados da pontuação são armazenados, conterá a lista de produtos recomendados para cada cliente.

Crie seu modelo

O segundo componente do ciclo de vida Data Science Workspace envolve a criação de Fórmulas e Modelos. A Receita Recommendations do produto foi projetada para gerar recomendações de produto em escala utilizando dados de compra anteriores e aprendizado de máquina.

As receitas são a base para um Modelo, pois contêm algoritmos de aprendizado de máquina e lógica projetada para resolver problemas específicos. O mais importante é que as Fórmulas permitem que você democratize o aprendizado de máquina em toda a sua organização, permitindo que outros usuários acessem um Modelo para casos de uso diferentes sem gravar nenhum código.

Explore a receita da Recommendations do produto

  1. Em Adobe Experience Platform, navegue até Modelos na coluna de navegação esquerda e clique em Receitas na parte superior para visualização de uma lista de Receitas disponíveis para a sua organização.
  2. Localize e abra a Receita do Recommendations fornecida clicando no nome.
  3. No painel direito, clique em Schema Recommendations Input para visualização do schema que alimenta a fórmula. Os campos de schema "itemId" e "userId" correspondem a um produto comprado (ativityType) por esse cliente em um horário específico (timestamp). Siga as mesmas etapas para revisar os campos do Schema de saída do Recommendations.

Agora você revisou os schemas de entrada e saída exigidos pela Receita Recommendations do Produto. Agora você pode continuar com a próxima seção para descobrir como criar, treinar e avaliar um Modelo Recommendations de produto.

Treinar e avaliar seu modelo

Agora que seus dados estão preparados e a Receita está pronta para ser usada, você pode criar, treinar e avaliar seu Modelo de aprendizado da máquina.

Criar um modelo

Um Modelo é uma instância de uma Receita, permitindo que você treine e classifique com dados em escala.

  1. Em Adobe Experience Platform, navegue até Modelos na coluna de navegação esquerda e clique em Receitas na parte superior da página para exibir uma lista de todas as Receitas disponíveis para sua organização.
  2. Localize e abra a Receita do Recommendations, clicando no seu nome, inserindo a página de visão geral da Receita. Clique em Criar um Modelo a partir do centro (se não houver Modelos existentes) ou a partir do canto superior direito da página Visão geral da receita.
  3. Uma lista de conjuntos de dados de entrada disponíveis para treinamento é mostrada, selecione Conjunto de dados de entrada da Recommendations e clique em Próximo.
  4. Forneça um nome para o Modelo, por exemplo "Modelo Recommendations do produto". As configurações disponíveis para o modelo são listadas, contendo as configurações para o treinamento padrão do Modelo e os comportamentos de pontuação. Nenhuma alteração é necessária, pois essas configurações são específicas da sua organização. Revise as configurações e clique em Concluir.
  5. O Modelo foi criado e a página Visão geral do Modelo é exibida em uma execução de treinamento recém-gerada. Uma execução de treinamento é gerada por padrão quando um Modelo é criado.

Você pode optar por aguardar a conclusão da execução do treinamento ou continuar a criar uma nova execução de treinamento na seção a seguir.

Treinar o modelo usando hiperparâmetros personalizados

  1. Na página Visão geral do modelo, clique em Treinar próximo ao canto superior direito para criar uma nova execução de treinamento. Selecione o mesmo conjunto de dados de entrada que você usou ao criar o Modelo e clique em Próximo.

  2. A página Configuração é exibida. Aqui você pode configurar o valor "num_Recomendações" da execução de treinamento, também conhecido como Hiperparâmetro. Um Modelo treinado e otimizado utilizará os hiperparâmetros de melhor desempenho com base nos resultados da execução do treinamento.

    Hiperparâmetros não podem ser aprendidos, portanto, eles devem ser atribuídos antes que as execuções de treinamento ocorram. Ajustar hiperparâmetros pode alterar a precisão do modelo treinado. Como a otimização de um modelo é um processo iterativo, podem ser necessárias várias execuções de treinamento antes de se obter uma avaliação satisfatória.

    DICA

    Defina num_Recomendações como 10.

  3. Um ponto de dados adicional aparecerá no gráfico de avaliação de Modelo quando a nova execução de treinamento for concluída, isso pode levar vários minutos.

Avaliar o modelo

Sempre que uma execução de treinamento for concluída, você poderá visualização as métricas de avaliação resultantes para determinar o desempenho do Modelo.

  1. Analise as métricas de avaliação (Precisão e Chamada) para cada execução de treinamento concluída clicando em na execução de treinamento.
  2. Explore as informações fornecidas para cada métrica de avaliação. Quanto maior for a métrica, melhor será o desempenho do Modelo.
  3. Você pode ver o conjunto de dados, o schema e os parâmetros de configuração usados para cada execução de treinamento no painel direito.
  4. Navegue até a página Modelo e identifique a execução de treinamento de melhor desempenho observando suas métricas de avaliação.

Operacionalizar seu modelo

A etapa final do fluxo de trabalho da Data Science é operacionalizar seu modelo para pontuar e consumir insights de seu armazenamento de dados.

Pontuação e geração de insights

  1. Na página Modelo Visão geral das recomendações do produto, clique no nome da execução de treinamento com melhor desempenho, com os valores mais altos de recuperação e precisão.
  2. Na parte superior direita da página de detalhes da execução de treinamento, clique em Pontuação.
  3. Selecione o Conjunto de Dados de Entrada da Recommendations como o conjunto de dados de entrada de pontuação, que é o mesmo conjunto de dados que você usou quando criou o Modelo e executou suas execuções de treinamento. Em seguida, clique em Next.
  4. Selecione Conjunto de Dados de Saída do Recommendations como o conjunto de dados de saída de pontuação. Os resultados da pontuação serão armazenados neste conjunto de dados como um lote.
  5. Revise as configurações de pontuação. Esses parâmetros contêm os conjuntos de dados de entrada e saída selecionados anteriormente, juntamente com os schemas apropriados. Clique em Concluir para iniciar a execução da pontuação. A execução pode levar vários minutos para ser concluída.

insights pontuados pela visualização

Depois que a execução da pontuação for concluída com êxito, você poderá pré-visualização os resultados e visualização os insights gerados.

  1. Na página de execuções de pontuação, clique na execução de pontuação concluída e, em seguida, clique em Conjunto de Dados de Resultados de Pontuação de Pré-visualização no painel direito.
  2. Na tabela pré-visualização, cada linha contém recomendações de produto para um cliente específico, rotuladas como recomendações e userId respectivamente. Como o hiperparâmetro num_instructions estava definido como 10 nas capturas de tela de amostra, cada linha de recomendações pode conter até 10 identidades de produto delimitadas por um sinal de número (#).

Próximas etapas

Muito bem, vocês geraram com sucesso recomendações de produtos!

Este tutorial apresentou você ao fluxo de trabalho de Data Science Workspace, demonstrando como os dados brutos não processados podem ser transformados em informações úteis por meio do aprendizado da máquina. Para saber mais sobre como usar o Data Science Workspace, vá para o próximo guia em criar o schema de vendas de varejo e o conjunto de dados.

Nesta página

Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free