Fingir que você possui um site de varejo online. Quando seus clientes fazem compras em seu site de varejo, você deseja apresentar a eles recomendações personalizadas de produtos para expor uma variedade de outros produtos suas ofertas comerciais. Ao longo da existência de seu site, você coletou continuamente os dados do cliente e deseja, de alguma forma, usar esses dados para gerar recomendações personalizadas de produtos.
Adobe Experience Platform Data Science Workspace fornece os meios para atingir sua meta usando a Receita Recommendations de produto pré-criada. Siga este tutorial para ver como você pode acessar e entender seus dados de varejo, criar e otimizar um Modelo de aprendizado de máquina e gerar insights em Data Science Workspace.
Este tutorial reflete o fluxo de trabalho de Data Science Workspace e aborda as seguintes etapas para criar um Modelo de aprendizado de máquina:
Antes de iniciar este tutorial, você deve ter os seguintes pré-requisitos:
Acesso a Adobe Experience Platform. Se você não tiver acesso a uma Organização IMS em Experience Platform, fale com o administrador do sistema antes de continuar.
Ativar ativos. Entre em contato com seu representante de conta para obter os seguintes itens fornecidos para você.
Baixe os três arquivos Jupyter Notebook necessários do Adobe public Git repositório, eles serão usados para demonstrar o fluxo de trabalho JupyterLab em Data Science Workspace.
Um entendimento prático dos seguintes conceitos-chave usados neste tutorial:
Para criar um Modelo de aprendizado de máquina que faça recomendações personalizadas de produto para seus clientes, as compras anteriores de clientes em seu site devem ser analisadas. Esta seção explora como esses dados são ingeridos em Platform até Adobe Analytics, e como esses dados são transformados em um conjunto de dados de Recurso a ser usado pelo Modelo de aprendizado da máquina.
Os outros conjuntos de dados foram pré-preenchidos com lotes para fins de visualização. É possível visualização desses conjuntos de dados repetindo as etapas acima.
Nome do conjunto de dados | Esquema | Descrição |
---|---|---|
PostValues do conjunto de dados dourados | Schema do conjunto de dados Golden | Analytics dados de origem de seu site |
Conjunto de dados de entrada da Recommendations | Schema Recommendations Input | Os dados Analytics são transformados em um conjunto de dados de treinamento usando um pipeline de recursos. Esses dados são usados para treinar o Modelo de aprendizado da máquina Recommendations do Produto. itemid e userid correspondem a um produto comprado por esse cliente. |
Conjunto de dados de saída Recommendations | Schema de saída Recommendations | O conjunto de dados para o qual os resultados da pontuação são armazenados, conterá a lista de produtos recomendados para cada cliente. |
O segundo componente do ciclo de vida Data Science Workspace envolve a criação de Fórmulas e Modelos. A Receita Recommendations do produto foi projetada para gerar recomendações de produto em escala utilizando dados de compra anteriores e aprendizado de máquina.
As receitas são a base para um Modelo, pois contêm algoritmos de aprendizado de máquina e lógica projetada para resolver problemas específicos. O mais importante é que as Fórmulas permitem que você democratize o aprendizado de máquina em toda a sua organização, permitindo que outros usuários acessem um Modelo para casos de uso diferentes sem gravar nenhum código.
Agora você revisou os schemas de entrada e saída exigidos pela Receita Recommendations do Produto. Agora você pode continuar com a próxima seção para descobrir como criar, treinar e avaliar um Modelo Recommendations de produto.
Agora que seus dados estão preparados e a Receita está pronta para ser usada, você pode criar, treinar e avaliar seu Modelo de aprendizado da máquina.
Um Modelo é uma instância de uma Receita, permitindo que você treine e classifique com dados em escala.
Você pode optar por aguardar a conclusão da execução do treinamento ou continuar a criar uma nova execução de treinamento na seção a seguir.
Na página Visão geral do modelo, clique em Treinar próximo ao canto superior direito para criar uma nova execução de treinamento. Selecione o mesmo conjunto de dados de entrada que você usou ao criar o Modelo e clique em Próximo.
A página Configuração é exibida. Aqui você pode configurar o valor "num_Recomendações" da execução de treinamento, também conhecido como Hiperparâmetro. Um Modelo treinado e otimizado utilizará os hiperparâmetros de melhor desempenho com base nos resultados da execução do treinamento.
Hiperparâmetros não podem ser aprendidos, portanto, eles devem ser atribuídos antes que as execuções de treinamento ocorram. Ajustar hiperparâmetros pode alterar a precisão do modelo treinado. Como a otimização de um modelo é um processo iterativo, podem ser necessárias várias execuções de treinamento antes de se obter uma avaliação satisfatória.
Defina num_Recomendações como 10.
Um ponto de dados adicional aparecerá no gráfico de avaliação de Modelo quando a nova execução de treinamento for concluída, isso pode levar vários minutos.
Sempre que uma execução de treinamento for concluída, você poderá visualização as métricas de avaliação resultantes para determinar o desempenho do Modelo.
A etapa final do fluxo de trabalho da Data Science é operacionalizar seu modelo para pontuar e consumir insights de seu armazenamento de dados.
Depois que a execução da pontuação for concluída com êxito, você poderá pré-visualização os resultados e visualização os insights gerados.
Muito bem, vocês geraram com sucesso recomendações de produtos!
Este tutorial apresentou você ao fluxo de trabalho de Data Science Workspace, demonstrando como os dados brutos não processados podem ser transformados em informações úteis por meio do aprendizado da máquina. Para saber mais sobre como usar o Data Science Workspace, vá para o próximo guia em criar o schema de vendas de varejo e o conjunto de dados.