Compactar arquivos de origem em uma fórmula
Este tutorial fornece instruções sobre como empacotar os arquivos de origem de amostra de Vendas de Varejo em um arquivo morto, que pode ser usado para criar uma fórmula no Adobe Experience Platform Data Science Workspace seguindo o fluxo de trabalho de importação da fórmula na interface ou usando a API.
Conceitos a entender:
- Receitas: uma fórmula é um termo de Adobe para uma especificação de Modelo e é um contêiner de nível superior que representa um aprendizado de máquina específico, algoritmo de inteligência artificial ou conjunto de algoritmos, lógica de processamento e configuração necessários para criar e executar um modelo treinado e, portanto, ajudar a resolver problemas comerciais específicos.
- Arquivos Source: arquivos individuais em seu projeto que contêm a lógica de uma fórmula.
Pré-requisitos
Criação de fórmula
A criação de fórmula começa com o empacotamento de arquivos de origem para criar um arquivo de arquivamento. Os arquivos Source definem a lógica e os algoritmos de aprendizado de máquina usados para resolver um problema específico em andamento, e são escritos em Python, R, PySpark ou Scala. Os arquivos de arquivamento criados assumem a forma de uma imagem do Docker. Depois de criado, o arquivo morto empacotado é importado para Data Science Workspace para criar uma fórmula na interface ou usando a API.
Criação de modelo baseado no Docker docker-based-model-authoring
Uma imagem Docker permite que um desenvolvedor empacote um aplicativo com todas as partes necessárias, como bibliotecas e outras dependências, e o envie como um pacote.
A imagem do Docker criada é enviada para o Registro de Contêineres do Azure usando as credenciais fornecidas durante o fluxo de trabalho de criação da fórmula.
Para obter suas credenciais do Registro de Contêineres do Azure, faça logon no Adobe Experience Platform. Na coluna de navegação à esquerda, navegue até Workflows. Selecione Importar fórmula, e depois Iniciar. Consulte a captura de tela abaixo para referência.
A página Configurar é aberta. Forneça um Nome da fórmula apropriado, por exemplo, "Receita de vendas de varejo", e, opcionalmente, forneça uma descrição ou URL de documentação. Depois de concluído, clique em Avançar.
Selecione o Tempo de Execução apropriado e escolha uma Classificação para Tipo. Suas credenciais do Registro do Azure Container são geradas após a conclusão.
- Para receitas Python, selecione o tempo de execução Python.
- Para receitas R, selecione o tempo de execução R.
- Para receitas do PySpark, selecione o tempo de execução PySpark. Um tipo de artefato é preenchido automaticamente.
- Para receitas Scala, selecione o tempo de execução Spark. Um tipo de artefato é preenchido automaticamente.
Observe os valores para o host Docker, nome de usuário e senha. Eles são usados para criar e enviar por push a imagem do Docker nos fluxos de trabalho descritos abaixo.
Compactar os arquivos de origem
Comece obtendo a base de código de amostra encontrada no repositório Experience Platform Data Science Workspace Reference.
Compilar imagem do Docker Python python-docker
Se ainda não tiver feito isso, clone o repositório do GitHub no sistema local com o seguinte comando:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
Navegue até o diretório experience-platform-dsw-reference/recipes/python/retail
. Aqui, você encontrará os scripts login.sh
e build.sh
usados para fazer logon no Docker e criar a imagem Python Docker. Se você tiver suas Credenciais do Docker prontas, insira os seguintes comandos na ordem:
# for logging in to Docker
./login.sh
# for building Docker image
./build.sh
Observe que, ao executar o script de login, você precisa fornecer o host Docker, o nome de usuário e a senha. Ao criar, você deve fornecer o host do Docker e uma tag de versão para o build.
Quando o script de build estiver concluído, você receberá um URL de arquivo de origem Docker na saída do console. Neste exemplo específico, será semelhante a:
# URL format:
{DOCKER_HOST}/ml-retailsales-python:{VERSION_TAG}
Copie esta URL e vá para as próximas etapas.
Compilar R Docker imagem r-docker
Se ainda não tiver feito isso, clone o repositório do GitHub no sistema local com o seguinte comando:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
Navegue até o diretório experience-platform-dsw-reference/recipes/R/Retail - GradientBoosting
dentro do repositório clonado. Aqui, você encontrará os arquivos login.sh
e build.sh
que usará para fazer logon no Docker e criar a imagem do R Docker. Se você tiver suas Credenciais do Docker prontas, insira os seguintes comandos na ordem:
# for logging in to Docker
./login.sh
# for build Docker image
./build.sh
Observe que, ao executar o script de login, você precisa fornecer o host Docker, o nome de usuário e a senha. Ao criar, você deve fornecer o host do Docker e uma tag de versão para o build.
Quando o script de build estiver concluído, você receberá um URL de arquivo de origem Docker na saída do console. Neste exemplo específico, será semelhante a:
# URL format:
{DOCKER_HOST}/ml-retail-r:{VERSION_TAG}
Copie esta URL e vá para as próximas etapas.
Criar imagem do PySpark Docker pyspark-docker
Comece clonando o repositório GitHub no sistema local com o seguinte comando:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
Navegue até o diretório experience-platform-dsw-reference/recipes/pyspark/retail
. Os scripts login.sh
e build.sh
estão localizados aqui e são usados para fazer logon no Docker e criar a imagem do Docker. Se você tiver suas Credenciais do Docker prontas, insira os seguintes comandos na ordem:
# for logging in to Docker
./login.sh
# for building Docker image
./build.sh
Observe que, ao executar o script de login, você precisa fornecer o host Docker, o nome de usuário e a senha. Ao criar, você deve fornecer o host do Docker e uma tag de versão para o build.
Quando o script de build estiver concluído, você receberá um URL de arquivo de origem Docker na saída do console. Neste exemplo específico, será semelhante a:
# URL format:
{DOCKER_HOST}/ml-retailsales-pyspark:{VERSION_TAG}
Copie esta URL e vá para as próximas etapas.
Criar imagem do Scala Docker scala-docker
Comece clonando o repositório GitHub no sistema local com o seguinte comando no terminal:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
Em seguida, navegue até o diretório experience-platform-dsw-reference/recipes/scala
, onde você pode encontrar os scripts login.sh
e build.sh
. Esses scripts são usados para fazer logon no Docker e criar a imagem do Docker. Se você tiver suas Credenciais do Docker prontas, digite os seguintes comandos para o terminal em ordem:
# for logging in to Docker
./login.sh
# for building Docker image
./build.sh
login.sh
, tente usar o comando bash login.sh
.Ao executar o script de login, você precisa fornecer o host Docker, o nome de usuário e a senha. Ao criar, você deve fornecer o host do Docker e uma tag de versão para o build.
Quando o script de build estiver concluído, você receberá um URL de arquivo de origem Docker na saída do console. Neste exemplo específico, será semelhante a:
# URL format:
{DOCKER_HOST}/ml-retailsales-spark:{VERSION_TAG}
Copie esta URL e vá para as próximas etapas.
Próximas etapas next-steps
Este tutorial foi sobre o empacotamento de arquivos de origem em uma fórmula, a etapa de pré-requisito para a importação de uma fórmula para Data Science Workspace. Agora você deve ter uma imagem do Docker no Registro de contêineres do Azure junto com a URL da imagem correspondente. Agora você está pronto para começar o tutorial sobre como importar uma fórmula em pacote para o Data Science Workspace. Selecione um dos links de tutorial abaixo para começar: