Compactar arquivos de origem em uma receita

Este tutorial fornece instruções sobre como empacotar os arquivos de origem da amostra de Vendas de varejo fornecidos em um arquivo de arquivamento, que pode ser usado para criar uma receita no Adobe Experience Platform Data Science Workspace seguindo o fluxo de trabalho de importação da receita na interface do usuário ou usando a API.

Conceitos a serem compreendidos:

  • Receitas: Uma receita é um termo treinado para uma especificação de modelo e um contêiner de nível superior que representa um aprendizado de máquina específico, algoritmo de inteligência artificial ou conjunto de algoritmos, lógica de processamento e configuração necessários para criar e executar um modelo e, portanto, ajudar a resolver problemas específicos de negócios.
  • Arquivos de origem: Arquivos individuais no seu projeto que contêm a lógica de uma receita.

Pré-requisitos

Criação de receita

A criação de receita começa com arquivos de origem de empacotamento para criar um arquivo de arquivamento. Os arquivos de origem definem a lógica e os algoritmos de aprendizado de máquina usados para resolver um problema específico em mãos e são escritos em Python, R, PySpark ou Scala. Os arquivos de arquivamento incorporados assumem a forma de uma imagem Docker. Uma vez criado, o arquivo de arquivamento empacotado é importado para Data Science Workspace para criar uma receita na interface do usuário ou usando a API.

Criação de modelo baseado em Docker

Uma imagem do Docker permite que um desenvolvedor empacote um aplicativo com todas as partes necessárias, como bibliotecas e outras dependências, e envie-o como um único pacote.

A imagem do Docker criada é enviada para o Registro do Contêiner do Azure usando credenciais fornecidas para você durante o fluxo de trabalho de criação da receita.

Para obter suas credenciais do Registro do Contêiner do Azure, faça logon em Adobe Experience Platform. Na coluna de navegação à esquerda, navegue até Workflows. Selecione Import Recipe seguido por selecionar Launch. Veja a captura de tela abaixo para referência.

A página Configure é aberta. Forneça um Recipe Name apropriado, por exemplo, "receita de vendas de varejo" e, opcionalmente, forneça uma descrição ou um URL de documentação. Depois de concluir, clique em Next.

Selecione o Tempo de Execução apropriado e escolha um Classification para Tipo. As credenciais do Registro do Contêiner do Azure são geradas após a conclusão.

OBSERVAÇÃO

** Tipo é a classe de problema de aprendizado de máquina para a qual a receita foi projetada e é usada após o treinamento para ajudar a avaliar a execução do treinamento.

DICA
  • Para Python receitas, selecione o Python tempo de execução.
  • Para receitas R, selecione o tempo de execução R.
  • Para fórmulas PySpark, selecione o tempo de execução PySpark. Um tipo de artefato é preenchido automaticamente.
  • Para fórmulas Scala, selecione o tempo de execução Spark. Um tipo de artefato é preenchido automaticamente.

Observe os valores para Host Docker, nome de usuário e senha. Eles são usados para criar e mover sua imagem Docker nos fluxos de trabalho descritos abaixo.

OBSERVAÇÃO

O URL de origem é fornecido após concluir as etapas descritas abaixo. O arquivo de configuração é explicado em tutoriais subsequentes encontrados em próximas etapas.

Compacte os arquivos de origem

Comece obtendo a base de código de amostra encontrada no repositório Experience Platform Data Science Workspace Reference.

Criar Python Imagem do Docker

Se ainda não tiver feito isso, clone o repositório GitHub no sistema local com o seguinte comando:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Navegue até o diretório experience-platform-dsw-reference/recipes/python/retail. Aqui, você encontrará os scripts login.sh e build.sh usados para fazer logon no Docker e criar a imagem Python Docker. Se você tiver suas credenciais do Docker prontas, insira os seguintes comandos em ordem:

# for logging in to Docker
./login.sh
 
# for building Docker image
./build.sh

Observe que, ao executar o script de login, você precisa fornecer o host do Docker, nome de usuário e senha. Ao criar, é necessário fornecer o host Docker e uma tag de versão para a build.

Quando o script de compilação for concluído, você receberá um URL de arquivo de origem Docker na saída do console. Para este exemplo específico, será semelhante a:

# URL format: 
{DOCKER_HOST}/ml-retailsales-python:{VERSION_TAG}

Copie esse URL e vá para as próximas etapas.

Criar imagem R Docker

Se ainda não tiver feito isso, clone o repositório GitHub no sistema local com o seguinte comando:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Navegue até o diretório experience-platform-dsw-reference/recipes/R/Retail - GradientBoosting dentro do repositório clonado. Aqui, você encontrará os arquivos login.sh e build.sh que usará para fazer logon no Docker e para criar a imagem R Docker. Se você tiver suas credenciais do Docker prontas, insira os seguintes comandos em ordem:

# for logging in to Docker
./login.sh
 
# for build Docker image
./build.sh

Observe que, ao executar o script de login, você precisa fornecer o host do Docker, nome de usuário e senha. Ao criar, é necessário fornecer o host Docker e uma tag de versão para a build.

Quando o script de compilação for concluído, você receberá um URL de arquivo de origem Docker na saída do console. Para este exemplo específico, será semelhante a:

# URL format: 
{DOCKER_HOST}/ml-retail-r:{VERSION_TAG}

Copie esse URL e vá para as próximas etapas.

Criar imagem do Docker PySpark

Comece clonando o repositório GitHub em seu sistema local com o seguinte comando:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Navegue até o diretório experience-platform-dsw-reference/recipes/pyspark/retail. Os scripts login.sh e build.sh estão localizados aqui e são usados para fazer logon no Docker e para criar a imagem do Docker. Se você tiver suas credenciais do Docker prontas, insira os seguintes comandos em ordem:

# for logging in to Docker
./login.sh
 
# for building Docker image
./build.sh

Observe que, ao executar o script de login, você precisa fornecer o host do Docker, nome de usuário e senha. Ao criar, é necessário fornecer o host Docker e uma tag de versão para a build.

Quando o script de compilação for concluído, você receberá um URL de arquivo de origem Docker na saída do console. Para este exemplo específico, será semelhante a:

# URL format: 
{DOCKER_HOST}/ml-retailsales-pyspark:{VERSION_TAG}

Copie esse URL e vá para as próximas etapas.

Criar imagem do Docker Scala

Comece clonando o repositório GitHub em seu sistema local com o seguinte comando no terminal:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Em seguida, navegue até o diretório experience-platform-dsw-reference/recipes/scala, onde é possível encontrar os scripts login.sh e build.sh. Esses scripts são usados para fazer logon no Docker e criar a imagem Docker. Se você tiver suas credenciais do Docker prontas, insira os seguintes comandos para terminal em ordem:

# for logging in to Docker
./login.sh
 
# for building Docker image
./build.sh
DICA

Se você estiver recebendo um erro de permissão ao tentar fazer logon no Docker usando o script login.sh, tente usar o comando bash login.sh.

Ao executar o script de login, você precisa fornecer o host do Docker, nome de usuário e senha. Ao criar, é necessário fornecer o host Docker e uma tag de versão para a build.

Quando o script de compilação for concluído, você receberá um URL de arquivo de origem Docker na saída do console. Para este exemplo específico, será semelhante a:

# URL format: 
{DOCKER_HOST}/ml-retailsales-spark:{VERSION_TAG}

Copie esse URL e vá para as próximas etapas.

Próximas etapas

Este tutorial foi empacotando arquivos de origem em uma Receita, a etapa de pré-requisito para importar uma Receita em Data Science Workspace. Agora, você deve ter uma imagem do Docker no Registro do Contêiner do Azure junto com o URL da imagem correspondente. Agora você está pronto para iniciar o tutorial sobre importação de uma receita empacotada para Data Science Workspace. Selecione um dos links tutoriais abaixo para começar:

Nesta página