Compactar arquivos de origem em uma fórmula
Este tutorial fornece instruções sobre como empacotar os arquivos de origem de amostra de Vendas de varejo em um arquivo, que pode ser usado para criar uma fórmula no Adobe Experience Platform Data Science Workspace seguindo o fluxo de trabalho de importação de fórmula na interface ou usando a API.
Conceitos a entender:
- Receitas: Uma fórmula é um termo de Adobe para uma especificação de Modelo e é um contêiner de nível superior que representa um aprendizado de máquina específico, algoritmo de inteligência artificial ou conjunto de algoritmos, lógica de processamento e configuração necessários para criar e executar um modelo treinado e, portanto, ajudar a resolver problemas comerciais específicos.
- Arquivos de origem: arquivos individuais no projeto que contêm a lógica de uma fórmula.
Pré-requisitos
Criação de fórmula
A criação de fórmula começa com o empacotamento de arquivos de origem para criar um arquivo de arquivamento. Os arquivos de origem definem a lógica e os algoritmos de aprendizado de máquina usados para resolver um problema específico em andamento, e são gravados em Python, R, PySpark ou Scala. Os arquivos de arquivamento criados assumem a forma de uma imagem do Docker. Depois de criado, o arquivo compactado é importado para o Data Science Workspace para criar uma fórmula na interface ou uso da API.
Criação de modelo baseado no Docker docker-based-model-authoring
Uma imagem Docker permite que um desenvolvedor empacote um aplicativo com todas as partes necessárias, como bibliotecas e outras dependências, e o envie como um pacote.
A imagem do Docker criada é enviada para o Registro de Contêineres do Azure usando as credenciais fornecidas durante o fluxo de trabalho de criação da fórmula.
Para obter as credenciais do Registro de Contêineres do Azure, faça logon no Adobe Experience Platform. Na coluna de navegação à esquerda, navegue até Fluxos de trabalho. Selecionar Importar fórmula seguido pela seleção Launch. Consulte a captura de tela abaixo para referência.
A variável Configurar é aberta. Fornecer uma Nome da fórmula, por exemplo, "Receita de vendas de varejo" e, opcionalmente, forneça uma descrição ou URL da documentação. Após a conclusão, clique em Próxima.
Selecione o apropriado Tempo de execução, em seguida, escolha um Classificação para Tipo. Suas credenciais do Registro do Azure Container são geradas após a conclusão.
- Para Python receitas selecione a Python tempo de execução.
- Para receitas R, selecione a R tempo de execução.
- Para receitas do PySpark, selecione o PySpark tempo de execução. Um tipo de artefato é preenchido automaticamente.
- Para receitas Scala, selecione a opção Spark tempo de execução. Um tipo de artefato é preenchido automaticamente.
Observe os valores para o host Docker, nome de usuário e senha. Eles são usados para criar e enviar seu Docker nos fluxos de trabalho descritos abaixo.
Compactar os arquivos de origem
Comece obtendo a base de código de amostra encontrada no Referência do Experience Platform Data Science Workspace repositório.
Build Python Imagem do Docker python-docker
Se ainda não tiver feito isso, clone o GitHub repositório no sistema local com o seguinte comando:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
Navegue até o diretório experience-platform-dsw-reference/recipes/python/retail
. Aqui, você encontrará os scripts login.sh
e build.sh
usado para fazer logon no Docker e criar o Python Docker imagem. Se você tiver seu Credenciais do Docker pronto, insira os seguintes comandos na ordem:
# for logging in to Docker
./login.sh
# for building Docker image
./build.sh
Observe que, ao executar o script de login, você precisa fornecer o host Docker, o nome de usuário e a senha. Ao criar, você deve fornecer o host do Docker e uma tag de versão para o build.
Quando o script de build estiver concluído, você receberá um URL de arquivo de origem Docker na saída do console. Neste exemplo específico, será semelhante a:
# URL format:
{DOCKER_HOST}/ml-retailsales-python:{VERSION_TAG}
Copie este URL e vá para a página próximas etapas.
Build R Docker imagem r-docker
Se ainda não tiver feito isso, clone o GitHub repositório no sistema local com o seguinte comando:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
Navegue até o diretório experience-platform-dsw-reference/recipes/R/Retail - GradientBoosting
no repositório clonado. Aqui, você encontrará os arquivos login.sh
e build.sh
que você usará para fazer logon no Docker e criar a imagem do R Docker. Se você tiver seu Credenciais do Docker pronto, insira os seguintes comandos na ordem:
# for logging in to Docker
./login.sh
# for build Docker image
./build.sh
Observe que, ao executar o script de login, você precisa fornecer o host Docker, o nome de usuário e a senha. Ao criar, você deve fornecer o host do Docker e uma tag de versão para o build.
Quando o script de build estiver concluído, você receberá um URL de arquivo de origem Docker na saída do console. Neste exemplo específico, será semelhante a:
# URL format:
{DOCKER_HOST}/ml-retail-r:{VERSION_TAG}
Copie este URL e vá para a página próximas etapas.
Criar imagem do PySpark Docker pyspark-docker
Comece clonando o GitHub repositório no sistema local com o seguinte comando:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
Navegue até o diretório experience-platform-dsw-reference/recipes/pyspark/retail
. Os scripts login.sh
e build.sh
estão localizados aqui e são usados para fazer logon no Docker e criar a imagem do Docker. Se você tiver seu Credenciais do Docker pronto, insira os seguintes comandos na ordem:
# for logging in to Docker
./login.sh
# for building Docker image
./build.sh
Observe que, ao executar o script de login, você precisa fornecer o host Docker, o nome de usuário e a senha. Ao criar, você deve fornecer o host do Docker e uma tag de versão para o build.
Quando o script de build estiver concluído, você receberá um URL de arquivo de origem Docker na saída do console. Neste exemplo específico, será semelhante a:
# URL format:
{DOCKER_HOST}/ml-retailsales-pyspark:{VERSION_TAG}
Copie este URL e vá para a página próximas etapas.
Criar imagem do Scala Docker scala-docker
Comece clonando o GitHub repositório no sistema local com o seguinte comando no terminal:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
Em seguida, navegue até o diretório experience-platform-dsw-reference/recipes/scala
onde você pode encontrar os scripts login.sh
e build.sh
. Esses scripts são usados para fazer logon no Docker e criar a imagem do Docker. Se você tiver seu Credenciais do Docker pronto, insira os seguintes comandos no terminal em ordem:
# for logging in to Docker
./login.sh
# for building Docker image
./build.sh
login.sh
tente usar o comando bash login.sh
.Ao executar o script de login, você precisa fornecer o host Docker, o nome de usuário e a senha. Ao criar, você deve fornecer o host do Docker e uma tag de versão para o build.
Quando o script de build estiver concluído, você receberá um URL de arquivo de origem Docker na saída do console. Neste exemplo específico, será semelhante a:
# URL format:
{DOCKER_HOST}/ml-retailsales-spark:{VERSION_TAG}
Copie este URL e vá para a página próximas etapas.
Próximas etapas next-steps
Este tutorial foi sobre o empacotamento de arquivos de origem em uma fórmula, a etapa de pré-requisito para a importação de uma fórmula para o Data Science Workspace. Agora você deve ter uma imagem do Docker no Registro de contêineres do Azure junto com a URL da imagem correspondente. Agora você está pronto para começar o tutorial sobre a importação de uma fórmula em pacote para o Data Science Workspace. Selecione um dos links de tutorial abaixo para começar: