Empaquete archivos de origen en una fórmula

Este tutorial proporciona instrucciones sobre cómo empaquetar los archivos de origen de muestra de ventas minoristas proporcionados en un archivo, que se puede utilizar para crear una fórmula en Adobe Experience Platform Data Science Workspace siguiendo el flujo de trabajo de importación de fórmulas, ya sea en la interfaz de usuario o utilizando la API.

Conceptos para comprender:

  • Fórmulas: Una fórmula es el término de Adobe para una especificación de modelo y es un contenedor de nivel superior que representa un aprendizaje automático específico, un algoritmo de inteligencia artificial o un conjunto de algoritmos, lógica de procesamiento y configuración necesarios para crear y ejecutar un modelo entrenado y, por lo tanto, ayuda a resolver problemas empresariales específicos.
  • Archivos de origen: Archivos individuales del proyecto que contienen la lógica de una fórmula.

Requisitos previos

Creación de fórmula

La creación de fórmulas comienza con el empaquetado de archivos de origen para crear un archivo. Los archivos de origen definen la lógica y los algoritmos de aprendizaje automático utilizados para resolver un problema específico que se encuentra en la mano y están escritos en Python, R, PySpark o Scala. Los archivos archivados creados toman la forma de una imagen Docker. Una vez creado, el archivo empaquetado se importa en Data Science Workspace para crear una fórmula en la interfaz de usuario o utilizando la API.

Creación de modelos basados en Docker

Una imagen Docker permite a un desarrollador empaquetar una aplicación con todas las partes que necesita, como bibliotecas y otras dependencias, y enviarla como un paquete.

La imagen Docker creada se inserta en el Registro de contenedores de Azure utilizando las credenciales proporcionadas durante el flujo de trabajo de creación de la fórmula.

Para obtener las credenciales del Registro de contenedores de Azure, inicie sesión en Adobe Experience Platform. En la columna de navegación izquierda, vaya a Workflows. Seleccione Import Recipe seguido de Launch. Consulte la captura de pantalla siguiente para obtener referencia.

Se abre la página Configure. Proporcione un Recipe Name apropiado, por ejemplo, "Receta de ventas minoristas", y opcionalmente proporcione una descripción o una dirección URL de documentación. Una vez finalizado, haga clic en Next.

Seleccione el Runtime correspondiente y, a continuación, elija Classification para Type. Las credenciales del Registro de contenedores de Azure se generan una vez finalizadas.

NOTA

** Escriba la clase de problema de aprendizaje automático para la que está diseñada la fórmula y se utiliza después de la formación para ayudar a adaptar la evaluación de la ejecución de la formación.

SUGERENCIA
  • Para las fórmulas Python seleccione el tiempo de ejecución Python.
  • Para las fórmulas R, seleccione el tiempo de ejecución R.
  • Para las fórmulas de PySpark, seleccione el tiempo de ejecución PySpark. Un tipo de artefacto se rellena automáticamente.
  • Para las fórmulas de Scala, seleccione el tiempo de ejecución Spark. Un tipo de artefacto se rellena automáticamente.

Tenga en cuenta los valores del host Docker, el nombre de usuario y la contraseña. Se utilizan para crear y insertar la imagen Docker en los flujos de trabajo descritos a continuación.

NOTA

La dirección URL de origen se proporciona después de completar los pasos descritos a continuación. El archivo de configuración se explica en tutoriales posteriores que se encuentran en pasos siguientes.

Empaquete los archivos de origen

Comience por obtener el código de base de ejemplo que se encuentra en el repositorio Experience Platform Data Science Workspace Reference.

Generar Python Imagen de Docker

Si no lo ha hecho, clone el repositorio GitHub en el sistema local con el siguiente comando:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Vaya al directorio experience-platform-dsw-reference/recipes/python/retail. Aquí, encontrará las secuencias de comandos login.sh y build.sh utilizadas para iniciar sesión en Docker y crear la imagen Python Docker. Si tiene sus Credenciales del Docker listas, introduzca los siguientes comandos en orden:

# for logging in to Docker
./login.sh
 
# for building Docker image
./build.sh

Tenga en cuenta que al ejecutar el script de inicio de sesión, debe proporcionar el host Docker, el nombre de usuario y la contraseña. Al crear, es necesario proporcionar el host Docker y una etiqueta de versión para la compilación.

Una vez finalizada la secuencia de comandos de compilación, se le proporcionará una URL de archivo de origen Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto similar al siguiente:

# URL format: 
{DOCKER_HOST}/ml-retailsales-python:{VERSION_TAG}

Copie esta dirección URL y continúe con los pasos siguientes.

Generar imagen R Docker

Si no lo ha hecho, clone el repositorio GitHub en el sistema local con el siguiente comando:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Vaya al directorio experience-platform-dsw-reference/recipes/R/Retail - GradientBoosting dentro del repositorio clonado. Aquí, encontrará los archivos login.sh y build.sh que utilizará para iniciar sesión en Docker y para crear la imagen de R Docker. Si tiene sus Credenciales del Docker listas, introduzca los siguientes comandos en orden:

# for logging in to Docker
./login.sh
 
# for build Docker image
./build.sh

Tenga en cuenta que al ejecutar el script de inicio de sesión, debe proporcionar el host Docker, el nombre de usuario y la contraseña. Al crear, es necesario proporcionar el host Docker y una etiqueta de versión para la compilación.

Una vez finalizada la secuencia de comandos de compilación, se le proporcionará una URL de archivo de origen Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto similar al siguiente:

# URL format: 
{DOCKER_HOST}/ml-retail-r:{VERSION_TAG}

Copie esta dirección URL y continúe con los pasos siguientes.

Generar imagen de Docker de PySpark

Comience clonando el repositorio GitHub en su sistema local con el siguiente comando:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Vaya al directorio experience-platform-dsw-reference/recipes/pyspark/retail. Los scripts login.sh y build.sh se encuentran aquí y se utilizan para iniciar sesión en Docker y para crear la imagen Docker. Si tiene sus Credenciales del Docker listas, introduzca los siguientes comandos en orden:

# for logging in to Docker
./login.sh
 
# for building Docker image
./build.sh

Tenga en cuenta que al ejecutar el script de inicio de sesión, debe proporcionar el host Docker, el nombre de usuario y la contraseña. Al crear, es necesario proporcionar el host Docker y una etiqueta de versión para la compilación.

Una vez finalizada la secuencia de comandos de compilación, se le proporcionará una URL de archivo de origen Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto similar al siguiente:

# URL format: 
{DOCKER_HOST}/ml-retailsales-pyspark:{VERSION_TAG}

Copie esta dirección URL y continúe con los pasos siguientes.

Generar imagen de Scala Docker

Comience clonando el repositorio GitHub en su sistema local con el siguiente comando en terminal:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

A continuación, vaya al directorio experience-platform-dsw-reference/recipes/scala donde puede encontrar los scripts login.sh y build.sh. Estas secuencias de comandos se utilizan para iniciar sesión en Docker y crear la imagen Docker. Si tiene sus Credenciales del Docker listas, introduzca los siguientes comandos en terminal en orden:

# for logging in to Docker
./login.sh
 
# for building Docker image
./build.sh
SUGERENCIA

Si está recibiendo un error de permiso al intentar iniciar sesión en Docker utilizando la secuencia de comandos login.sh, intente utilizar el comando bash login.sh.

Al ejecutar el script de inicio de sesión, debe proporcionar el host Docker, el nombre de usuario y la contraseña. Al crear, es necesario proporcionar el host Docker y una etiqueta de versión para la compilación.

Una vez finalizada la secuencia de comandos de compilación, se le proporcionará una URL de archivo de origen Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto similar al siguiente:

# URL format: 
{DOCKER_HOST}/ml-retailsales-spark:{VERSION_TAG}

Copie esta dirección URL y continúe con los pasos siguientes.

Pasos siguientes

Este tutorial ha pasado el empaquetado de archivos de origen a una fórmula, el paso previo para importar una fórmula a Data Science Workspace. Ahora debe tener una imagen de Docker en el Registro de contenedores de Azure junto con la URL de la imagen correspondiente. Ya está listo para iniciar el tutorial sobre la importación de una fórmula empaquetada en Data Science Workspace. Seleccione uno de los vínculos del tutorial a continuación para empezar:

En esta página