Empaquetar archivos de origen en una fórmula

Este tutorial proporciona instrucciones sobre cómo empaquetar los archivos de origen de muestra de ventas minoristas proporcionados en un archivo de almacenamiento, que se puede utilizar para crear una fórmula en Adobe Experience Platform Data Science Workspace siguiendo el flujo de trabajo de importación de fórmulas ya sea en la interfaz de usuario o mediante la API.

Conceptos para comprender:

  • Fórmulas: Una fórmula es el término de Adobe para una especificación de modelo y es un contenedor de nivel superior que representa un aprendizaje automático específico, un algoritmo de inteligencia artificial o un conjunto de algoritmos, una lógica de procesamiento y una configuración necesarias para crear y ejecutar un modelo capacitado y, por lo tanto, ayuda a resolver problemas comerciales específicos.
  • Archivos de origen: Archivos individuales del proyecto que contienen la lógica de una fórmula.

Requisitos previos

Creación de fórmulas

Inicios de creación de fórmulas con empaquetado de archivos de origen para crear un archivo de archivo. Los archivos de origen definen la lógica de aprendizaje automático y los algoritmos utilizados para resolver un problema específico y se escriben en Python, R, PySpark o Scala. Los archivos de archivo creados toman la forma de una imagen de Docker. Una vez compilado, el archivo empaquetado se importa en Data Science Workspace para crear una fórmula en la interfaz de usuario o mediante la API.

Creación de modelos basados en acoplamiento

Una imagen de Docker permite a un desarrollador empaquetar una aplicación con todas las partes que necesita, como bibliotecas y otras dependencias, y enviarla como un paquete.

La imagen de Docker creada se inserta en el Registro de Contenedor de Azure mediante las credenciales proporcionadas durante el flujo de trabajo de creación de fórmulas.

Para obtener las credenciales del Registro de Contenedor de Azure, inicie sesión en Adobe Experience Platform. En la columna de navegación izquierda, navegue a Flujos de trabajo. Seleccione Importar fórmula seguida de seleccionar Iniciar. Consulte la captura de pantalla siguiente para obtener referencia.

Se abre la página Configurar. Proporcione un Nombre de fórmula apropiado, por ejemplo, "Fórmula de venta minorista", y opcionalmente proporcione una dirección URL de documentación o descripción. Una vez finalizado, haga clic en Siguiente.

Seleccione el Tiempo de ejecución correspondiente y, a continuación, elija una Clasificación para Tipo. Las credenciales del Registro de Contenedor de Azure se generan una vez finalizadas.

NOTA

** Typeis la clase de problema de aprendizaje automático para la que está diseñada la fórmula y se utiliza después de la formación para ayudar a adaptar la ejecución de la formación.

CONSEJO
  • Para las fórmulas Python seleccione el tiempo de ejecución Python.
  • Para las fórmulas R, seleccione el tiempo de ejecución R.
  • Para las fórmulas de PySpark, seleccione el tiempo de ejecución PySpark. Se rellena automáticamente un tipo de artefacto.
  • Para las fórmulas de Scala, seleccione el tiempo de ejecución Spark. Se rellena automáticamente un tipo de artefacto.

Tenga en cuenta los valores del host, el nombre de usuario y la contraseña del Docker. Se utilizan para generar e insertar la imagen Docker en los flujos de trabajo que se describen a continuación.

NOTA

La dirección URL de origen se proporciona después de completar los pasos que se describen a continuación. El archivo de configuración se explica en tutoriales posteriores que se encuentran en pasos siguientes.

Empaquetar los archivos de origen

Inicio mediante la obtención del código base de muestra que se encuentra en el repositorio Referencia del área de trabajo de Experience Platform de Data Science.

Generar Python imagen del acoplador

Si no lo ha hecho, clona el repositorio GitHub en el sistema local con el siguiente comando:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Vaya al directorio experience-platform-dsw-reference/recipes/python/retail. Aquí encontrará las secuencias de comandos login.sh y build.sh utilizadas para iniciar sesión en Docker y generar la imagen Python Docker. Si tiene credenciales de Docker listas, introduzca los siguientes comandos en orden:

# for logging in to Docker
./login.sh
 
# for building Docker image
./build.sh

Tenga en cuenta que, al ejecutar la secuencia de comandos de inicio de sesión, debe proporcionar el host, el nombre de usuario y la contraseña del Docker. Al compilar, debe proporcionar el host de Docker y una etiqueta de versión para la compilación.

Una vez que se haya completado la secuencia de comandos de compilación, se le proporcionará una URL de archivo de origen de Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto similar al siguiente:

# URL format: 
{DOCKER_HOST}/ml-retailsales-python:{VERSION_TAG}

Copie esta dirección URL y continúe con los pasos siguientes.

Generar imagen R Docker

Si no lo ha hecho, clona el repositorio GitHub en el sistema local con el siguiente comando:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Vaya al directorio experience-platform-dsw-reference/recipes/R/Retail - GradientBoosting dentro del repositorio clonado. Aquí encontrará los archivos login.sh y build.sh que utilizará para iniciar sesión en Docker y crear la imagen del R Docker. Si tiene credenciales de Docker listas, introduzca los siguientes comandos en orden:

# for logging in to Docker
./login.sh
 
# for build Docker image
./build.sh

Tenga en cuenta que, al ejecutar la secuencia de comandos de inicio de sesión, debe proporcionar el host, el nombre de usuario y la contraseña del Docker. Al compilar, debe proporcionar el host de Docker y una etiqueta de versión para la compilación.

Una vez que se haya completado la secuencia de comandos de compilación, se le proporcionará una URL de archivo de origen de Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto similar al siguiente:

# URL format: 
{DOCKER_HOST}/ml-retail-r:{VERSION_TAG}

Copie esta dirección URL y continúe con los pasos siguientes.

Generar imagen de PySpark Docker

Inicio clonando el repositorio GitHub en el sistema local con el siguiente comando:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Vaya al directorio experience-platform-dsw-reference/recipes/pyspark/retail. Las secuencias de comandos login.sh y build.sh se encuentran aquí y se utilizan para iniciar sesión en Docker y generar la imagen del Docker. Si tiene credenciales de Docker listas, introduzca los siguientes comandos en orden:

# for logging in to Docker
./login.sh
 
# for building Docker image
./build.sh

Tenga en cuenta que, al ejecutar la secuencia de comandos de inicio de sesión, debe proporcionar el host, el nombre de usuario y la contraseña del Docker. Al compilar, debe proporcionar el host de Docker y una etiqueta de versión para la compilación.

Una vez que se haya completado la secuencia de comandos de compilación, se le proporcionará una URL de archivo de origen de Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto similar al siguiente:

# URL format: 
{DOCKER_HOST}/ml-retailsales-pyspark:{VERSION_TAG}

Copie esta dirección URL y continúe con los pasos siguientes.

Generar imagen de acoplador de escala

Inicio clonando el repositorio GitHub en el sistema local con el siguiente comando en terminal:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

A continuación, vaya al directorio experience-platform-dsw-reference/recipes/scala donde encontrará las secuencias de comandos login.sh y build.sh. Estas secuencias de comandos se utilizan para iniciar sesión en Docker y crear la imagen del Docker. Si tiene credenciales de Docker listas, introduzca los siguientes comandos para terminal en orden:

# for logging in to Docker
./login.sh
 
# for building Docker image
./build.sh
CONSEJO

Si recibe un error de permiso al intentar iniciar sesión en Docker mediante la secuencia de comandos login.sh, intente utilizar el comando bash login.sh.

Al ejecutar la secuencia de comandos de inicio de sesión, debe proporcionar el host, el nombre de usuario y la contraseña del Docker. Al compilar, debe proporcionar el host de Docker y una etiqueta de versión para la compilación.

Una vez que se haya completado la secuencia de comandos de compilación, se le proporcionará una URL de archivo de origen de Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto similar al siguiente:

# URL format: 
{DOCKER_HOST}/ml-retailsales-spark:{VERSION_TAG}

Copie esta dirección URL y continúe con los pasos siguientes.

Pasos siguientes

Este tutorial pasó a empaquetar archivos de origen en una fórmula, el paso previo para importar una fórmula a Data Science Workspace. Ahora debe tener una imagen de Docker en el Registro de Contenedor de Azure junto con la URL de imagen correspondiente. Ya está listo para comenzar el tutorial sobre la importación de una fórmula empaquetada en Data Science Workspace. Seleccione uno de los vínculos de tutorial siguientes para comenzar:

En esta página

Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free