Empaqueta archivos de origen en una fórmula

NOTE
Data Science Workspace ya no se puede adquirir.
Esta documentación está destinada a clientes existentes con derechos previos a Data Science Espacio de trabajo.

Este tutorial proporciona instrucciones sobre cómo puede empaquetar los archivos de origen de muestra de ventas minoristas proporcionados en un archivo de almacenamiento, que se puede usar para crear un fórmula en Adobe Experience Platform Data Science Workspace siguiendo el flujo de trabajo de importación de fórmula en el IU o mediante la API.

Conceptos a entender:

  • Fórmulas: una fórmula es el término de un Adobe para una especificación de modelo y es un contenedor de nivel superior que representa un aprendizaje automático específico, un algoritmo de inteligencia artificial o un conjunto de algoritmos, una lógica de procesamiento y una configuración necesarios para generar y ejecutar un modelo entrenado y, por lo tanto, ayudar a solucionar problemas empresariales específicos.
  • Archivos de Source: Archivos individuales del proyecto que contienen la lógica de una fórmula.

Requisitos previos

Creación de fórmula

La creación de la fórmula comienza con los archivos de origen de los paquetes para crear un archivo. Los archivos de Source definen la lógica de aprendizaje automático y los algoritmos utilizados para solucionar un problema específico, y están escritos en Python, R, PySpark o Scala. Los archivos de almacenamiento creados toman la forma de una imagen Docker. Una vez generado, el archivo de almacenamiento empaquetado se importa a Data Science Workspace para crear un fórmula en el IU o utilizando la API.

Creación de modelos basada en Docker docker-based-model-authoring

Una imagen de Docker permite a un desarrollador empaquetar un aplicación con todas las partes que necesita, como bibliotecas y otras dependencias, y enviarlo como un solo paquete.

La imagen Docker creada se inserta en el Registro de contenedores de Azure con las credenciales proporcionadas durante el flujo de trabajo de creación de fórmulas.

Para obtener sus credenciales de Azure Container Registry, inicie sesión en Adobe Experience Platform. En la columna de navegación de la izquierda, navegue hasta Flujos de trabajo. Seleccione Importar fórmula seguido de Iniciar. Consulte la captura de pantalla siguiente como referencia.

Se abre la página Configurar. Proporcione un Nombre de fórmula apropiado, por ejemplo, "Fórmula de ventas minoristas", y opcionalmente proporcione una descripción o una URL de documentación. Una vez finalizado, haga clic en Siguiente.

Seleccione el Runtime adecuado y, a continuación, elija una clasificación para Type. Las credenciales del Registro de contenedores de Azure se generan una vez completadas.

NOTE
Tipo es la clase de problema de aprendizaje automático para el que está diseñada la fórmula y se utiliza después del aprendizaje para ayudar a adaptar la evaluación de la ejecución del aprendizaje.
TIP
  • Para Python recetas, selecciona el tiempo de ejecución de Python.
  • Para las recetas R, seleccione el tiempo de ejecución R.
  • Para las recetas de PySpark, selecciona el tiempo de ejecución de PySpark. Se rellena automáticamente un tipo de artefacto.
  • Para las recetas de Scala, seleccione el tiempo de ejecución de Spark . Se rellena automáticamente un tipo de artefacto.

Tenga en cuenta los valores de host, nombre de usuario y contraseña de Docker. Se utilizan para generar e insertar la imagen Docker en los flujos de trabajo descritos a continuación.

NOTE
La dirección URL de Source se proporciona después de completar los pasos descritos a continuación. El archivo de configuración se explica en los tutoriales subsiguientes que se encuentran en pasos siguientes.

Empaquetar los archivos de origen

Inicio obteniendo el código de base de ejemplo que se encuentra en la repositorio de referencia de Espacio de trabajo de ciencia de datos de Experience Platform.

Generar imagen de Docker Python python-docker

Si no lo ha hecho, clone el repositorio GitHub en el sistema local con el siguiente comando:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Vaya al directorio experience-platform-dsw-reference/recipes/python/retail. Aquí encontrará los scripts login.sh y build.sh utilizados para iniciar sesión en Docker y crear la imagen Python Docker. Si tiene sus credenciales de Docker listas, escriba los siguientes comandos en orden:

# for logging in to Docker
./login.sh

# for building Docker image
./build.sh

Tenga en cuenta que al ejecutar el script de inicio de sesión, debe proporcionar el host Docker, el nombre de usuario y la contraseña. Al compilar, debe proporcionar el host de Docker y un etiqueta de versión para el versión.

Una vez finalizado el script de versión, se le asigna un URL de archivo de origen de Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto similar al siguiente:

# URL format:
{DOCKER_HOST}/ml-retailsales-python:{VERSION_TAG}

Copie esta dirección URL y continúe con los pasos siguientes.

Generar imagen R Docker r-docker

Si no lo ha hecho, clone el repositorio GitHub en el sistema local con el siguiente comando:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Vaya al directorio experience-platform-dsw-reference/recipes/R/Retail - GradientBoosting dentro del repositorio clonado. Aquí encontrará los archivos login.sh y build.sh que utilizará para iniciar sesión en Docker y crear la imagen de R Docker. Si tiene sus credenciales de Docker listas, escriba los siguientes comandos en orden:

# for logging in to Docker
./login.sh

# for build Docker image
./build.sh

Tenga en cuenta que al ejecutar el script de inicio de sesión, debe proporcionar el host Docker, el nombre de usuario y la contraseña. Al compilar, debe proporcionar el host de Docker y un etiqueta de versión para el versión.

Una vez finalizado el script de versión, se le asigna un URL de archivo de origen de Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto gustar:

# URL format:
{DOCKER_HOST}/ml-retail-r:{VERSION_TAG}

Copie esta dirección URL y continúe con los pasos siguientes.

Crear imagen PySpark Docker pyspark-docker

Comience por clonar el repositorio GitHub en el sistema local con el siguiente comando:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Vaya al directorio experience-platform-dsw-reference/recipes/pyspark/retail. Los scripts login.sh y build.sh se encuentran aquí y se utilizan para iniciar sesión en Docker y crear la imagen de Docker. Si tiene sus credenciales de Docker listas, escriba los siguientes comandos en orden:

# for logging in to Docker
./login.sh

# for building Docker image
./build.sh

Tenga en cuenta que al ejecutar el script de inicio de sesión, debe proporcionar el host Docker, el nombre de usuario y la contraseña. Al crear, debe proporcionar el host Docker y una etiqueta de versión para la compilación.

Una vez completado el script de generación, se le proporcionará una URL de archivo de origen Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto similar al siguiente:

# URL format:
{DOCKER_HOST}/ml-retailsales-pyspark:{VERSION_TAG}

Copie esta dirección URL y continúe con los pasos siguientes.

Crear imagen de Scala Docker scala-docker

Comience por clonar el repositorio GitHub en el sistema local con el siguiente comando en el terminal:

git clone https://github.com/adobe/experience-platform-dsw-reference.git

Siguiente, desplácese hasta el directorio experience-platform-dsw-reference/recipes/scala donde encontrará los scripts login.sh y build.sh. Estos scripts se utilizan para inicio de sesión a Docker y versión la imagen de Docker. Si tiene sus credenciales de Docker listas, ingrese los siguientes comandos al terminal en orden:

# for logging in to Docker
./login.sh

# for building Docker image
./build.sh
TIP
Si recibe un error de permiso al intentar iniciar sesión en Docker con el script login.sh, intente usar el comando bash login.sh.

Al ejecutar el script de inicio de sesión, debe proporcionar el host Docker, el nombre de usuario y la contraseña. Al crear, debe proporcionar el host Docker y una etiqueta de versión para la compilación.

Una vez completado el script de generación, se le proporcionará una URL de archivo de origen Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto similar al siguiente:

# URL format:
{DOCKER_HOST}/ml-retailsales-spark:{VERSION_TAG}

Copie esta dirección URL y continúe con los pasos siguientes.

Pasos siguientes next-steps

Este tutorial analizó el empaquetado de archivos de origen en una fórmula, el paso previo para importar una fórmula en Data Science Workspace. Ahora debe tener una imagen de Docker en Azure Container Registry junto con el URL de imagen correspondiente. Ya está listo para comenzar la tutorial de importación de un fórmula empaquetado en Data Science Workspace. Seleccione uno de los siguientes vínculos de tutorial para comenzar:

recommendation-more-help
cc79fe26-64da-411e-a6b9-5b650f53e4e9