Este tutorial proporciona instrucciones sobre cómo empaquetar los archivos de origen de muestra de ventas minoristas proporcionados en un archivo, que se puede utilizar para crear una fórmula en Adobe Experience Platform Data Science Workspace siguiendo el flujo de trabajo de importación de fórmulas, ya sea en la interfaz de usuario o utilizando la API.
Conceptos para comprender:
La creación de fórmulas comienza con el empaquetado de archivos de origen para crear un archivo. Los archivos de origen definen la lógica y los algoritmos de aprendizaje automático utilizados para resolver un problema específico que se encuentra en la mano y están escritos en Python, R, PySpark o Scala. Los archivos archivados creados toman la forma de una imagen Docker. Una vez creado, el archivo empaquetado se importa en Data Science Workspace para crear una fórmula en la interfaz de usuario o utilizando la API.
Una imagen Docker permite a un desarrollador empaquetar una aplicación con todas las partes que necesita, como bibliotecas y otras dependencias, y enviarla como un paquete.
La imagen Docker creada se inserta en el Registro de contenedores de Azure utilizando las credenciales proporcionadas durante el flujo de trabajo de creación de la fórmula.
Para obtener las credenciales del Registro de contenedores de Azure, inicie sesión en Adobe Experience Platform. En la columna de navegación izquierda, vaya a Workflows. Seleccione Import Recipe seguido de Launch. Consulte la captura de pantalla siguiente para obtener referencia.
Se abre la página Configure. Proporcione un Recipe Name apropiado, por ejemplo, "Receta de ventas minoristas", y opcionalmente proporcione una descripción o una dirección URL de documentación. Una vez finalizado, haga clic en Next.
Seleccione el Runtime correspondiente y, a continuación, elija Classification para Type. Las credenciales del Registro de contenedores de Azure se generan una vez finalizadas.
** Escriba la clase de problema de aprendizaje automático para la que está diseñada la fórmula y se utiliza después de la formación para ayudar a adaptar la evaluación de la ejecución de la formación.
Tenga en cuenta los valores del host Docker, el nombre de usuario y la contraseña. Se utilizan para crear y insertar la imagen Docker en los flujos de trabajo descritos a continuación.
La dirección URL de origen se proporciona después de completar los pasos descritos a continuación. El archivo de configuración se explica en tutoriales posteriores que se encuentran en pasos siguientes.
Comience por obtener el código de base de ejemplo que se encuentra en el repositorio Experience Platform Data Science Workspace Reference.
Si no lo ha hecho, clone el repositorio GitHub en el sistema local con el siguiente comando:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
Vaya al directorio experience-platform-dsw-reference/recipes/python/retail
. Aquí, encontrará las secuencias de comandos login.sh
y build.sh
utilizadas para iniciar sesión en Docker y crear la imagen Python Docker. Si tiene sus Credenciales del Docker listas, introduzca los siguientes comandos en orden:
# for logging in to Docker
./login.sh
# for building Docker image
./build.sh
Tenga en cuenta que al ejecutar el script de inicio de sesión, debe proporcionar el host Docker, el nombre de usuario y la contraseña. Al crear, es necesario proporcionar el host Docker y una etiqueta de versión para la compilación.
Una vez finalizada la secuencia de comandos de compilación, se le proporcionará una URL de archivo de origen Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto similar al siguiente:
# URL format:
{DOCKER_HOST}/ml-retailsales-python:{VERSION_TAG}
Copie esta dirección URL y continúe con los pasos siguientes.
Si no lo ha hecho, clone el repositorio GitHub en el sistema local con el siguiente comando:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
Vaya al directorio experience-platform-dsw-reference/recipes/R/Retail - GradientBoosting
dentro del repositorio clonado. Aquí, encontrará los archivos login.sh
y build.sh
que utilizará para iniciar sesión en Docker y para crear la imagen de R Docker. Si tiene sus Credenciales del Docker listas, introduzca los siguientes comandos en orden:
# for logging in to Docker
./login.sh
# for build Docker image
./build.sh
Tenga en cuenta que al ejecutar el script de inicio de sesión, debe proporcionar el host Docker, el nombre de usuario y la contraseña. Al crear, es necesario proporcionar el host Docker y una etiqueta de versión para la compilación.
Una vez finalizada la secuencia de comandos de compilación, se le proporcionará una URL de archivo de origen Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto similar al siguiente:
# URL format:
{DOCKER_HOST}/ml-retail-r:{VERSION_TAG}
Copie esta dirección URL y continúe con los pasos siguientes.
Comience clonando el repositorio GitHub en su sistema local con el siguiente comando:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
Vaya al directorio experience-platform-dsw-reference/recipes/pyspark/retail
. Los scripts login.sh
y build.sh
se encuentran aquí y se utilizan para iniciar sesión en Docker y para crear la imagen Docker. Si tiene sus Credenciales del Docker listas, introduzca los siguientes comandos en orden:
# for logging in to Docker
./login.sh
# for building Docker image
./build.sh
Tenga en cuenta que al ejecutar el script de inicio de sesión, debe proporcionar el host Docker, el nombre de usuario y la contraseña. Al crear, es necesario proporcionar el host Docker y una etiqueta de versión para la compilación.
Una vez finalizada la secuencia de comandos de compilación, se le proporcionará una URL de archivo de origen Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto similar al siguiente:
# URL format:
{DOCKER_HOST}/ml-retailsales-pyspark:{VERSION_TAG}
Copie esta dirección URL y continúe con los pasos siguientes.
Comience clonando el repositorio GitHub en su sistema local con el siguiente comando en terminal:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
A continuación, vaya al directorio experience-platform-dsw-reference/recipes/scala
donde puede encontrar los scripts login.sh
y build.sh
. Estas secuencias de comandos se utilizan para iniciar sesión en Docker y crear la imagen Docker. Si tiene sus Credenciales del Docker listas, introduzca los siguientes comandos en terminal en orden:
# for logging in to Docker
./login.sh
# for building Docker image
./build.sh
Si está recibiendo un error de permiso al intentar iniciar sesión en Docker utilizando la secuencia de comandos login.sh
, intente utilizar el comando bash login.sh
.
Al ejecutar el script de inicio de sesión, debe proporcionar el host Docker, el nombre de usuario y la contraseña. Al crear, es necesario proporcionar el host Docker y una etiqueta de versión para la compilación.
Una vez finalizada la secuencia de comandos de compilación, se le proporcionará una URL de archivo de origen Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto similar al siguiente:
# URL format:
{DOCKER_HOST}/ml-retailsales-spark:{VERSION_TAG}
Copie esta dirección URL y continúe con los pasos siguientes.
Este tutorial ha pasado el empaquetado de archivos de origen a una fórmula, el paso previo para importar una fórmula a Data Science Workspace. Ahora debe tener una imagen de Docker en el Registro de contenedores de Azure junto con la URL de la imagen correspondiente. Ya está listo para iniciar el tutorial sobre la importación de una fórmula empaquetada en Data Science Workspace. Seleccione uno de los vínculos del tutorial a continuación para empezar: