Empaqueta archivos de origen en una fórmula
Este tutorial proporciona instrucciones sobre cómo puede empaquetar los archivos de origen de muestra de ventas minoristas proporcionados en un archivo de almacenamiento, que se puede usar para crear un fórmula en Adobe Experience Platform Data Science Workspace siguiendo el flujo de trabajo de importación de fórmula en el IU o mediante la API.
Conceptos a entender:
- Fórmulas: una fórmula es el término de un Adobe para una especificación de modelo y es un contenedor de nivel superior que representa un aprendizaje automático específico, un algoritmo de inteligencia artificial o un conjunto de algoritmos, una lógica de procesamiento y una configuración necesarios para generar y ejecutar un modelo entrenado y, por lo tanto, ayudar a solucionar problemas empresariales específicos.
- Archivos de Source: Archivos individuales del proyecto que contienen la lógica de una fórmula.
Requisitos previos
Creación de fórmula
La creación de la fórmula comienza con los archivos de origen de los paquetes para crear un archivo. Los archivos de Source definen la lógica de aprendizaje automático y los algoritmos utilizados para solucionar un problema específico, y están escritos en Python, R, PySpark o Scala. Los archivos de almacenamiento creados toman la forma de una imagen Docker. Una vez generado, el archivo de almacenamiento empaquetado se importa a Data Science Workspace para crear un fórmula en el IU o utilizando la API.
Creación de modelos basada en Docker docker-based-model-authoring
Una imagen de Docker permite a un desarrollador empaquetar un aplicación con todas las partes que necesita, como bibliotecas y otras dependencias, y enviarlo como un solo paquete.
La imagen Docker creada se inserta en el Registro de contenedores de Azure con las credenciales proporcionadas durante el flujo de trabajo de creación de fórmulas.
Para obtener sus credenciales de Azure Container Registry, inicie sesión en Adobe Experience Platform. En la columna de navegación de la izquierda, navegue hasta Flujos de trabajo. Seleccione Importar fórmula seguido de Iniciar. Consulte la captura de pantalla siguiente como referencia.
Se abre la página Configurar. Proporcione un Nombre de fórmula apropiado, por ejemplo, "Fórmula de ventas minoristas", y opcionalmente proporcione una descripción o una URL de documentación. Una vez finalizado, haga clic en Siguiente.
Seleccione el Runtime adecuado y, a continuación, elija una clasificación para Type. Las credenciales del Registro de contenedores de Azure se generan una vez completadas.
- Para Python recetas, selecciona el tiempo de ejecución de Python.
- Para las recetas R, seleccione el tiempo de ejecución R.
- Para las recetas de PySpark, selecciona el tiempo de ejecución de PySpark. Se rellena automáticamente un tipo de artefacto.
- Para las recetas de Scala, seleccione el tiempo de ejecución de Spark . Se rellena automáticamente un tipo de artefacto.
Tenga en cuenta los valores de host, nombre de usuario y contraseña de Docker. Se utilizan para generar e insertar la imagen Docker en los flujos de trabajo descritos a continuación.
Empaquetar los archivos de origen
Inicio obteniendo el código de base de ejemplo que se encuentra en la repositorio de referencia de Espacio de trabajo de ciencia de datos de Experience Platform.
Generar imagen de Docker Python python-docker
Si no lo ha hecho, clone el repositorio GitHub en el sistema local con el siguiente comando:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
Vaya al directorio experience-platform-dsw-reference/recipes/python/retail
. Aquí encontrará los scripts login.sh
y build.sh
utilizados para iniciar sesión en Docker y crear la imagen Python Docker. Si tiene sus credenciales de Docker listas, escriba los siguientes comandos en orden:
# for logging in to Docker
./login.sh
# for building Docker image
./build.sh
Tenga en cuenta que al ejecutar el script de inicio de sesión, debe proporcionar el host Docker, el nombre de usuario y la contraseña. Al compilar, debe proporcionar el host de Docker y un etiqueta de versión para el versión.
Una vez finalizado el script de versión, se le asigna un URL de archivo de origen de Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto similar al siguiente:
# URL format:
{DOCKER_HOST}/ml-retailsales-python:{VERSION_TAG}
Copie esta dirección URL y continúe con los pasos siguientes.
Generar imagen R Docker r-docker
Si no lo ha hecho, clone el repositorio GitHub en el sistema local con el siguiente comando:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
Vaya al directorio experience-platform-dsw-reference/recipes/R/Retail - GradientBoosting
dentro del repositorio clonado. Aquí encontrará los archivos login.sh
y build.sh
que utilizará para iniciar sesión en Docker y crear la imagen de R Docker. Si tiene sus credenciales de Docker listas, escriba los siguientes comandos en orden:
# for logging in to Docker
./login.sh
# for build Docker image
./build.sh
Tenga en cuenta que al ejecutar el script de inicio de sesión, debe proporcionar el host Docker, el nombre de usuario y la contraseña. Al compilar, debe proporcionar el host de Docker y un etiqueta de versión para el versión.
Una vez finalizado el script de versión, se le asigna un URL de archivo de origen de Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto gustar:
# URL format:
{DOCKER_HOST}/ml-retail-r:{VERSION_TAG}
Copie esta dirección URL y continúe con los pasos siguientes.
Crear imagen PySpark Docker pyspark-docker
Comience por clonar el repositorio GitHub en el sistema local con el siguiente comando:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
Vaya al directorio experience-platform-dsw-reference/recipes/pyspark/retail
. Los scripts login.sh
y build.sh
se encuentran aquí y se utilizan para iniciar sesión en Docker y crear la imagen de Docker. Si tiene sus credenciales de Docker listas, escriba los siguientes comandos en orden:
# for logging in to Docker
./login.sh
# for building Docker image
./build.sh
Tenga en cuenta que al ejecutar el script de inicio de sesión, debe proporcionar el host Docker, el nombre de usuario y la contraseña. Al crear, debe proporcionar el host Docker y una etiqueta de versión para la compilación.
Una vez completado el script de generación, se le proporcionará una URL de archivo de origen Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto similar al siguiente:
# URL format:
{DOCKER_HOST}/ml-retailsales-pyspark:{VERSION_TAG}
Copie esta dirección URL y continúe con los pasos siguientes.
Crear imagen de Scala Docker scala-docker
Comience por clonar el repositorio GitHub en el sistema local con el siguiente comando en el terminal:
git clone https://github.com/adobe/experience-platform-dsw-reference.git
Siguiente, desplácese hasta el directorio experience-platform-dsw-reference/recipes/scala
donde encontrará los scripts login.sh
y build.sh
. Estos scripts se utilizan para inicio de sesión a Docker y versión la imagen de Docker. Si tiene sus credenciales de Docker listas, ingrese los siguientes comandos al terminal en orden:
# for logging in to Docker
./login.sh
# for building Docker image
./build.sh
login.sh
, intente usar el comando bash login.sh
.Al ejecutar el script de inicio de sesión, debe proporcionar el host Docker, el nombre de usuario y la contraseña. Al crear, debe proporcionar el host Docker y una etiqueta de versión para la compilación.
Una vez completado el script de generación, se le proporcionará una URL de archivo de origen Docker en la salida de la consola. Para este ejemplo específico, tendrá un aspecto similar al siguiente:
# URL format:
{DOCKER_HOST}/ml-retailsales-spark:{VERSION_TAG}
Copie esta dirección URL y continúe con los pasos siguientes.
Pasos siguientes next-steps
Este tutorial analizó el empaquetado de archivos de origen en una fórmula, el paso previo para importar una fórmula en Data Science Workspace. Ahora debe tener una imagen de Docker en Azure Container Registry junto con el URL de imagen correspondiente. Ya está listo para comenzar la tutorial de importación de un fórmula empaquetado en Data Science Workspace. Seleccione uno de los siguientes vínculos de tutorial para comenzar: