Importación de una fórmula empaquetada en la interfaz de usuario de Área de trabajo de ciencia de datos

En este tutorial se explica cómo configurar e importar una fórmula empaquetada mediante el ejemplo de venta minorista proporcionado. Al final de este tutorial, estará listo para crear, entrenar y evaluar un modelo en Adobe Experience Platform Data Science Workspace.

Requisitos previos

Este tutorial requiere una fórmula empaquetada en forma de URL de imagen de Docker. Consulte el tutorial sobre cómo Empaquetar archivos de origen en una fórmula para obtener más información.

Flujo de trabajo de la interfaz de usuario

La importación de una fórmula empaquetada en Data Science Workspace requiere configuraciones de fórmula específicas, compiladas en un solo archivo de Notación de objetos JavaScript (JSON), esta compilación de configuraciones de fórmula se denomina archivo de configuración. Una fórmula empaquetada con un conjunto concreto de configuraciones se denomina instancia de fórmula. Se puede usar una fórmula para crear muchas instancias de fórmula en Data Science Workspace.

El flujo de trabajo para importar una fórmula de paquete consta de los siguientes pasos:

Configurar una fórmula

Cada instancia de fórmula en Data Science Workspace va acompañada de un conjunto de configuraciones que adaptan la instancia de fórmula para adaptarse a un caso de uso en particular. Los archivos de configuración definen los comportamientos de puntuación y formación predeterminados de un modelo creado con esta instancia de fórmula.

NOTA

Los archivos de configuración son fórmulas y casos específicos.

A continuación se muestra un archivo de configuración de muestra que muestra los comportamientos de puntuación y formación predeterminados para la fórmula de ventas minoristas.

[
    {
        "name": "train",
        "parameters": [
            {
                "key": "learning_rate",
                "value": "0.1"  
            },
            {
                "key": "n_estimators",
                "value": "100"
            },
            {
                "key": "max_depth",
                "value": "3"
            },
            {
                "key": "ACP_DSW_INPUT_FEATURES",
                "value": "date,store,storeType,storeSize,temperature,regionalFuelPrice,markdown,cpi,unemployment,isHoliday"
            },
            {
                "key": "ACP_DSW_TARGET_FEATURES",
                "value": "weeklySales"
            },
            {
                "key": "ACP_DSW_FEATURE_UPDATE_SUPPORT",
                "value": false
            },
            {
                "key": "tenantId",
                "value": "_{TENANT_ID}"
            },
            {
                "key": "ACP_DSW_TRAINING_XDM_SCHEMA",
                "value": "{SEE BELOW FOR DETAILS}"
            },
            {
                "key": "evaluation.labelColumn",
                "value": "weeklySalesAhead"
            },
            {
                "key": "evaluation.metrics",
                "value": "MAPE,MAE,RMSE,MASE"
            }
        ]
    },
    {
        "name": "score",
        "parameters": [
            {
                "key": "tenantId",
                "value": "_{TENANT_ID}"
            },
            {
                "key":"ACP_DSW_SCORING_RESULTS_XDM_SCHEMA",
                "value":"{SEE BELOW FOR DETAILS}"
            }
        ]
    }
]
Clave de parámetro Tipo Descripción
learning_rate Número Escalar para multiplicación de degradado.
n_estimators Número Número de árboles del bosque para el clasificador de bosque aleatorio.
max_depth Número Profundidad máxima de un árbol en el clasificador de bosque aleatorio.
ACP_DSW_INPUT_FEATURES Cadena Lista de atributos de esquema de entrada separados por comas.
ACP_DSW_TARGET_FEATURES Cadena Lista de atributos de esquema de salida separados por comas.
ACP_DSW_FEATURE_UPDATE_SUPPORT Booleano Determina si las características de entrada y salida se pueden modificar
tenantId Cadena Este ID garantiza que los recursos que cree tengan un espacio de nombres adecuado y estén contenidos en la organización de IMS. Siga los pasos aquí para encontrar su ID de inquilino.
ACP_DSW_TRAINING_XDM_SCHEMA Cadena Esquema de entrada utilizado para la formación de un modelo. Deje esto vacío al importar en la interfaz de usuario, reemplácelo por SchemaID de formación al importar mediante API.
evaluation.labelColumn Cadena Etiqueta de columna para visualizaciones de evaluación.
evaluation.metrics Cadena Lista separada por comas de las métricas de evaluación que se utilizarán para evaluar un modelo.
ACP_DSW_SCORING_RESULTS_XDM_SCHEMA Cadena Esquema de salida utilizado para marcar un modelo. Deje esto vacío al importar en la interfaz de usuario, reemplácelo por SchemaID de puntuación al importar mediante API.

A los efectos de este tutorial, puede dejar los archivos de configuración predeterminados para la fórmula Ventas al por menor en la Data Science Workspace Referencia de la forma en que están.

Fórmula basada en el Docker de importación: Python

Inicio navegando y seleccionando Flujos de trabajo ubicados en la parte superior izquierda de la Platform interfaz de usuario. A continuación, seleccione Importar fórmula y haga clic en Iniciar.

Aparece la página Configurar para el flujo de trabajo Importar fórmula. Escriba un nombre y una descripción para la fórmula y, a continuación, seleccione Siguiente en la esquina superior derecha.

configurar flujo de trabajo

NOTA

En el tutorial Empaquetar archivos de origen en un tutorial de fórmula, se proporcionó una URL de Docker al final de la generación de la fórmula de venta minorista mediante archivos de origen Python.

Una vez que esté en la página Seleccionar origen, pegue la dirección URL del Docker correspondiente a la fórmula empaquetada generada mediante Python archivos de origen en el campo URL de origen. A continuación, importe el archivo de configuración proporcionado arrastrándolo y soltándolo o utilice el sistema de archivos Explorador. El archivo de configuración proporcionado se encuentra en experience-platform-dsw-reference/recipes/python/retail/retail.config.json. Seleccione Python en la lista desplegable Tiempo de ejecución y Clasificación en la lista desplegable Tipo. Una vez que se haya completado todo, haga clic en Siguiente en la esquina superior derecha para proceder a Administrar esquemas.

NOTA

El tipo admite Clasificación y Regresión. Si el modelo no se encuentra dentro de uno de estos tipos, seleccione Personalizado.

A continuación, seleccione los esquemas de entrada y salida de Retail Sales en la sección Administrar Esquemas, que se crearon utilizando la secuencia de comandos de arranque proporcionada en el tutorial crear el esquema de ventas minoristas y el conjunto de datos.

En la sección Administración de funciones, haga clic en la identificación del inquilino en el visor de esquemas para expandir el esquema de entrada de ventas minoristas. Seleccione las características de entrada y salida resaltando la función deseada y seleccionando Función de entrada o Función de Destinatario en la ventana Propiedades del campo derecha. Para este tutorial, establezca semanalSales como la Función de Destinatario y todo lo demás como Función de entrada. Haga clic en Siguiente para revisar la nueva fórmula configurada.

Revise la fórmula, agregue, modifique o elimine configuraciones según sea necesario. Haga clic en Finalizar para crear la fórmula.

Vaya a los pasos siguientes para averiguar cómo crear un modelo en Data Science Workspace mediante la fórmula de ventas minoristas recién creada.

Fórmula basada en el Docker de importación - R

Inicio navegando y seleccionando Flujos de trabajo ubicados en la parte superior izquierda de la Platform interfaz de usuario. A continuación, seleccione Importar fórmula y haga clic en Iniciar.

Aparece la página Configurar para el flujo de trabajo Importar fórmula. Escriba un nombre y una descripción para la fórmula y, a continuación, seleccione Siguiente en la esquina superior derecha.

configurar flujo de trabajo

NOTA

En el tutorial Empaquetar archivos de origen en un tutorial de fórmula, se proporcionó una URL de Docker al final de la generación de la fórmula de venta minorista mediante archivos de origen R.

Una vez que esté en la página Seleccionar origen, pegue la dirección URL del Docker correspondiente a la fórmula empaquetada generada con archivos de origen R en el campo URL de origen. A continuación, importe el archivo de configuración proporcionado arrastrándolo y soltándolo o utilice el sistema de archivos Explorador. El archivo de configuración proporcionado se encuentra en experience-platform-dsw-reference/recipes/R/Retail\ -\ GradientBoosting/retail.config.json. Seleccione R en la lista desplegable Tiempo de ejecución y Clasificación en la lista desplegable Tipo. Una vez que se haya completado todo, haga clic en Siguiente en la esquina superior derecha para proceder a Administrar esquemas.

NOTA

Los tipos admiten ​la clasificación y la regresión. Si el modelo no se encuentra dentro de uno de estos tipos, seleccione Personalizado.

A continuación, seleccione los esquemas de entrada y salida de Retail Sales en la sección Administrar Esquemas, que se crearon utilizando la secuencia de comandos de arranque proporcionada en el tutorial crear el esquema de ventas minoristas y el conjunto de datos.

En la sección Administración de funciones, haga clic en la identificación del inquilino en el visor de esquemas para expandir el esquema de entrada de ventas minoristas. Seleccione las características de entrada y salida resaltando la función deseada y seleccionando Función de entrada o Función de Destinatario en la ventana Propiedades del campo derecha. Para este tutorial, establezca semanalSales como la Función de Destinatario y todo lo demás como Función de entrada. Haga clic en Siguiente para revisar la nueva fórmula configurada.

Revise la fórmula, agregue, modifique o elimine configuraciones según sea necesario. Haga clic en Finalizar para crear la fórmula.

Vaya a los pasos siguientes para averiguar cómo crear un modelo en Data Science Workspace mediante la fórmula de ventas minoristas recién creada.

Fórmula basada en el acoplador de importación - PySpark

Inicio navegando y seleccionando Flujos de trabajo ubicados en la parte superior izquierda de la Platform interfaz de usuario. A continuación, seleccione Importar fórmula y haga clic en Iniciar.

Aparece la página Configurar para el flujo de trabajo Importar fórmula. Escriba un nombre y una descripción para la fórmula y, a continuación, seleccione Siguiente en la esquina superior derecha para continuar.

configurar flujo de trabajo

NOTA

En el tutorial Empaquetar archivos de origen en un tutorial de Recipe, se proporcionó una URL de Docker al final de la generación de la fórmula de venta minorista mediante archivos de origen PySpark.

Una vez que esté en la página Seleccionar origen, pegue la dirección URL del Docker correspondiente a la fórmula empaquetada generada mediante archivos de origen PySpark en el campo URL de origen. A continuación, importe el archivo de configuración proporcionado arrastrándolo y soltándolo o utilice el sistema de archivos Explorador. El archivo de configuración proporcionado se encuentra en experience-platform-dsw-reference/recipes/pyspark/retail/pipeline.json. Seleccione PySpark en la lista desplegable Tiempo de ejecución. Una vez seleccionado el tiempo de ejecución de PySpark, el artefacto predeterminado se rellena automáticamente en Docker. A continuación, seleccione Clasificación en la lista desplegable Tipo. Una vez que se haya completado todo, haga clic en Siguiente en la esquina superior derecha para proceder a Administrar esquemas.

NOTA

Los tipos admiten ​la clasificación y la regresión. Si el modelo no se encuentra dentro de uno de estos tipos, seleccione Personalizado.

A continuación, seleccione los esquemas de entrada y salida de Retail Sales en la sección Administrar Esquemas, que se crearon utilizando la secuencia de comandos de arranque proporcionada en el tutorial crear el esquema de ventas minoristas y el conjunto de datos.

En la sección Administración de funciones, haga clic en la identificación del inquilino en el visor de esquemas para expandir el esquema de entrada de ventas minoristas. Seleccione las características de entrada y salida resaltando la función deseada y seleccionando Función de entrada o Función de Destinatario en la ventana Propiedades del campo derecha. Para este tutorial, establezca semanalSales como la Función de Destinatario y todo lo demás como Función de entrada. Haga clic en Siguiente para revisar la nueva fórmula configurada.

Revise la fórmula, agregue, modifique o elimine configuraciones según sea necesario. Haga clic en Finalizar para crear la fórmula.

Vaya a los pasos siguientes para averiguar cómo crear un modelo en Data Science Workspace mediante la fórmula de ventas minoristas recién creada.

Fórmula basada en el acoplador de importación: Scala

Inicio navegando y seleccionando Flujos de trabajo ubicados en la parte superior izquierda de la Platform interfaz de usuario. A continuación, seleccione Importar fórmula y haga clic en Iniciar.

Aparece la página Configurar para el flujo de trabajo Importar fórmula. Escriba un nombre y una descripción para la fórmula y, a continuación, seleccione Siguiente en la esquina superior derecha para continuar.

configurar flujo de trabajo

NOTA

En el tutorial Empaquetar archivos de origen en un tutorial de fórmula, se proporcionó una URL de Docker al final de la generación de la fórmula de venta minorista mediante archivos de origen de Scala (Spark).

Una vez que esté en la página Seleccionar origen, pegue la URL del Docker correspondiente a la fórmula empaquetada generada mediante archivos de origen Scala en el campo URL de origen. A continuación, importe el archivo de configuración proporcionado arrastrándolo y soltándolo o utilice el explorador del sistema de archivos. El archivo de configuración proporcionado se encuentra en experience-platform-dsw-reference/recipes/scala/retail/pipelineservice.json. Seleccione Spark en la lista desplegable Runtime. Una vez seleccionado el tiempo de ejecución Spark, el artefacto predeterminado se rellena automáticamente en Docker. A continuación, seleccione Regresión en la lista desplegable Tipo. Una vez que se haya completado todo, haga clic en Siguiente en la esquina superior derecha para proceder a Administrar esquemas.

NOTA

El tipo admite Clasificación y Regresión. Si el modelo no se encuentra dentro de uno de estos tipos, seleccione Personalizado.

A continuación, seleccione los esquemas de entrada y salida de Retail Sales en la sección Administrar Esquemas, que se crearon utilizando la secuencia de comandos de arranque proporcionada en el tutorial crear el esquema de ventas minoristas y el conjunto de datos.

En la sección Administración de funciones, haga clic en la identificación del inquilino en el visor de esquemas para expandir el esquema de entrada de ventas minoristas. Seleccione las características de entrada y salida resaltando la función deseada y seleccionando Función de entrada o Función de Destinatario en la ventana Propiedades del campo derecha. Para este tutorial, establezca "ventas semanales" como la característica de Destinatario y todo lo demás como característica de entrada. Haga clic en Siguiente para revisar la nueva fórmula configurada.

Revise la fórmula, agregue, modifique o elimine configuraciones según sea necesario. Haga clic en Finalizar para crear la fórmula.

Vaya a los pasos siguientes para averiguar cómo crear un modelo en Data Science Workspace mediante la fórmula de ventas minoristas recién creada.

Pasos siguientes

Este tutorial proporciona una perspectiva sobre cómo configurar e importar una fórmula en Data Science Workspace. Ahora puede crear, entrenar y evaluar un modelo con la fórmula recién creada.

En esta página

Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free