Importación de una fórmula empaquetada en la interfaz de usuario de Data Science Workspace

Este tutorial proporciona información sobre cómo configurar e importar una fórmula empaquetada mediante el ejemplo de ventas minoristas proporcionado. Al final de este tutorial, estará listo para crear, entrenar y evaluar un modelo en Adobe Experience Platform Data Science Workspace.

Requisitos previos

Este tutorial requiere una fórmula empaquetada en forma de URL de imagen Docker. Consulte el tutorial sobre cómo Empaquetar archivos de origen en una fórmula para obtener más información.

Flujo de trabajo IU

La importación de una fórmula empaquetada en Data Science Workspace requiere configuraciones de fórmula específicas, compiladas en un solo archivo de JavaScript Object Notation (JSON), esta compilación de configuraciones de fórmula se denomina archivo de configuración. Una fórmula empaquetada con un conjunto particular de configuraciones se denomina instancia de fórmula. Se puede usar una fórmula para crear muchas instancias de fórmula en Data Science Workspace.

El flujo de trabajo para importar una fórmula de paquete consta de los siguientes pasos:

Configuración de una fórmula configure

Cada instancia de fórmula de Data Science Workspace va acompañada de un conjunto de configuraciones que personalizan la instancia de fórmula para adaptarla a un caso de uso determinado. Los archivos de configuración definen los comportamientos de formación y puntuación predeterminados de un modelo creado con esta instancia de fórmula.

NOTE
Los archivos de configuración son específicos de fórmula y caso.

A continuación se muestra un archivo de configuración de muestra que muestra los comportamientos predeterminados de formación y puntuación para la fórmula de ventas minoristas.

[
    {
        "name": "train",
        "parameters": [
            {
                "key": "learning_rate",
                "value": "0.1"
            },
            {
                "key": "n_estimators",
                "value": "100"
            },
            {
                "key": "max_depth",
                "value": "3"
            },
            {
                "key": "ACP_DSW_INPUT_FEATURES",
                "value": "date,store,storeType,storeSize,temperature,regionalFuelPrice,markdown,cpi,unemployment,isHoliday"
            },
            {
                "key": "ACP_DSW_TARGET_FEATURES",
                "value": "weeklySales"
            },
            {
                "key": "ACP_DSW_FEATURE_UPDATE_SUPPORT",
                "value": false
            },
            {
                "key": "tenantId",
                "value": "_{TENANT_ID}"
            },
            {
                "key": "ACP_DSW_TRAINING_XDM_SCHEMA",
                "value": "{SEE BELOW FOR DETAILS}"
            },
            {
                "key": "evaluation.labelColumn",
                "value": "weeklySalesAhead"
            },
            {
                "key": "evaluation.metrics",
                "value": "MAPE,MAE,RMSE,MASE"
            }
        ]
    },
    {
        "name": "score",
        "parameters": [
            {
                "key": "tenantId",
                "value": "_{TENANT_ID}"
            },
            {
                "key":"ACP_DSW_SCORING_RESULTS_XDM_SCHEMA",
                "value":"{SEE BELOW FOR DETAILS}"
            }
        ]
    }
]
Clave de parámetro
Tipo
Descripción
learning_rate
Número
Escalar para multiplicación de degradado.
n_estimators
Número
Número de árboles del bosque para el Clasificador de bosque aleatorio.
max_depth
Número
Profundidad máxima de un árbol en el Clasificador de bosque aleatorio.
ACP_DSW_INPUT_FEATURES
Cadena
Lista de atributos de esquema de entrada separados por comas.
ACP_DSW_TARGET_FEATURES
Cadena
Lista de atributos de esquema de salida separados por comas.
ACP_DSW_FEATURE_UPDATE_SUPPORT
Booleano
Determina si se pueden modificar las características de entrada y salida
tenantId
Cadena
Este ID garantiza que los recursos que cree tengan un espacio de nombres correcto y estén contenidos en la organización. Siga los pasos aquí para encontrar su ID de inquilino.
ACP_DSW_TRAINING_XDM_SCHEMA
Cadena
El esquema de entrada utilizado para entrenar un modelo. Deje esto vacío al importar en la interfaz de usuario, reemplace con SchemaID de formación al importar mediante API.
evaluation.labelColumn
Cadena
Etiqueta de columna para visualizaciones de evaluación.
evaluation.metrics
Cadena
Lista separada por comas de las métricas de evaluación que se utilizarán para evaluar un modelo.
ACP_DSW_SCORING_RESULTS_XDM_SCHEMA
Cadena
Esquema de salida utilizado para puntuar un modelo. Deje esto vacío al importar en la interfaz de usuario, reemplace por SchemaID de puntuación al importar mediante API.

A los efectos de este tutorial, puede dejar los archivos de configuración predeterminados para la fórmula de ventas minoristas en la referencia Data Science Workspace tal como están.

Importar fórmula basada en Docker: Python python

Comience por navegar y seleccionar Flujos de trabajo ubicados en la parte superior izquierda de la interfaz de usuario de Platform. A continuación, seleccione Importar fórmula y seleccione Iniciar.

Aparecerá la página Configurar para el flujo de trabajo Importar fórmula. Escriba un nombre y una descripción para la fórmula y, a continuación, seleccione Siguiente en la esquina superior derecha.

configurar flujo de trabajo

NOTE
En el tutorial Empaquetar archivos de origen en una fórmula, se ha proporcionado una URL de Docker al final de la creación de la fórmula de ventas minoristas con archivos de origen de Python.

Una vez que esté en la página Seleccionar origen, pegue la URL de Docker correspondiente a la fórmula empaquetada creada con Python archivos de origen en el campo URL de Source. A continuación, importe el archivo de configuración proporcionado arrastrando y soltando, o utilice el sistema de archivos Browser. El archivo de configuración proporcionado se encuentra en experience-platform-dsw-reference/recipes/python/retail/retail.config.json. Seleccione Python en la lista desplegable de Runtime y Classification en la lista desplegable de Type. Una vez que haya completado todo, seleccione Siguiente en la esquina superior derecha para continuar con Administrar esquemas.

NOTE
El tipo admite clasificación y regresión. Si el modelo no corresponde a uno de esos tipos, seleccione Personalizado.

A continuación, seleccione los esquemas de entrada y salida de ventas minoristas en la sección Administrar esquemas, se crearon utilizando el script de arranque proporcionado en el tutorial crear el esquema de ventas minoristas y el conjunto de datos.

En la sección Administración de características, seleccione una identificación de inquilino en el visor de esquemas para expandir el esquema de entrada Ventas minoristas. Seleccione las características de entrada y salida resaltando la característica deseada y seleccionando Característica de entrada o Función de destino en la ventana derecha de Propiedades del campo. Para este tutorial, establezca weeklySales como característica de destino y todo lo demás como característica de entrada. Seleccione Siguiente para revisar la nueva fórmula configurada.

Revise la fórmula, agregue, modifique o elimine configuraciones según sea necesario. Seleccione Finalizar para crear la fórmula.

Continúe con los pasos siguientes para averiguar cómo crear un modelo en Data Science Workspace con la fórmula de ventas minoristas recién creada.

Importar fórmula basada en Docker: R r

Comience por navegar y seleccionar Flujos de trabajo ubicados en la parte superior izquierda de la interfaz de usuario de Platform. A continuación, seleccione Importar fórmula y seleccione Iniciar.

Aparecerá la página Configurar para el flujo de trabajo Importar fórmula. Escriba un nombre y una descripción para la fórmula y, a continuación, seleccione Siguiente en la esquina superior derecha.

configurar flujo de trabajo

NOTE
En el tutorial Empaquetar archivos de origen en una fórmula, se ha proporcionado una URL de Docker al final de la creación de la fórmula de ventas minoristas con archivos de origen R.

Una vez que esté en la página Seleccionar origen, pegue la URL de Docker correspondiente a la fórmula empaquetada creada con archivos de origen R en el campo URL de Source. A continuación, importe el archivo de configuración proporcionado arrastrando y soltando, o utilice el sistema de archivos Browser. El archivo de configuración proporcionado se encuentra en experience-platform-dsw-reference/recipes/R/Retail\ -\ GradientBoosting/retail.config.json. Seleccione R en la lista desplegable de Runtime y Classification en la lista desplegable de Type. Una vez que haya completado todo, seleccione Siguiente en la esquina superior derecha para continuar con Administrar esquemas.

NOTE
Type admite Classification y Regresión. Si el modelo no corresponde a uno de esos tipos, seleccione Personalizado.

A continuación, seleccione los esquemas de entrada y salida de ventas minoristas en la sección Administrar esquemas, se crearon utilizando el script de arranque proporcionado en el tutorial crear el esquema de ventas minoristas y el conjunto de datos.

En la sección Administración de características, seleccione una identificación de inquilino en el visor de esquemas para expandir el esquema de entrada Ventas minoristas. Seleccione las características de entrada y salida resaltando la característica deseada y seleccionando Característica de entrada o Función de destino en la ventana derecha de Propiedades del campo. Para este tutorial, establezca weeklySales como característica de destino y todo lo demás como característica de entrada. Seleccione Siguiente para revisar la nueva fórmula configurada.

Revise la fórmula, agregue, modifique o elimine configuraciones según sea necesario. Seleccione Finalizar para crear la fórmula.

Continúe con los pasos siguientes para averiguar cómo crear un modelo en Data Science Workspace con la fórmula de ventas minoristas recién creada.

Importar fórmula basada en Docker: PySpark pyspark

Comience por navegar y seleccionar Flujos de trabajo ubicados en la parte superior izquierda de la interfaz de usuario de Platform. A continuación, seleccione Importar fórmula y seleccione Iniciar.

Aparecerá la página Configurar para el flujo de trabajo Importar fórmula. Escriba un nombre y una descripción para la fórmula y, a continuación, seleccione Siguiente en la esquina superior derecha para continuar.

configurar flujo de trabajo

NOTE
En el tutorial Empaquetar archivos de origen en una fórmula, se ha proporcionado una URL de Docker al final de la creación de la fórmula de ventas minoristas con archivos de origen PySpark.

Una vez que esté en la página Seleccionar origen, pegue la URL de Docker correspondiente a la fórmula empaquetada creada con archivos de origen PySpark en el campo URL de Source. A continuación, importe el archivo de configuración proporcionado arrastrando y soltando, o utilice el sistema de archivos Browser. El archivo de configuración proporcionado se encuentra en experience-platform-dsw-reference/recipes/pyspark/retail/pipeline.json. Seleccione PySpark en la lista desplegable de Runtime. Una vez seleccionado el tiempo de ejecución de PySpark, el artefacto predeterminado se rellena automáticamente en Docker. A continuación, seleccione Clasificación en la lista desplegable Tipo. Una vez que haya completado todo, seleccione Siguiente en la esquina superior derecha para continuar con Administrar esquemas.

NOTE
Type admite Classification y Regresión. Si el modelo no corresponde a uno de esos tipos, seleccione Personalizado.

A continuación, seleccione los esquemas de entrada y salida de ventas minoristas usando el selector Administrar esquemas; los esquemas se crearon usando el script de arranque proporcionado en el tutorial crear el esquema de ventas minoristas y el conjunto de datos.

administrar esquemas

En la sección Administración de características, seleccione una identificación de inquilino en el visor de esquemas para expandir el esquema de entrada Ventas minoristas. Seleccione las características de entrada y salida resaltando la característica deseada y seleccionando Característica de entrada o Función de destino en la ventana derecha de Propiedades del campo. Para este tutorial, establezca weeklySales como característica de destino y todo lo demás como característica de entrada. Seleccione Siguiente para revisar la nueva fórmula configurada.

Revise la fórmula, agregue, modifique o elimine configuraciones según sea necesario. Seleccione Finalizar para crear la fórmula.

Continúe con los pasos siguientes para averiguar cómo crear un modelo en Data Science Workspace con la fórmula de ventas minoristas recién creada.

Importar fórmula basada en Docker: Scala scala

Comience por navegar y seleccionar Flujos de trabajo ubicados en la parte superior izquierda de la interfaz de usuario de Platform. A continuación, seleccione Importar fórmula y seleccione Iniciar.

Aparecerá la página Configurar para el flujo de trabajo Importar fórmula. Escriba un nombre y una descripción para la fórmula y, a continuación, seleccione Siguiente en la esquina superior derecha para continuar.

configurar flujo de trabajo

NOTE
En el tutorial Empaquetar archivos de origen en una fórmula, se ha proporcionado una URL de Docker al final de la creación de la fórmula de ventas minoristas con archivos de origen de Scala (Spark).

Una vez que esté en la página Seleccionar origen, pegue la URL de Docker correspondiente a la fórmula empaquetada creada con archivos de origen de Scala en el campo URL de Source. A continuación, importe el archivo de configuración proporcionado arrastrando y soltando, o utilice el explorador del sistema de archivos. El archivo de configuración proporcionado se encuentra en experience-platform-dsw-reference/recipes/scala/retail/pipelineservice.json. Seleccione Spark en la lista desplegable de Runtime. Una vez seleccionado el tiempo de ejecución de Spark, el artefacto predeterminado se rellena automáticamente en Docker. A continuación, seleccione Regresión de la lista desplegable Tipo. Una vez que haya completado todo, seleccione Siguiente en la esquina superior derecha para continuar con Administrar esquemas.

NOTE
El tipo admite clasificación y regresión. Si el modelo no corresponde a uno de esos tipos, seleccione Personalizado.

A continuación, seleccione los esquemas de entrada y salida de ventas minoristas usando el selector Administrar esquemas; los esquemas se crearon usando el script de arranque proporcionado en el tutorial crear el esquema de ventas minoristas y el conjunto de datos.

administrar esquemas

En la sección Administración de características, seleccione una identificación de inquilino en el visor de esquemas para expandir el esquema de entrada Ventas minoristas. Seleccione las características de entrada y salida resaltando la característica deseada y seleccionando Característica de entrada o Función de destino en la ventana derecha de Propiedades del campo. Para los fines de este tutorial, establezca "weeklySales" como característica de destino y todo lo demás como característica de entrada. Seleccione Siguiente para revisar la nueva fórmula configurada.

Revise la fórmula, agregue, modifique o elimine configuraciones según sea necesario. Seleccione Finalizar para crear la fórmula.

Continúe con los pasos siguientes para averiguar cómo crear un modelo en Data Science Workspace con la fórmula de ventas minoristas recién creada.

Pasos siguientes next-steps

Este tutorial proporcionó información sobre cómo configurar e importar una fórmula en Data Science Workspace. Ahora puede crear, entrenar y evaluar un modelo con la fórmula recién creada.

recommendation-more-help
cc79fe26-64da-411e-a6b9-5b650f53e4e9