Creación y publicación de un modelo de aprendizaje automático

Supongamos que es propietario de un sitio web de venta minorista en línea. Cuando los clientes compran en su sitio web de venta minorista, desea presentarles recomendaciones de productos personalizadas para exponer una variedad de otros productos que su empresa ofrece. A lo largo de la existencia de su sitio web, ha recopilado continuamente datos de clientes y desea utilizar de alguna manera estos datos para generar recomendaciones de productos personalizadas.

Adobe Experience Platform Data Science Workspace proporciona los medios para lograr su objetivo utilizando la fórmula prediseñada de Product Recommendations. Siga este tutorial para ver cómo puede acceder y comprender los datos de venta minorista, crear y optimizar un modelo de aprendizaje automático y generar perspectivas en Data Science Workspace.

Este tutorial refleja el flujo de trabajo de Data Science Workspace y abarca los siguientes pasos para crear un modelo de aprendizaje automático:

  1. Preparar los datos
  2. Crear el modelo
  3. Capacite y evalúe su modelo
  4. Operacionalizar el modelo

Primeros pasos

Antes de iniciar este tutorial, debe tener los siguientes requisitos previos:

  • Acceso a Adobe Experience Platform. Si no tiene acceso a una organización de IMS en Experience Platform, póngase en contacto con el administrador del sistema antes de continuar.

  • Recursos de habilitación. Póngase en contacto con el representante de su cuenta para que le proporcionen los siguientes artículos.

    • Fórmula de Recommendations
    • Conjunto de datos de entrada de Recommendations
    • Esquema de entrada de Recommendations
    • Conjunto de datos de salida de Recommendations
    • Esquema de salida de Recommendations
    • Conjunto de datos dorados postValues
    • Esquema de conjunto de datos dorado
  • Descargue los tres archivos Jupyter Notebook requeridos del Adobe public Git repository, se utilizarán para mostrar el flujo de trabajo JupyterLab en Data Science Workspace.

Una explicación práctica de los siguientes conceptos clave utilizados en este tutorial:

  • Experience Data Model: El esfuerzo de estandarización liderado por Adobe para definir esquemas estándar como Profile y ExperienceEvent para la gestión de la experiencia del cliente.
  • Conjuntos de datos: Construcción de almacenamiento y administración para datos reales. Instancia de instancia física de un Esquema XDM.
  • Lotes: Los conjuntos de datos están formados por lotes. Un lote es un conjunto de datos recopilados durante un período de tiempo y procesados juntos como una sola unidad.
  • JupyterLab: JupyterLab es una interfaz basada en web de código abierto para Project Jupyter y está estrechamente integrada en Experience Platform.

Prepare sus datos

Para crear un modelo de aprendizaje automático que realice recomendaciones de productos personalizadas a los clientes, se deben analizar las compras anteriores de los clientes en el sitio web. En esta sección se explica cómo se incorporan estos datos en Platform a Adobe Analytics y cómo se transforman esos datos en un conjunto de datos de funciones que utilizará el modelo de aprendizaje automático.

Explorar los datos y comprender los esquemas

Inicie sesión en Adobe Experience Platform y seleccione Datasets para enumerar todos los conjuntos de datos existentes y seleccione el conjunto de datos que desea explorar. En este caso, el conjunto de datos Analytics Golden Data Set postValues.

Se abre la página de actividad del conjunto de datos, que enumera información relacionada con su conjunto de datos. Puede seleccionar Preview Dataset cerca de la esquina superior derecha para examinar los registros de muestra. También puede ver el esquema del conjunto de datos seleccionado. Seleccione el vínculo de esquema en el carril derecho. Aparece una ventana emergente, al seleccionar el vínculo en schema name se abre el esquema en una nueva pestaña.

Los demás conjuntos de datos se han rellenado previamente con lotes para obtener una vista previa. Puede ver estos conjuntos de datos repitiendo los pasos anteriores.

Nombre del conjunto de datos Esquema Descripción
Conjunto de datos dorados postValues Esquema de conjunto de datos dorado Analytics datos de origen de su sitio web
Conjunto de datos de entrada de Recommendations Esquema de entrada de Recommendations Los datos Analytics se transforman en un conjunto de datos de capacitación mediante una canalización de funciones. Estos datos se utilizan para entrenar el modelo de aprendizaje automático de Product Recommendations. itemid y userid corresponden a un producto comprado por ese cliente.
Conjunto de datos de salida de Recommendations Esquema de salida de Recommendations El conjunto de datos para el que se almacenan los resultados de puntuación, contendrá la lista de productos recomendados para cada cliente.

Cree el modelo

El segundo componente del ciclo de vida Data Science Workspace implica la creación de fórmulas y modelos. La fórmula de Product Recommendations está diseñada para generar recomendaciones de productos a escala mediante la utilización de datos de compras anteriores y aprendizaje automático.

Las fórmulas son la base de un modelo, ya que contienen algoritmos de aprendizaje automático y lógica diseñada para resolver problemas específicos. Lo que es más importante, las fórmulas le permiten democratizar el aprendizaje automático en su organización, lo que permite a otros usuarios acceder a un modelo para casos de uso diferentes sin necesidad de escribir ningún código.

Explorar la fórmula de Product Recommendations

En el Experience Platform, vaya a Models desde la columna de navegación izquierda y, a continuación, seleccione Recipes en la barra de navegación superior para ver una lista de las fórmulas disponibles para su organización.

A continuación, busque y abra el Recommendations Recipe proporcionado seleccionando su nombre. Aparecerá la página de información general de la fórmula.

A continuación, en el carril derecho, seleccione Recommendations Input Schema para ver el esquema que alimenta la fórmula. Los campos de esquema "itemId" y "userId" corresponden a un producto comprado (interactionType) por ese cliente en un momento específico (timestamp). Siga los mismos pasos para revisar los campos del Recommendations Output Schema.

Ahora ha revisado los esquemas de entrada y salida requeridos por la fórmula de Product Recommendations. Continúe con la siguiente sección para aprender a crear, entrenar y evaluar un modelo de Recommendations de producto.

Capacite y evalúe su modelo

Ahora que los datos están preparados y la fórmula está lista, puede crear, entrenar y evaluar su modelo de aprendizaje automático.

Crear un modelo

Un modelo es una instancia de una fórmula, que permite entrenar y puntuar con datos a escala.

En el Experience Platform, vaya a Models desde la columna de navegación izquierda y, a continuación, seleccione Recipes en la barra de navegación superior. Muestra una lista de las fórmulas disponibles para su organización. Seleccione la fórmula de recomendación de producto.

En la página de fórmula, seleccione Create Model.

crear modelo

El flujo de trabajo crear modelo comienza por seleccionar una fórmula. Seleccione Recommendations Recipe y, a continuación, seleccione Next en la esquina superior derecha.

A continuación, proporcione un nombre de modelo. Las configuraciones disponibles para el modelo se enumeran que contienen configuraciones para los comportamientos de capacitación y puntuación predeterminados del modelo. Revise las configuraciones y seleccione Finish.

Se le redirige la página de información general de sus modelos con una nueva ejecución de formación generada. Una ejecución de formación se genera de forma predeterminada cuando se crea un modelo.

Puede optar por esperar a que finalice la ejecución de formación o continuar creando una nueva ejecución de formación en la siguiente sección.

Capacitar el modelo mediante hiperparámetros personalizados

En la página Información general del modelo, seleccione Train cerca de la parte superior derecha para crear una nueva ejecución de formación. Seleccione el mismo conjunto de datos de entrada que utilizó al crear el modelo y seleccione Next.

Aparece la página Configuration. Aquí puede configurar el valor de las ejecuciones de formación num_recommendations, también conocido como hiperparámetro. Un modelo preparado y optimizado utilizará los hiperparámetros de mejor rendimiento según los resultados de la ejecución de la formación.

Los hiperparámetros no se pueden aprender, por lo que deben asignarse antes de que se ejecuten las formaciones. El ajuste de hiperparámetros puede cambiar la precisión del modelo entrenado. Dado que la optimización de un modelo es un proceso iterativo, puede ser necesario realizar múltiples ejercicios de capacitación antes de que se logre una evaluación satisfactoria.

CONSEJO

Establezca num_recommendations en 10.

Aparecen puntos de datos adicionales en el gráfico de evaluación del modelo. Esto puede tardar hasta varios minutos en aparecer una vez finalizada la ejecución.

Evaluar el modelo

Cada vez que se completa una ejecución de formación, puede ver las métricas de evaluación resultantes para determinar el rendimiento del modelo.

Para revisar las métricas de evaluación (Precisión y Reclamación) para cada ejecución de capacitación completada, seleccione la ejecución de capacitación.

Puede explorar la información proporcionada para cada métrica de evaluación. Cuanto más altas sean estas métricas, mejor será el rendimiento del modelo.

Puede ver el conjunto de datos, el esquema y los parámetros de configuración utilizados para cada formación ejecutada en el carril correcto. Vuelva a la página Modelo e identifique la formación de mayor rendimiento ejecutada observando sus métricas de evaluación.

Operacionalice el modelo

El último paso del flujo de trabajo de ciencia de datos es poner en marcha el modelo para obtener una puntuación y consumir perspectivas del almacén de datos.

Puntuación y generación de perspectivas

En la página de información general del modelo de recomendaciones de productos, seleccione el nombre de la ejecución de formación de mejor rendimiento, con los valores de precisión y recuperación más altos.

puntuación de la mejor ejecución

A continuación, en la parte superior derecha de la página de detalles de la ejecución de la formación, seleccione Score.

seleccionar puntuación

A continuación, seleccione Recommendations Input Dataset como conjunto de datos de entrada de puntuación, que es el mismo conjunto de datos que utilizó al crear el modelo y ejecutar sus ejecuciones de formación. A continuación, seleccione Next.

Una vez que tenga el conjunto de datos de entrada, seleccione Recommendations Output Dataset como conjunto de datos de salida de puntuación. Los resultados de puntuación se almacenan en este conjunto de datos como un lote.

Finalmente, revise las configuraciones de puntuación. Estos parámetros contienen los conjuntos de datos de entrada y salida seleccionados anteriormente, junto con los esquemas adecuados. Seleccione Finish para comenzar la ejecución de la puntuación. La ejecución puede tardar varios minutos en completarse.

Ver perspectivas puntuadas

Una vez finalizada correctamente la ejecución de puntuación, puede obtener una vista previa de los resultados y ver las perspectivas generadas.

En la página ejecuciones de puntuación , seleccione la ejecución de puntuación completada y, a continuación, seleccione Preview Scoring Results Dataset en el carril derecho.

En la tabla de vista previa, cada fila contiene recomendaciones de producto para un cliente en particular, etiquetadas como recommendations y userId respectivamente. Dado que el hiperparámetro num_recommendations se estableció en 10 en las capturas de pantalla de muestra, cada fila de recomendaciones puede contener hasta 10 identidades de producto delimitadas por un signo de número (#).

Pasos siguientes

Este tutorial le introdujo en el flujo de trabajo de Data Science Workspace, demostrando cómo los datos sin procesar se pueden convertir en información útil a través del aprendizaje automático. Para obtener más información sobre el uso de Data Science Workspace, continúe con la siguiente guía sobre la creación del esquema de ventas minoristas y el conjunto de datos.

En esta página