¿Qué hace esta receta?
La fórmula de previsión de ventas minoristas utiliza el aprendizaje automático para predecir las tendencias de venta. La fórmula lo hace aprovechando la riqueza de datos históricos de venta minorista y el gradiente personalizado que potencia el algoritmo de aprendizaje automático de regresor para predecir las ventas con una semana de antelación. El modelo utiliza el historial de compras anterior y toma por defecto parámetros de configuración predeterminados determinados por nuestros científicos de datos para mejorar la precisión predictiva.
¿Cómo empiezo?
Puede empezar siguiendo este tutorial.
Este tutorial trata sobre la creación de la fórmula de ventas minoristas en un Jupyter Notebook y el uso del bloc de notas al flujo de trabajo de fórmulas para crear la fórmula en Adobe Experience Platform.
Esquema de datos
Esta fórmula usa esquemas XDM para modelar los datos. El esquema utilizado para esta fórmula se muestra a continuación:
Nombre del campo | Tipo |
---|---|
fecha | Cadena |
almacenar | Entero |
storeType | Cadena |
weeklySales | Número |
storeSize | Entero |
temperatura | Número |
regionFuelPrice | Número |
markdown | Número |
ppp | Número |
desocupación | Número |
isHoliday | Booleano |
Algoritmo
Primero, se carga el conjunto de datos de aprendizaje en el esquema DSWRetailSales. A partir de aquí, el modelo se entrena mediante un algoritmo de regresor de mejora de degradado. El impulso de degradado utiliza la idea de que los alumnos débiles (que es al menos ligeramente mejor que la probabilidad aleatoria) pueden formar una sucesión de alumnos centrados en mejorar las debilidades del alumno anterior. Juntos, se pueden usar para crear un poderoso modelo predictivo.
El proceso consta de tres elementos: una función de pérdida, un alumno débil y un modelo aditivo.
La función de pérdida se refiere a una medida de lo bueno que hace un modelo de predicción en términos de poder predecir el resultado esperado: en esta fórmula se utiliza la regresión de mínimos cuadrados.
En el aumento de degradado, se utiliza un árbol de decisión como alumno débil. Normalmente, se utilizan árboles con un número limitado de capas, nodos y divisiones para garantizar que el alumno siga siendo débil.
Por último, se utiliza un modelo aditivo. Después de calcular la pérdida con la función de pérdida, se elige el árbol que reduce la pérdida y se pondera para mejorar el modelado de las observaciones más difíciles. La producción del árbol ponderado se añade a la secuencia de árboles existente para mejorar la producción final del modelo - cantidad de ventas futuras .
Experience Platform
- Información general del espacio de trabajo de ciencia de datos
- Acceso y funciones de Data Science Workspace
- Tutorial del espacio de trabajo de ciencia de datos
- Portátiles de JupyterLab
- API de aprendizaje automático de Sensei
- Fórmulas prediseñadas
- Creando modelo
- Tutoriales de modelo y fórmula
- Guía de resolución de problemas
- Referencia de API
- Notas de la versión de Experience Platform