MangoDemandForecastSDR

Inspiration

La idea central es abordar el reto que plantea Mango: decidir hoy cuántas prendas producir de artículos que a veces ni existen todavía, para venderlos dentro de nueve meses, evitando tanto el desabastecimiento como el exceso de inventario.

What it does

MangoDemandForecastSDR estima cuántas unidades producir por producto en la próxima temporada.

A partir de:

histórico de ventas y producción,
atributos de la prenda (familia, categoría, tejido, silueta, etc.),
distribución (tiendas, tallas),
embeddings de imagen de las prendas,

el sistema genera una predicción de demanda agregada por producto y la convierte en una recomendación de Production optimizada para la métrica de negocio VAR (Ventas Antes de Rebajas / Producción).

How we built it

Preprocesamos los datos:
- limpieza de columnas poco informativas,
- agregación semanal → por producto (ID),
- features temporales (año, semana, ciclo de vida),
- codificación de categóricas (one-hot),
- escalado de numéricas.
Integramos los embeddings de imagen como features numéricos.
Entrenamos modelos de regresión (p.ej. LightGBM) para predecir demanda.
Ajustamos las predicciones con distintos factores de riesgo para alinearnos con la métrica VAR, que penaliza más la subproducción que el exceso de stock.
Generamos submissions en formato ID,Production para evaluación en Kaggle.

Challenges we ran into

Métrica asimétrica: optimizar VAR no es lo mismo que bajar el MAE; aprendimos que un modelo “preciso” puede ser malo si se queda sistemáticamente corto.
Escalado de la demanda: trabajar con demanda agregada, semanal y escalada nos obligó a cuidar mucho cómo reescalábamos y sumábamos las predicciones.
Dimensionalidad: entre one-hot encoding y embeddings de imagen, el número de features crece rápido.
Validación temporal: no podemos barajar temporadas alegremente; hubo que respetar el orden temporal para no sobreestimar el rendimiento.

Accomplishments that we're proud of

Montar un pipeline completo de extremo a extremo: desde CSVs crudos hasta submissions competitivas.
Conseguir un score consistente en la métrica VAR y entender por qué algunos modelos funcionaban peor pese a tener mejor MAE.
Documentar el proyecto de forma clara (README, notebooks, experimentos) para que cualquiera pueda seguir la historia del modelo.

What we learned

Que la elección de target y escala es tan importante como el modelo en sí.
Que diseñar la validación pensando en el caso de uso real (temporadas futuras) cambia decisiones de modelado.
Que a veces es mejor equivocarse “hacia arriba” (ligero exceso de producción) que clavar el MAE pero perder muchas ventas.
Que los embeddings de imagen pueden aportar valor incluso sin entrenar un modelo de visión complejo, solo usándolos como features.

What's next for MangoDemandForecastSDR

Probar modelos adicionales (CatBoost, redes neuronales, ensembles) y combinarlos con el LightGBM actual.
Afinar la validación temporal (por temporadas y familias de producto).
Explorar ajustes dinámicos de riesgo por categoría (no penaliza igual pasarse en básicos que en ultra-tendencia).
Añadir explicabilidad: feature importance, análisis por familia y visualizaciones para planners y equipos de negocio.
Dejar el repo listo para que pueda usarse como plantilla de futuros retos de demanda en retail.

Built With

python

Updates

Andres Gonzalez Varon started this project — Nov 16, 2025 05:56 AM EST

Leave feedback in the comments!

Log in or sign up for Devpost to join the conversation.