Predictor de Oportunidades Comerciales - Schneider Electric

Inspiración

Este proyecto nace de la necesidad real de las empresas de optimizar sus procesos de ventas en un entorno cada vez más competitivo. Nos inspiramos en el desafío de transformar datos históricos de ventas en insights accionables que permitan a los equipos comerciales tomar decisiones más informadas y estratégicas.

La pregunta clave que nos planteamos fue: ¿Cómo podemos ayudar a un director comercial a entender qué factores influyen en el éxito de una venta y qué acciones tomar para mejorar sus posibilidades?

Aprendizajes Clave

Durante el desarrollo del proyecto aprendimos:

  • Interpretabilidad de modelos: La importancia de no solo predecir, sino explicar el "por qué" detrás de cada predicción usando SHAP (SHapley Additive exPlanations)
  • Balance entre precisión y usabilidad: Un modelo perfecto sin una interfaz comprensible no genera valor real para el usuario
  • Integración de IA generativa: Cómo combinar modelos predictivos tradicionales con LLMs para traducir análisis técnicos en lenguaje de negocio
  • Visualización de datos compleja: Representar interacciones multivariables de forma intuitiva para usuarios no técnicos
  • Arquitectura modular y extensible: Diseñar el sistema para facilitar la incorporación de nuevos modelos predictivos

Construcción del Proyecto

Arquitectura Técnica

El proyecto se construyó en Python utilizando las siguientes tecnologías:

1. Modelo Predictivo

  • XGBoost: Modelo de clasificación para predecir la probabilidad de éxito ($P(\text{éxito}) \in [0,1]$)
  • Arquitectura modular: Sistema diseñado para permitir la adición de múltiples modelos (Random Forest, LightGBM, Neural Networks, etc.)
  • Comparación de modelos: Funcionalidad para evaluar y contrastar diferentes algoritmos
  • SHAP: Framework de explicabilidad que calcula valores Shapley para cada característica.

2. Interfaz de Usuario

  • Streamlit: Framework para crear la aplicación web interactiva
  • CSS personalizado: Para mejorar la experiencia visual y la usabilidad
  • Matplotlib: Visualizaciones customizadas con esquema de colores verde/rojo

3. Análisis Explicativo

  • Google Gemini AI: LLM para generar explicaciones en lenguaje natural
  • ElevenLabs API: Síntesis de voz para accesibilidad

Tres Modos de Análisis

Modo Micro

  • Análisis individual de cada oportunidad
  • Identificación de factores específicos positivos y negativos
  • Recomendaciones personalizadas

Modo Macro

  • Análisis global de patrones
  • Identificación de los factores más influyentes a nivel general
  • Estrategias de alto nivel

Modo Interacción

  • Análisis de relaciones entre variables
  • Gráficos de dependencia SHAP coloreados
  • Comprensión de efectos combinados

Sistema de Modelos Extensible

Una característica clave del proyecto es su arquitectura modular que permite:

  • Añadir nuevos modelos fácilmente: El código está estructurado para incorporar diferentes algoritmos sin modificar la lógica principal
  • Selección dinámica: El usuario puede elegir qué modelo utilizar para sus predicciones

Desafíos Enfrentados

1. Interpretabilidad vs Precisión

Problema: Los modelos más precisos (como redes neuronales profundas) son difíciles de explicar.

Solución: Optamos por XGBoost que ofrece un excelente balance entre precisión y explicabilidad mediante SHAP, pero diseñamos el sistema para soportar múltiples modelos.

2. Complejidad de SHAP Values

Problema: Los valores SHAP son conceptualmente complejos para usuarios no técnicos.

Solución: Integramos un LLM que traduce automáticamente los análisis SHAP a lenguaje de negocio comprensible.

3. Visualización de Interacciones

Problema: Representar gráficamente cómo dos variables interactúan entre sí de forma intuitiva.

Solución: Utilizamos gráficos de dependencia SHAP con codificación por color, acompañados de explicaciones contextualizadas.

4. Personalización de UI en Streamlit

Problema: Streamlit tiene limitaciones para personalización avanzada de CSS.

Solución: Implementamos selectores CSS específicos y utilizamos parámetros nativos de Streamlit (como type="primary") para estados visuales.

5. Lenguaje Accesible

Problema: Los términos técnicos y estadísticos alienan a usuarios de negocio.

Solución: Explicaciones del LLM, eliminando lenguaje técnico.

7. Escalabilidad de Modelos

Problema: ¿Cómo permitir que el sistema crezca con nuevos modelos sin reescribir código?

Solución: Arquitectura basada en diccionarios y funciones que funcionan con cualquier modelo compatible con SHAP.

Características Destacadas

  • Simulador de oportunidades: Simulación de escenarios modificando variables
  • Explicaciones en tiempo real: Análisis generados dinámicamente por IA
  • Visualizaciones intuitivas: Esquema de colores
  • Multimodal: Análisis micro, macro e interacciones
  • Sistema extensible: Capacidad de añadir diferentes modelos
  • Accesibilidad: Opción de síntesis de voz para explicaciones
  • Interfaz responsive: Diseño adaptado con sidebar y layout optimizado

Conclusión

Este proyecto demuestra que la verdadera innovación en IA no está solo en la precisión de los modelos, sino en hacerlos accesibles y útiles para las personas que deben tomar decisiones reales. Hemos construido un puente entre la ciencia de datos y el mundo de los negocios, permitiendo que cualquier persona, sin conocimientos técnicos, pueda aprovechar el poder del machine learning para mejorar sus resultados comerciales.

La arquitectura extensible del sistema permite que evolucione con el tiempo, incorporando nuevos algoritmos y técnicas a medida que la ciencia de datos avanza, todo mientras mantiene la misma interfaz simple y comprensible para el usuario final.

Built With

Share this project:

Updates