WISE — Women's Intelligent Stratification for Endometrium

Transformant dades clíniques complexes en decisions accionables per al càncer d'endometri


Inspiració

El càncer d'endometri és el tumor ginecològic més freqüent a Europa. Dins d'aquest, el subgrup NSMP (Non-Specific Molecular Profile) representa un 25-30% dels casos i suposa un repte clínic especial.

El problema: No hi ha marcadors moleculars clars per estratificar el risc en pacients NSMP. Els clínics no disposen d'eines objectives, i les decisions de tractament esdevenen incertes.

La nostra pregunta: Podem utilitzar Intel·ligència Artificial per resoldre aquesta necessitat clínica real?


Què fa?

WISE és un sistema de suport a la decisió clínica que ajuda els metges a prendre decisions informades.

El flux és simple:

  1. El metge introdueix les dades del pacient al formulari
  2. WISE analitza les dades amb IA
  3. El metge rep un informe complet per prendre una decisió clínica informada

5 funcionalitats clau

Funcionalitat Descripció
📈 Predicció de Supervivència Risc de recurrència (DFS) i supervivència global (OS)
🔀 Estratificació 2 clústers de risc amb models específics
🧠 IA Explicable SHAP mostra QUINES variables influeixen i PER QUÈ
👥 Casos Similars Pacients històrics amb característiques semblants
📝 Informe Narratiu Gemini genera explicacions clíniques comprensibles

Com ho hem fet

Arquitectura

El sistema té tres capes principals:

  • Capa de Dades*
  • Partim de raw_data.csv amb dades clíniques reals
  • Apliquem Feature Engineering per netejar i transformar les variables
  • Generem model_ready.csv preparat per entrenar

  • Capa de Model*

  • Clustering jeràrquic (Ward) per definir 2 grups de risc

  • Models Cox Proportional Hazards específics per cada clúster

  • SHAP per explicar les prediccions

  • Capa d'Aplicació*

  • Formulari web intuïtiu per introduir dades

  • FastAPI com a backend

  • Gemini 2.5 Flash per generar informes narratius

  • Supabase per emmagatzemar resultats

Stack tecnològic

  • Backend: FastAPI + Uvicorn
  • ML/Stats: scikit-learn, lifelines, SHAP, XGBoost
  • Frontend: HTML, CSS, JavaScript
  • IA Generativa: Google Gemini 2.5 Flash
  • Base de dades: Supabase (PostgreSQL)

Obstacles que ens hem trobat

Repte 1: Dades clíniques complexes
Valors missing, codificacions inconsistents i múltiples formats de dates. Vam haver de fer un preprocessament exhaustiu.

Repte 2: Pocs events de recurrència
El dataset tenia poques recurrències, cosa que feia els models Cox inestables. Vam aplicar regularització i validació creuada.

Repte 3: SHAP amb Survival Analysis
Integrar explicabilitat SHAP amb models de supervivència no és trivial. Vam usar KernelExplainer per resoldre-ho.

Repte 4: Orquestració en temps real
Connectar Model predictiu + KNN + LLM de forma síncrona va requerir una arquitectura ben pensada.


Assoliments

Sistema end-to-end funcional — Des de dades fins a informe clínic, tot integrat

IA explicable real — No només prediiem, sinó que expliquem el PERQUÈ de cada predicció

Interfície pensada per metges — Formulari intuïtiu amb terminologia clínica

Integració multi-tècnica — Clustering + Cox + SHAP + LLM treballant junts


Què hem après?

📖 Survival Analysis — Models Cox, events, censura i com interpretar-los clínicament

📖 Explicabilitat — Diferències entre TreeExplainer i KernelExplainer de SHAP

📖 LLM Integration — Com usar Gemini per generar narratives clíniques coherents

📖 Disseny per clínics — Simplicitat sempre guanya a complexitat


Futur de WISE

🔜 Validació clínica amb més pacients i centres hospitalaris

🔜 Integració KNN directament a l'API per casos similars en temps real

🔜 Corbes de supervivència interactives al frontend

🔜 Més marcadors moleculars quan estiguin disponibles

🔜 Integració amb sistemes hospitalaris (HIS) per ús en producció


Equip

Projecte WISE — Hackathon bitsxlaMarató
Repte: Hack the Uterus! - NEST (NSMP Endometrial Stratification Tool)

Share this project:

Updates