Inspiration

Clinical Match nace de un problema real: encontrar ensayos clínicos adecuados para un paciente sigue siendo un proceso lento, manual y difícil de escalar. Queríamos crear un agente capaz de leer un expediente médico, entender la situación clínica del paciente y encontrar ensayos relevantes de forma trazable y explicable.

What it does

Clinical Match procesa expedientes clínicos, extrae información relevante del paciente, busca ensayos clínicos candidatos, analiza sus criterios de inclusión y exclusión, evalúa el grado de compatibilidad y genera un ranking final de ensayos potencialmente adecuados.

How we built it

Construimos un pipeline modular en Python, usando Gemini para extracción y estructuración de texto clínico, ClinicalTrials.gov y TREC para recuperación de ensayos, normalización clínica con diccionarios y MeSH, y módulos deterministas para evaluación de criterios y ranking. Cada módulo guarda sus outputs, errores y warnings para mantener trazabilidad completa.

Challenges we ran into

El mayor reto fue convertir texto clínico y criterios de elegibilidad no estructurados en información evaluable. También tuvimos que gestionar datos faltantes, negaciones clínicas, criterios complejos, diferencias de formato entre fuentes y la necesidad de evitar alucinaciones del modelo.

Accomplishments that we're proud of

Estamos orgullosos de haber construido un sistema end-to-end funcional, modular y explicable. No es una caja negra: permite revisar qué datos se extrajeron, qué criterios se evaluaron, qué errores aparecieron y por qué un ensayo obtiene una determinada puntuación.

What we learned

Aprendimos que en problemas clínicos no basta con usar un LLM: es clave combinarlo con reglas deterministas, normalización, trazabilidad y control de errores. También vimos la importancia de distinguir entre información negativa, desconocida, ambigua o no aplicable.

What's next for Clinical Match

Los próximos pasos serían mejorar el parser de criterios complejos, dividir la extracción dirigida en lotes más pequeños, optimizar las queries de recuperación, ajustar el ranking con más datos de evaluación y añadir una interfaz para que médicos puedan revisar resultados y responder preguntas sobre información faltante.

Built With

Share this project:

Updates