El proyecto nació en las partidas de ping pong entre clases en la facultad. Al jugar de forma recreativa, notamos que nuestra voluntad de mejorar chocaba con una barrera: la incapacidad de ver nuestros propios errores técnicos. La diferencia entre un saque profesional y uno amateur reside en ángulos y movimientos imperceptibles para el ojo humano.
Como estudiantes de ingeniería, decidimos transformar esa curiosidad en una solución. Creamos esta herramienta porque somos usuarios de nuestro propio problema, buscando que cualquier jugador pueda perfeccionar su técnica con el apoyo de un mentor experto potenciado por IA. La propuesta proporciona un análisis profundo a una secuencia de saque de ping pong con el apoyo de herramientas que puedan facilitar el aprendizaje y la corrección de errores de una manera sencilla y eficiente.
Implementamos MediaPipe y cvzone para la detección precisa de puntos clave y el análisis biomecánico en tiempo real, lo que nos permitió transformar el movimiento físico en datos técnicos explotables. Para la retroalimentación, utilizamos la potencia multimodal de la API de Gemini, específicamente el modelo GEMINI-3.1-FLASH-LITE, logrando una generación de audio fluida que actúa como un coach personal. Finalmente, consolidamos toda esta arquitectura en un dashboard interactivo mediante Streamlit, permitiendo que procesos complejos de visión artificial e inteligencia artificial se presenten de forma sencilla y profesional para el usuario final.
Durante este proceso, no solo fortalecimos nuestra capacidad de trabajar bajo presión en entornos colaborativos, sino que también profundizamos en el dominio de un ecosistema tecnológico avanzado:
Visión Artificial Aplicada: Perfeccionamos el uso de MediaPipe para la extracción de landmarks corporales y CVZone para la visualización de datos en tiempo real, logrando traducir movimientos físicos en métricas digitales precisas.
Desarrollo de Interfaces con Streamlit: Aprendimos a transformar scripts complejos de Python en un dashboard interactivo, gestionando la experiencia de usuario mediante el control de estados, carga de archivos y renderizado de componentes multimedia.
Programación Asíncrona y APIs: Implementamos programación asíncrona (asyncio) para conectar nuestra lógica local con la API de Gemini, permitiendo una comunicación fluida y sin bloqueos entre el análisis de datos y la generación de respuestas de IA.
Esperamos seguir aprendiendo sobre inteligencia artificial y sus aplicaciones prácticas. Nos comprometemos a seguir mejorando nuestra capacidad de analizar problemas
Log in or sign up for Devpost to join the conversation.