Inspiration

Sentinel AI nació de una idea simple: muchas tareas en la computadora todavía requieren buscar aplicaciones manualmente, usar el mouse, escribir direcciones o cambiar entre herramientas una por una. Queríamos crear una forma más natural de interactuar con la computadora, donde el usuario solo tenga que decir lo que necesita y el sistema lo ejecute.

What it does

Sentinel AI es un asistente de escritorio controlado por voz que convierte comandos naturales en acciones reales dentro de la computadora.

El usuario puede decir instrucciones como:

  • "Abre Excel"
  • "Abre Visual Studio Code"
  • "Abre el navegador"
  • "Activa modo clase"

El sistema transcribe el comando, interpreta la intención y ejecuta la acción correspondiente. Puede abrir aplicaciones locales, iniciar herramientas de trabajo y activar un modo de productividad para estudiar o trabajar.

How we built it

Construimos Sentinel AI usando Python. El proyecto está dividido en módulos para mantener el código organizado y fácil de expandir.

El flujo principal del programa es:

  1. El usuario da un comando de voz.
  2. El sistema convierte el audio en texto.
  3. El motor de intención analiza el comando.
  4. El programa selecciona la acción correcta.
  5. Sentinel AI ejecuta la acción en la computadora.

Para la demo usamos macOS porque permitió correr el prototipo de forma más fluida. Sin embargo, la estructura del proyecto fue pensada para poder adaptarse a otros sistemas operativos.

Challenges we ran into

Uno de los principales retos fue hacer que el sistema entendiera comandos naturales y no solo frases exactas. También tuvimos que diferenciar entre distintos tipos de acciones, como abrir aplicaciones, abrir herramientas de trabajo o activar un modo personalizado.

Otro reto fue trabajar con compatibilidad entre sistemas operativos, ya que cada uno ejecuta aplicaciones de forma diferente.

Accomplishments that we're proud of

Estamos orgullosos de haber construido un prototipo funcional que no solo responde con texto, sino que realmente interactúa con la computadora.

Logramos integrar transcripción de voz, detección de intención y ejecución de acciones reales del sistema en un solo flujo. También dejamos una base modular para que el proyecto pueda crecer con más comandos y funciones.

What we learned

Aprendimos cómo conectar reconocimiento de voz, procesamiento de texto y automatización del sistema. También entendimos que crear un asistente útil no solo depende de reconocer palabras, sino de interpretar correctamente lo que el usuario quiere hacer.

What's next for Sentinel AI

A futuro, Sentinel AI podría crecer para abrir archivos específicos, crear documentos, automatizar flujos de trabajo, integrarse con más aplicaciones y mejorar su compatibilidad con Windows, macOS y Linux.

También podría enfocarse en accesibilidad, ayudando a personas que prefieren o necesitan controlar la computadora mediante voz.

Built with

  • Python
  • Speech transcription
  • Intent detection
  • System automation
  • macOS

Built With

  • faster-whisper
  • flask
  • intent-detection
  • macos
  • python
  • speech-recognition
  • system-automation
Share this project:

Updates