RastreaDOC

Inspiración

Hoy en día, el conocimiento de las empresas y organizaciones está fragmentado en silos: informes en PDF, presupuestos en Excel, actas en Word o LibreOffice. Los motores de búsqueda tradicionales basados en coincidencia exacta de palabras (búsqueda léxica) fracasan cuando un usuario busca un concepto o hace una pregunta natural.

Nuestra solución: Centralizamos cualquier tipo de archivo de ofimática, extraemos su texto, lo dividimos en fragmentos lógicos (chunks) y calculamos los embeddings. Al buscar, el sistema entiende el contexto y devuelve los documentos que considera relevantes para responder la necesidad de información del usuario.

¿Qué es?

API RESTful robusta que actúa como la base para un sistema de indexación orquestada por elasticsearch.

Cómo lo construimos

Frontend: React Backend: Python + FastAPI. Base de Datos Vectorial: Elasticsearch IA / Embeddings: SentenceTransformers Procesamiento de Datos: Pandas, PyPDF2, python-docx, odfpy. Infraestructura: Docker & Docker Compose.

Built With

Updates

Carolina Rey started this project — Mar 01, 2026 12:45 AM EST

Leave feedback in the comments!

Log in or sign up for Devpost to join the conversation.