Propósito
Este proyecto es una solución diseñada para facilitar la gestión, búsqueda y organización de documentos. Este proyecto permite a los usuarios indexar documentos tanto de Google Drive como de OneDrive y realizar búsquedas avanzadas utilizando filtros y consultas vectoriales. Resuelve el problema de encontrar información relevante en grandes volúmenes de datos de manera eficiente.
Características
- Indexación de documentos: Soporte para múltiples formatos como PDF, DOCX, XLSX, PPTX, TXT, e imágenes.
- Búsqueda avanzada: Filtros por nombre, extensión, tamaño, fechas y consultas vectoriales.
- Integración en la nube: Sincronización con Google Drive y OneDrive.
- Procesamiento de texto: Permite extracción de texto para múltiples formatos como PDF, DOCX, XLSX o PPTX.
- Interfaz intuitiva: Frontend moderno construido con Next.js.
- Base de datos híbrida: PostgreSQL para datos estructurados y Qdrant para búsquedas vectoriales.
Compatibilidad
- Frontend: Compatible con navegadores modernos (Chrome, Firefox, Edge).
- Backend: Requiere Python 3.11 y Docker.
- Bases de datos: PostgreSQL 16 y Qdrant.
Desafíos encontrados
La búsqueda y selección de un LLM para el cálculo del embedding supuso una solución de compromiso entre nuestra capacidad de cómputo local, la experiencia del usuario y las restricciones del paradigma Open Source.
Para el futuro ...
DocSeeker busca seguir creciendo y mejorar la experiencia de sus usuarios, para ello agregará soporte a diversas plataformas cloud y mejorará el procesamiento de archivos más complejos y comunes en la vida cotidiana.
Canales de soporte
- Correo electrónico: monterrosocernadasizan@gmail.com
- Issues en GitHub: https://github.com/x-nunez/hackudc/issues
- Documentación oficial: Consulta los archivos [CONTRIBUTING.md] (https://github.com/x-nunez/hackudc/blob/main/CONTRIBUTING.md) y [CODE_OF_CONDUCT.md] (https://github.com/x-nunez/hackudc/blob/main/CODE_OF_CONDUCT.md) para más detalles.
Built With
- docker
- fastaapi
- postgresql
- python
- qdrant
- react
Log in or sign up for Devpost to join the conversation.