DataDolphin V2

Plataforma
Motor
Dominios
Métrica
Empresas
Dashboard
Procesos con IA
API
API

Inspiración

El verdadero reto no es recolectar datos, sino entenderlos. El propósito de DataDolphin V2 es realizar una ingeniería inversa de documentos para entender su estructura profunda, desde registros fiscales hasta normativas internacionales.

¿Qué hace?

DataDolphin V2 es una plataforma avanzada de orquestación y clasificación semántica que utiliza IA multimodal para automatizar trámites de nivel gubernamental y privado.

El sistema identifica campos faltantes y automatiza el llenado de procesos administrativos, clasificando variables a través de 5 vectores operativos principales:

Fiscal: Manejo de códigos fiscales y libros contables.
Gubernamental: Control de variables reguladas.
Corporativo: Gestión de variables contractuales.
Académico: Organización de datos de investigación.
Internacional: Procesamiento de datos transfronterizos.

¿Cómo lo construimos?

La arquitectura de DataDolphin V2 se divide en tres capas técnicas fundamentales para garantizar el rendimiento y la precisión del agente:

Capa de Presentación (Frontend)

Interfaz desarrollada para la gestión y visualización de datos de alta densidad:

Next.js: Framework de React para el manejo de rutas y renderizado optimizado.
TypeScript: Implementación de tipado estricto para asegurar la escalabilidad del código.
Tailwind CSS: Framework de diseño utilizado para la creación de componentes modulares y la matriz de taxonomía.

Capa de Inteligencia y Orquestación

Núcleo operativo basado en agentes autónomos supervisados:

Lógica basada en habilidades: Comportamiento del agente definido mediante una matriz de competencias en SKILL.md y configuraciones dinámicas en agent.yaml.

Capa de Procesamiento de Documentos

Módulo especializado en la extracción y análisis estructural de archivos:

Python: Lenguaje principal para el procesamiento lógico y manejo de metadatos.
PyMuPDF: Librería técnica utilizada para realizar ingeniería inversa en documentos, permitiendo la extracción precisa de coordenadas y contenido en archivos de múltiples páginas.

Requerimientos de Visión y Extracción (Percepción)

El agente no solo debe "leer", debe "ver" la estructura.

Detección de Geometrías (Bounding Boxes): La lógica debe identificar líneas continuas (____), rectángulos de formulario y espacios en blanco masivos.

Built With

claude
figma
gemini
git
github
next.js
openrouteservice
postgresql
python
react
tailwind-css
typescript
vercel

Submitted to

Hackathon Troyano 2026

Created by

Dirección de equipo, estructura de proyecto y contribución en la planeación de 3 capas técnicas para la recolección de lógica e interfaz de usuario con integración de Inteligencia Artificial y OpenRouter

Christian Alexis Serrato Guerrero
La Organización es la clave para Aprender.
JUAN PABLO MARTINEZ CASILLAS
Osva0421
Mario Sebastián Arizpe Beltrán
Diego Hernandez de Anda
Efficiency, collaborative work, achieving objectives, that's my way of working, making any goal that is set before me a reality.

Updates

JUAN PABLO MARTINEZ CASILLAS started this project — Apr 18, 2026 04:25 PM EDT

Leave feedback in the comments!

Log in or sign up for Devpost to join the conversation.