Что это?

Documents Analyzer - это технология кластеризации документов

Решаемая проблема

Быстрый поиск нужных документов

Зачем это нужно?

У крупных компаний часто возникает проблема найти нужные документы. Наша система позволяет сканировать все данные и сортировать по автоматически найденным критериям. Это позволяет пользователю быстро находить нужные документы.

Кому это нужно?

Крупным компаниям, организациям с крупным документооборотом.

Как это работает?

Вы загружаете документы в систему. Система их анализирует, обрабатывает и выдаёт вам граф зависимостей документов. При помощи этого графа пользователь быстро может найти нужный ему документ.

Как мы делаем это?

Наша система состоит из 3 подсистем:

  • Cистема управления на Node.JS - это UI и веб-сервер
  • Система сканирования документов написана на C# и отвечает за извлечение из документов всех полей и определёных данных
  • Система анализа данных на Python, отвечает за кластеризацию информации и построение графа
  • С UI и веб-сервером взаимодействует пользователь и через это систему задаёт документы на анализ. Подсистема графического интерфейса передаёт команду системе сканирования документов. Затем система сканирования передаёт все данные системе анализа данных. Система анализа генерирует граф зависимости на библиотеке D3.js и передаёт обратно в систему взаиводействия с пользователем.

    Особенности технологии

  • Многопоточность
  • Кросс-платформенность
  • Клиент-серверность
  • Высокая отказоустойчивость
  • Масштабируемость (модуль сканирования документов имеет возможность интеграции собственой системой авто развёртываемых кластеров)
  • Архитектура

  • UI / Веб-сервер - Node.JS
  • Сканирование документов - C# + Mono
  • Анализ данных - Python
  • Визуализация данных - D3.js
  • API

  • API UI - позволяет управлять выполнением операций анализа данных
  • API платформы сканирования - позволяет управлять сканированием документов
  • Share this project:

    Updates