Перейти к основному содержимому

DocAI

DocAI - это система для обработки документов с использованием OCR и ИИ-классификации. Система позволяет автоматически распознавать текст из PDF-документов, классифицировать их по типам и извлекать структурированные данные.

Возможности

  • OCR обработка - распознавание текста из PDF-документов
  • ИИ классификация - автоматическое определение типа документа (Invoice, Contract и т.д.)
  • Извлечение данных - структурированное извлечение полей из документов
  • REST API - полноценный API для интеграции
  • Асинхронная обработка - фоновая обработка через Celery

Архитектура

Технологии

КомпонентТехнология
BackendDjango 5.1, Django REST Framework
FrontendNext.js 15, React 19
База данныхPostgreSQL
Очередь задачCelery + Redis
ИИ АгентыDify, n8n
АутентификацияJWT (SimpleJWT + NextAuth)

Быстрый старт

# Клонировать репозиторий
git clone <repository-url>
cd docai

# Настроить окружение
cp .env.backend.template .env.backend
cp .env.frontend.template .env.frontend

# Запустить через Docker
docker compose up

После запуска: