Внутренний сервис KAISA

Интеллектуальная обработкадокументов с ИИ-агентами

DocAI распознаёт, классифицирует документы и извлекает из них структурированные данные. Превращаем ручной ввод в автоматический процесс для ваших информационных систем.

OCR
Распознавание текста
ИИ
Классификация
API
Интеграция

Ручной ввод данных из документов — это медленно и дорого

Операторы тратят часы на перенос информации из счетов-фактур, договоров и других документов в учётные системы. DocAI делает это автоматически.

Без DocAI
  • Ручной ввод каждого поля документа
  • Ошибки при переносе данных
  • Длительная обработка каждого документа
  • Высокая нагрузка на персонал
С DocAI
  • Автоматическое извлечение всех полей
  • ИИ-классификация типа документа
  • Обработка за секунды через API
  • Структурированные данные для систем

Три этапа интеллектуальной обработки

Каждый документ проходит через конвейер ИИ-агентов, которые работают последовательно

Этап 1

Распознавание текста

OCR-сервис преобразует отсканированные документы и PDF в машиночитаемый текст с сохранением структуры.

  • PDF, JPEG, PNG, TIFF
  • Распознавание таблиц
  • Мультиязычность
Этап 2

ИИ-классификация

ИИ-агент анализирует содержимое и автоматически определяет тип документа для корректного извлечения данных.

  • Счета-фактуры, договоры
  • Настраиваемые типы
  • Dify / n8n агенты
Этап 3

Извлечение данных

Специализированный ИИ-агент извлекает структурированные поля согласно схеме типа документа.

  • Даты, суммы, реквизиты
  • Табличные данные
  • JSON-формат

Как это работает

От загрузки документа до получения структурированных данных

Загрузка

Документ отправляется через веб-интерфейс или API

Обработка

Celery-воркеры запускают конвейер обработки

ИИ-агенты

Dify/n8n классифицирует и извлекает данные

Результат

Структурированные данные готовы к использованию

REST API для интеграции

Подключите DocAI к вашим информационным системам через простой REST API. Отправляйте документы и получайте структурированные данные в JSON.

  • JWT-аутентификация
  • Асинхронная обработка с polling
  • OpenAPI (Swagger) документация
  • Пакетная загрузка документов
Открыть API документацию
API Request
# Upload document
curl -X POST /documents/api/v1/request/ \
  -F "files_list=@invoice.pdf"

# Response
{
  "request_id": "ceaf3ee3-3bdd-..."
}

# Get result
GET /documents/api/v1/request/{id}/

{
  "status": "COMPLETED",
  "tasks": [{
    "document_type": {"name": "Invoice"},
    "ocr_result": {
      "items": [{
        "invoice_number": "12345",
        "date": "2024-01-15",
        "amount": 1500.00
      }]
    }
  }]
}

Технологии

Современный стек для надёжной работы

Django REST
Next.js
PostgreSQL
Celery
Redis
Dify AI
n8n

Готовы автоматизировать обработку документов?

Начните использовать DocAI для извлечения данных из ваших документов