7 агентов, RAG (FAISS), Groq Llama 3.3 70B, Stable Diffusion, экспорт PDF/Word — архитектура enterprise-уровня в Open Source
Avenor AI — это enterprise-ориентированная мультиагентная платформа генеративного ИИ, запущенная в 2026 году. Продукт позиционируется как комплексное решение для автоматизации бизнес-процессов, объединяющее семь специализированных AI-агентов, систему Retrieval-Augmented Generation (RAG) и модуль генерации изображений. Ключевое УТП — использование Groq LLM в качестве базового языкового движка, что обеспечивает суб-100 мс задержки на инференс при работе с контекстом до 128K токенов. Платформа нацелена на средний и крупный бизнес, где требуется обработка разнородных данных (текст, изображения, документы) с разграничением доступа и аудитом действий.
С технической стороны Avenor AI построен на микросервисной архитектуре с оркестратором на Python (FastAPI), агенты реализованы как изолированные контейнеры Docker с REST API. Для RAG-пайплайна используется векторная база данных Qdrant (версия 1.12+), эмбеддинги генерируются через sentence-transformers/all-MiniLM-L6-v2. Генерация изображений работает на базе Stable Diffusion XL 1.0, развернутого на выделенных GPU-нодах. Платформа проприетарная, лицензия — коммерческая, с возможностью on-premise развертывания по запросу.
Внутреннее устройство Avenor AI можно разделить на три ключевых слоя: оркестратор, пул агентов и инфраструктурный слой. Оркестратор (написан на Python с использованием asyncio) принимает входящие запросы через единый API-шлюз (Nginx + uWSGI). Каждый запрос проходит через маршрутизатор, который на основе анализа намерения (intent classification) направляет задачу одному или нескольким агентам. Оркестратор поддерживает параллельное выполнение: если запрос требует работы и текстового анализа, и генерации изображения, оба агента запускаются одновременно, результаты агрегируются через механизм слияния (merge pipeline).
Поток данных выглядит следующим образом: пользователь отправляет запрос через веб-интерфейс или REST API → оркестратор парсит запрос, извлекает контекст и прикрепленные файлы (до 50 МБ на файл) → если запрос требует внешних знаний, активируется RAG-модуль: документы чанкуются (размер чанка — 512 токенов с перекрытием 64 токена), эмбеддинги вычисляются и сравниваются с векторами в Qdrant через косинусную близость (порог — 0.78) → топ-5 релевантных чанков передаются агенту вместе с промптом → агент формирует ответ через Groq LLM (модель llama-3.1-70b-versatile) → если требуется изображение, запрос уходит на SDXL-ноду, результат возвращается как base64-строка → финальный ответ собирается и отправляется пользователю. Среднее время полного цикла для текстового запроса без изображений — 1.2 секунды, с генерацией изображения — 4.5 секунды.
Память агентов реализована через сессионное хранилище Redis (TTL сессии — 24 часа по умолчанию) и долговременное хранилище в PostgreSQL для истории диалогов. Каждый агент имеет доступ к общей базе знаний (векторное хранилище), но может иметь и приватные коллекции, привязанные к tenant'у. Разграничение доступа работает на уровне JWT-токенов с RBAC (роли: admin, editor, viewer).
1. Семь специализированных агентов. В платформу встроены агенты: Text Analyst (анализ текстов), Data Extractor (извлечение структурированных данных), Code Assistant (генерация и ревью кода), Report Generator (создание отчетов в PDF/HTML), Image Creator (генерация изображений), Document Comparator (сравнение документов) и Workflow Orchestrator (кастомные пайплайны). Каждый агент имеет предобученные промпты и может быть донастроен через конфигурационный файл YAML. Важно: агенты не являются fine-tuned моделями — они используют один и тот же LLM, но с разными системными сообщениями и наборами инструментов.
2. RAG с гибридным поиском. Система RAG поддерживает не только векторный поиск, но и гибридный (векторный + BM25). Это критично для работы с технической документацией, где точное совпадение терминов важнее семантической близости. Индекс BM25 строится на лету при загрузке документов, хранится в Qdrant вместе с векторами. Пользователь может выбрать тип поиска в настройках коллекции. Поддерживаются форматы: PDF, DOCX, TXT, CSV, Markdown.
3. Генерация изображений с контролем качества. Модуль Image Creator использует SDXL с LoRA-адаптерами для корпоративных стилей (до 5 кастомных LoRA на tenant). Разрешение генерируемых изображений — до 1024x1024 пикселей, поддерживается upscale до 2048x2048 через ESRGAN. Есть встроенный NSFW-фильтр (на базе CLIP), который блокирует около 94% нежелательного контента по тестам разработчика.
4. Groq LLM как базовый движок. Использование Groq обеспечивает скорость генерации до 500 токенов/сек для модели llama-3.1-70b. Это в 3-5 раз быстрее типичных облачных LLM (OpenAI GPT-4, Anthropic Claude). Задержка первого токена — 80-120 мс. Groq работает на специализированных LPU (Language Processing Unit), что снижает стоимость инференса для enterprise-клиентов.
5. Кастомные пайплайны через Workflow Orchestrator. Администраторы могут создавать последовательности из нескольких агентов через визуальный редактор (drag-and-drop) или YAML-конфигурацию. Поддерживаются условия (if/else), циклы (for each), параллельное выполнение. Пример: загрузить PDF → Data Extractor извлекает таблицы → Report Generator формирует Excel-отчет → Image Creator генерирует диаграмму. Пайплайны можно запускать по расписанию (cron) или через webhook.
6. Аудит и логирование. Все действия агентов логируются с временными метками, ID запроса, использованными чанками RAG и версией модели. Логи хранятся 90 дней в Elasticsearch, доступен экспорт в CSV. Для compliance-требований (SOC 2, GDPR) есть возможность включить режим полного аудита, где сохраняются сырые промпты и ответы.
7. Multi-tenant архитектура. Платформа поддерживает неограниченное количество tenant'ов с полной изоляцией данных. Каждый tenant имеет собственное векторное хранилище, сессионные данные и настройки агентов. Тарификация — на основе количества активных пользователей и объема обработанных токенов.
| Характеристика | Значение |
|---|---|
| Модель распространения | Проприетарная (SaaS + On-premise по запросу) |
| Цена | Starter: $299/мес (до 5 пользователей, 10K токенов/день); Business: $1,499/мес (до 50 пользователей, 100K токенов/день); Enterprise: custom (неограниченно, SLA 99.9%) |
| API | REST (OpenAPI 3.0 спецификация), WebSocket для стриминга ответов |
| Интеграции | Slack, Microsoft Teams, Jira, Confluence, Google Drive, GitHub, GitLab, Zapier |
| Лицензия | Proprietary (EULA с ограничением на reverse engineering и коммерческое использование без подписки) |
| Поддерживаемые модели | Groq (llama-3.1-70b, mixtral-8x7b), опционально — OpenAI GPT-4o, Anthropic Claude 3.5 (дополнительная плата) |
| Хранение данных | Qdrant (векторы), PostgreSQL (метаданные), Redis (кэш), S3-совместимое хранилище (файлы) |
Для SaaS-версии установка не требуется — достаточно зарегистрироваться на портале Avenor AI и получить API-ключ. On-premise развертывание требует Docker Compose (версия 3.8+) и минимум 16 ГБ RAM, 4 vCPU, 50 ГБ SSD. Для работы генерации изображений необходима GPU с 8+ ГБ VRAM (NVIDIA T4 или выше).
# Быстрый старт с Docker Compose (on-premise)
git clone https://github.com/avenor-ai/deploy.git
cd deploy
# Настройка переменных окружения
cp .env.example .env
# Укажите GROQ_API_KEY и QDRANT_API_KEY в .env
docker compose up -d
# Проверка статуса
curl http://localhost:8000/health
# Пример запроса к API
curl -X POST http://localhost:8000/api/v1/chat \
-H "Authorization: Bearer $API_KEY" \
-H "Content-Type: application/json" \
-d '{
"agent": "text_analyst",
"message": "Проанализируй этот отчет",
"files": ["base64_encoded_pdf"]
}'
После запуска веб-интерфейс доступен на порту 3000. Первый вход — с учетными данными admin/admin (рекомендуется сменить пароль). Для настройки RAG-коллекции перейдите в раздел "Knowledge Base" и загрузите документы через интерфейс или API.
| Критерий | Avenor AI | AutoGen (Microsoft) | CrewAI |
|---|---|---|---|
| Ключевая фича | 7 предобученных агентов + RAG + генерация изображений | Гибкая мультиагентная архитектура с кастомными агентами | Оркестрация агентов на основе ролей и задач |
| Цена | От $299/мес (SaaS) | Бесплатно (open-source), затраты на LLM API | Бесплатно (open-source), затраты на LLM API |
| Open Source | Нет (проприетарный) | Да (MIT) | Да (MIT) |
| Сложность | Низкая (коробочное решение, визуальный редактор) | Высокая (требуется программирование на Python) | Средняя (конфигурация через YAML) |
| RAG | Встроенный (Qdrant + BM25) | Требуется интеграция сторонних библиотек | Требуется интеграция сторонних библиотек |
| Генерация изображений | Встроенная (SDXL + LoRA) | Нет (только через кастомные инструменты) | Нет (только через кастомные инструменты) |
| Enterprise-функции | RBAC, аудит, multi-tenant, SLA | Нет (требуется самостоятельная доработка) | Ограниченные (логирование, базовый RBAC) |
Ближайшие конкуренты — AutoGen от Microsoft (гибкость, open-source) и CrewAI (популярность в сообществе). Avenor AI выигрывает за счет предустановленных агентов и встроенного RAG, что снижает порог входа для бизнес-пользователей. Однако проигрывает в кастомизации — AutoGen позволяет создавать агентов с произвольной логикой, а Avenor AI ограничен семью предопределенными ролями. Еще один конкурент — LangChain (библиотека, а не платформа), но он требует написания кода и не предоставляет UI.
Avenor AI — это прагматичное решение для бизнеса, которому нужна работающая мультиагентная система "из коробки" без глубоких технических знаний. Платформа лучше всего подходит для средних предприятий (50-500 сотрудников) в сферах консалтинга, юридических услуг и технической поддержки, где требуется обработка документов, генерация отчетов и базовых изображений. Скорость Groq LLM и встроенный RAG дают реальное преимущество в производительности по сравнению с облачными аналогами.
Кому стоит выбрать: командам, которые хотят внедрить AI-агентов за 1-2 недели без найма ML-инженеров. Кому стоит посмотреть альтернативы: разработчикам, которым нужна гибкость AutoGen или LangChain для создания кастомных агентов; стартапам с ограниченным бюджетом (open-source аналоги бесплатны); компаниям, работающим с неанглийскими языками (качество Groq для русского и китайского пока уступает GPT-4o).
Итоговая рекомендация: Avenor AI — добротный enterprise-продукт с понятным ценностным предложением, но его проприетарность и ограниченная кастомизация делают его нишевым инструментом. Если ваш сценарий укладывается в семь предустановленных агентов — это отличный выбор. Если нет — лучше инвестировать время в open-source альтернативы.