Практические руководства: от локального запуска LLM до построения multi-agent систем. С кодом, схемами и сравнениями.
Claude Code vs Codex CLI vs Gemini CLI
Практическое сравнение трёх терминальных AI-агентов: скорость, качество кода, цена, фичи.
Стандарт интеграции AI-агентов
Как MCP стал стандартом. Архитектура, примеры серверов, создание своего.
CrewAI vs AutoGen vs MetaGPT
Три фреймворка: сравнение архитектуры, цены, сложности и реальных кейсов.
LM Studio vs Ollama vs Jan
Запуск агента полностью локально. Модели, железо, безопасность.
Безопасность, compliance, масштабирование
Внедрение AI-агентов в крупных компаниях: GDPR, аудит, on-premise.
Пошаговый туториал
От Python до работающего агента с инструментами. Полный код.
SWE-Bench, GAIA, WebArena
Как измеряют качество. Обзор бенчмарков, результаты, интерпретация.
RAG, ChromaDB, Pinecone
Три уровня памяти: реализация с ChromaDB, Pinecone, Mem0.
Цена, качество, приватность
Когда open-source выигрывает, а когда проще заплатить.
Реальные кейсы с ROI
Поддержка, документы, HR, маркетинг — с цифрами и инструментами.
Ollama + Open WebUI + GPU за 15 минут
Локальный запуск Llama 4, DeepSeek, Qwen и других моделей. Без облака, без API-ключей, полный контроль над данными.
Сравнение двух лидеров AI-разработки
Практическое сравнение: скорость автодополнения, понимание кодовой базы, работа с PR, цена.
От идеи до работающей команды агентов
Создайте команду из трёх AI-агентов: Researcher ищет данные, Analyst обрабатывает, Writer пишет статью.
Расширяем Claude инструментами через Model Context Protocol
Настройка MCP-сервера для файловой системы, браузера и GitHub. Claude получает доступ к инструментам через открытый протокол Anthropic.
Какие AI-инструменты реально нужны на старте
Практичный гайд: что купить, что запустить локально, а что не нужно вообще. Бюджетная сборка для команды 3-5 разработчиков.
CLAUDE.md, хуки, многофайловый рефакторинг
Продвинутые приёмы: CLAUDE.md для контекста проекта, хуки для автопроверок, multi-file рефакторинг.
Агент планирует поиск, переформулирует запросы и итерирует
Обычный RAG отвечает на один запрос. Agentic RAG планирует поиск, переформулирует запросы, проверяет результаты и итерирует. Хайп #1 в AI-твитере.
Метрики, бенчмарки и чек-лист
Что измерять: точность кода, скорость, стоимость на задачу, качество PR. Практическая система оценки.
3 типа памяти: рабочая, сессионная, долгосрочная
Разбор трёх типов памяти: Working (контекстное окно LLM), Short-term (сессия агента), Long-term (векторная БД с ChromaDB).
Python MCP-сервер с инструментами для БД и API
Хайповая тема в AI-твитере: все пишут MCP-серверы. Создайте свой сервер на Python с инструментами для базы данных. Работает с Claude Desktop, Cursor, Continue.
LangSmith: трассировка, отладка, мониторинг
Агенты недетерминированы — нужно видеть что они делают. @traceable для каждого шага агента.
Ollama + Continue + Aider — ноль подписок
Тренд в опенсорс-твитере: полностью локальный стек без подписок. Ollama локально, Continue вместо Cursor Pro, Aider вместо Claude Code.
Когда учить модель, а когда писать промпты
Сравнение двух подходов к адаптации LLM: дообучение на своих данных против цепочек промптов. С кодом на Unsloth и DSPy.
Prompt injection, sandboxing, аудит действий
Агенты с доступом к файловой системе и сети — вектор атаки. Защита: sandbox-контейнеры, валидация вывода, human-in-the-loop для опасных операций.
FastAPI + python-telegram-bot + Claude API
Деплой AI-агента в продакшен через Telegram. Пользователь пишет задачу → агент выполняет в Docker-песочнице → присылает результат.
Сравнение трёх фреймворков для AI-приложений
LangChain — универсальный конструктор, LlamaIndex — для RAG и поиска, CrewAI — для multi-agent систем. Что выбрать под задачу.
Continue + локальная модель для ревью PR
Настройка AI-ревьюера для GitHub PR. Бесплатно, локально, без отправки кода в облако. Интеграция с GitHub Actions.
Jupyter AI, Copilot для pandas, автодашборды
Как AI-агенты ускоряют работу с данными: генерация кода pandas/matplotlib, автокорреляция, дашборды одной командой.
Sandbox-контейнеры, валидация вывода, HITL
Агенты с доступом к файловой системе и сети — вектор атаки. Защита: Docker-песочницы, валидация вывода, human-in-the-loop для опасных операций. Практические примеры.
Деплой агента в продакшен через Telegram
Деплой AI-агента в продакшен через Telegram. Пользователь пишет задачу → агент выполняет в Docker-песочнице → присылает результат в чат. Полный код на Python.
Working → Short-term → Long-term память
Три уровня памяти: Working (контекстное окно), Short-term (Redis/Postgres), Long-term (ChromaDB + эмбеддинги). Практическая архитектура с кодом.
LangChain — универсальный конструктор, LlamaIndex — для RAG и поиска, CrewAI — для multi-agent систем. Матрица выбора по задаче.
Дообучение модели против цепочек промптов
Сравнение двух подходов к адаптации LLM: дообучение на своих данных против цепочек промптов. Практические примеры с Unsloth и DSPy.
CrewAI, AutoGen, LangGraph, Swarm, MetaGPT, ChatDev
Детальное сравнение 6 фреймворков для создания AI-агентов: архитектура, сложность, latency, экосистема. С примерами кода для каждого.
Точность кода, скорость, стоимость, качество PR
Что измерять: точность кода (pass@k), скорость ответа, стоимость на задачу, качество PR. Практическая система оценки с примерами.
Ollama, Continue, Aider, Open WebUI — без подписок
Локальный стек без подписок: Ollama для моделей, Continue вместо Cursor Pro, Aider вместо Claude Code. Полный контроль над данными.
Поиск с агентной логикой: план → поиск → проверка → итерация
Обычный RAG отвечает на один запрос. Agentic RAG планирует поиск, переформулирует запросы, проверяет результаты и итерирует. Полный туториал с LangGraph.
Python MCP-сервер с инструментами для базы данных
Создайте свой MCP-сервер на Python с инструментами для БД. Работает с Claude Desktop, Cursor, Continue. Полный код и деплой.
LangSmith, Arize Phoenix, OpenTelemetry для агентов
Агенты недетерминированы — нужно видеть что они делают. Трассировка каждого шага, метрики, алерты. Production-уровень observability.
Lambda, EC2, K8s, Modal, Fly.io — что выбрать
Сравнение 5 моделей деплоя для AI-агентов: холодный старт, масштабирование, стоимость. Практические рекомендации для каждого сценария.
StateGraph, узлы, рёбра, циклы и conditional edges
LangGraph — фреймворк от LangChain для создания агентов с контролем потока.
ConversableAgent, групповой чат, HITL и RAG
Microsoft AutoGen — фреймворк для создания разговаривающих агентов.
Signatures, Modules, Optimizers
DSPy от Stanford — фреймворк, заменяющий ручные промпты.
Embeddings, векторный поиск, реранкинг
Построим RAG-систему без LangChain и LlamaIndex.
PagedAttention, continuous batching
vLLM — самый быстрый способ развернуть LLM в продакшен.
Anthropic и OpenAI — кеширование промптов
Экономия до 90% на токенах через prompt caching.
OpenAI, Anthropic и Ollama
Function calling — ключевая технология для AI-агентов.
Сравнение трёх лидеров
Практическое сравнение трёх векторных БД для RAG.
GPT-4V, Claude Vision, LLaVA
Агенты, понимающие изображения. Claude Vision + Playwright.
pytest, метрики, CI/CD
Агенты недетерминированы — строим eval-фреймворк на pytest.
7 агентов, RAG, Groq, Stable Diffusion
Мультиагентная GenAI-платформа: клонирование, виртуальное окружение, API-ключи Groq и HuggingFace.
Следите за обновлениями — добавляем новые руководства еженедельно.
partners@qantcore.space