Пять минут про LLM что изменилось за полгода
За последние полгода в мире больших языковых моделей произошло больше, чем за предыдущие два года. Серьёзно: рынок успел несколько раз поменять лидера, а то, что раньше казалось экспериментом, стало повседневным инструментом.
Смена лидеров
Ноябрь 2025-го стал переломным моментом. Топ-моделью считалась Claude Sonnet 4.5 от Anthropic, выпущенная 29 сентября. Но за месяц лидерство сменилось четыре раза: GPT-5.1 от OpenAI → Gemini 3 от Google → GPT-5.1 Codex Max → и обратно к Claude Opus 4.5.
СМЕНА ЛИДЕРОВ В НОЯБРЕ 2025 ═══════════════════════════ Sonnet 4.5 ──▶ GPT-5.1 ──▶ Gemini 3 ──▶ Codex Max ──▶ Opus 4.5 (сентябрь) (ноябрь) (ноябрь) (ноябрь) (декабрь) Каждая стрелка = "теперь лучший"
Но настоящая новость была не в бенчмарках.
OpenAI и Anthropic весь 2025 год занимались reinforcement learning from verifiable rewards — методом обучения, при котором модель получает награду за правильные решения и улучшается через практику. К ноябрю результат стал очевиден: coding agents перешли из разряда «иногда работает» в «можно использовать каждый день».
Это значит: вместо того чтобы чинить ошибки агента половину рабочего времени, вы теперь просто ставите задачу и получаете результат.
Агентный коддинг и локальные эксперименты
Декабрь и январь я провёл в своеобразном LLM-психозе: проверял возможности новых моделей на амбициозных проектах. Один из них — micro-javascript, реализация JavaScript на Python через Pyodide, запущенный в WebAssembly, который работает внутри JavaScript внутри браузера.
Круто? Круто. Нужно было кому-то? Нет.
Февраль принёс главную историю полугодия — OpenClaw. В ноябре это был безызвестный репозиторий Warelay одного парня по имени Pete. К февралю под именем OpenClaw он стал личным AI-ассистентом нового типа — их теперь называют Claws.
Вокруг San Francisco Mac Mini стали исчезать с полок: народ покупал их для запуска своих Claws локально. Drew Breunig пошутил, что это новые цифровые питомцы, а Mac Mini — идеальный аквариум для вашего Claw.
Мой любимый метафор для Claws — Doc Ock из «Человека-паука» 2004 года: механические щупальца безопасны, пока цел чип-ингибитор…, но если повредить — они захватывают управление.
Открытые веса и новый баланс сил
Апрель оказался богат на open weight models — модели с открытыми весами можно скачать и запустить у себя.
OPEN WEIGHT МОДЕЛИ АПРЕЛЯ 2026
═════════════════════════════
GLM-5.1 │ THUDM/GLM-5.1 │ ~1.5TB │ Монстр,
│ │ │ если хватит GPU
Qwen3 │ Qwen/Qwen3 │ ~20GB │ Запускается
│ │ │ на ноутбуке!
Gemma 4 │ google/gemma │ открытые │ Лучшее от US-
│ │ веса Google │ компании до сих пор
Qwen3 размером всего 20 гигабайт выдала мне рисунок пеликана лучше, чем Claude Opus 4.7 стоимостью $200 в месяц на API.
Выводы
Первое: coding agents доросли до уровня «можно работать каждый день». Это уже не эксперимент, а индустриальный стандарт.
Второе: open weight модели стали дико мощными для своей цены и размера. Frontier-модели всё ещё впереди по ряду задач, но разрыв сокращается стремительно.
Если вы ещё не попробовали агентный коддинг или не экспериментировали с локальными моделями, сейчас самое время начать.
Ссылки
- The last six months in LLMs in five minutes — исходная статья
Дмитрий Полухин — продуктовый дизайнер. Пишу про разработку, AI и дизайн интерфейсов. Обо мне, контакты и профили.