Пять минут про LLM что изменилось за полгода

19.05.2026 · 5 мин

За последние полгода в мире больших языковых моделей произошло больше, чем за предыдущие два года. Серьёзно: рынок успел несколько раз поменять лидера, а то, что раньше казалось экспериментом, стало повседневным инструментом.

Смена лидеров

Ноябрь 2025-го стал переломным моментом. Топ-моделью считалась Claude Sonnet 4.5 от Anthropic, выпущенная 29 сентября. Но за месяц лидерство сменилось четыре раза: GPT-5.1 от OpenAI → Gemini 3 от Google → GPT-5.1 Codex Max → и обратно к Claude Opus 4.5.

СМЕНА ЛИДЕРОВ В НОЯБРЕ 2025
═══════════════════════════

Sonnet 4.5 ──▶ GPT-5.1 ──▶ Gemini 3 ──▶ Codex Max ──▶ Opus 4.5
(сентябрь)    (ноябрь)    (ноябрь)     (ноябрь)      (декабрь)

Каждая стрелка = "теперь лучший"
Четыре смены лидера за месяц — беспрецедентная гонка

Но настоящая новость была не в бенчмарках.

OpenAI и Anthropic весь 2025 год занимались reinforcement learning from verifiable rewards — методом обучения, при котором модель получает награду за правильные решения и улучшается через практику. К ноябрю результат стал очевиден: coding agents перешли из разряда «иногда работает» в «можно использовать каждый день».

Это значит: вместо того чтобы чинить ошибки агента половину рабочего времени, вы теперь просто ставите задачу и получаете результат.

Агентный коддинг и локальные эксперименты

Декабрь и январь я провёл в своеобразном LLM-психозе: проверял возможности новых моделей на амбициозных проектах. Один из них — micro-javascript, реализация JavaScript на Python через Pyodide, запущенный в WebAssembly, который работает внутри JavaScript внутри браузера.

Круто? Круто. Нужно было кому-то? Нет.

Февраль принёс главную историю полугодия — OpenClaw. В ноябре это был безызвестный репозиторий Warelay одного парня по имени Pete. К февралю под именем OpenClaw он стал личным AI-ассистентом нового типа — их теперь называют Claws.

Вокруг San Francisco Mac Mini стали исчезать с полок: народ покупал их для запуска своих Claws локально. Drew Breunig пошутил, что это новые цифровые питомцы, а Mac Mini — идеальный аквариум для вашего Claw.

Мой любимый метафор для Claws — Doc Ock из «Человека-паука» 2004 года: механические щупальца безопасны, пока цел чип-ингибитор…, но если повредить — они захватывают управление.

Открытые веса и новый баланс сил

Апрель оказался богат на open weight models — модели с открытыми весами можно скачать и запустить у себя.

OPEN WEIGHT МОДЕЛИ АПРЕЛЯ 2026
═════════════════════════════

GLM-5.1        │ THUDM/GLM-5.1       │ ~1.5TB     │ Монстр,
               │                     │             │ если хватит GPU

Qwen3          │ Qwen/Qwen3          │ ~20GB       │ Запускается
               │                     │             │ на ноутбуке!

Gemma 4        │ google/gemma        │ открытые    │ Лучшее от US-
               │                     │ веса Google │ компании до сих пор
Qwen3 размером с игрушечную модельку потянул мой ноутбук

Qwen3 размером всего 20 гигабайт выдала мне рисунок пеликана лучше, чем Claude Opus 4.7 стоимостью $200 в месяц на API.

Выводы

Первое: coding agents доросли до уровня «можно работать каждый день». Это уже не эксперимент, а индустриальный стандарт.

Второе: open weight модели стали дико мощными для своей цены и размера. Frontier-модели всё ещё впереди по ряду задач, но разрыв сокращается стремительно.

Если вы ещё не попробовали агентный коддинг или не экспериментировали с локальными моделями, сейчас самое время начать.

Ссылки

Дмитрий Полухин — продуктовый дизайнер. Пишу про разработку, AI и дизайн интерфейсов. Обо мне, контакты и профили.