Glm-5.2 стал новым лидером среди open weights моделей

18.06.2026 · 5 мин

Когда открытые модели считались заметно слабее закрытых, их выбирали в основном из экономии или из-за требований к развёртыванию. Теперь это уже не выглядит компромиссом: GLM-5.2 от Z ai вышла в лидеры среди моделей с открытыми весами и показала, что разрыв с проприетарными системами в некоторых задачах почти исчез.

Что за модель и откуда взялась

GLM-5.2 построена на том же фундаменте, что и GLM-5.1: 744 миллиарда общих параметров, из которых 40 миллиардов активных при каждом запросе. Параметр active parameters важен, потому что показывает, сколько нейронных связей реально работает во время генерации ответа.

По данным Artificial Analysis, GLM-5.2 набрала 51 балл в Intelligence Index v4.1 и опередила MiniMax-M3, DeepSeek V4 Pro max и Kimi K2.6. Это заметный шаг вперёд по сравнению с предыдущей версией модели.

Результаты GLM-5.2 на ключевых задачах
─────────────────────────────────────────────────
CritPt    ████████░░░░░░░░░░░░   +16 пт → 21%
HLE       ████████████████░░     +12 пт → 40%
SciCode   ██████████████████     +7 пт → 50%
GPQA      ████████████████████   +3 пт → 89%
TerminalBench v2                  +16 пт → 78%
─────────────────────────────────────────────────
Сравнение с конкурентами:
MiniMax-M3      ────●───────────   Score: 44
DeepSeek V4 Pro ────●───────────   Score: 44
Kimi K2         ───────●─────────   Score: 43
GLM-5           ───────●─────────   Score: ~40 (prev)
GLM-5.2         ─────────────────● Score: 51 ✓ Лидер!
GLM-5.2 значительно опережает предшественника и конкурентов

Особенно заметен прогресс на задачах научного рассуждения: CritPt вырос до 21%, HLE — до 40%. Для coding и terminal control результаты тоже улучшились существенно.

Контекстное окно выросло в пять раз

Одна из самых практичных деталей — контекстное окно увеличилось с 200К токенов до 1 миллиона токенов. Это значит, что модель может видеть гораздо больше информации за один запрос: длинные документы, большие кодовые базы и сложные цепочки действий.

Миллион токенов — это примерно объём «Войны и мира». Для практики это особенно полезно в трёх сценариях: анализ крупных кодовых баз без разбиения на части, работа с длинными логами или документацией, а также агентные сценарии с длинным горизонтом планирования.

На GDPval-AA v2 GLM-5.2 набрала 1524 балла, опередив MiniMax-M3 и DeepSeek V4 Pro max, и оказалась почти на уровне GPT-o1-high reasoning mode. Это не означает равенство по всем метрикам, но показывает, что модель уже находится в одном диапазоне с сильнейшими закрытыми системами.

Стоимость использования

First-party API от Z ai предлагает такую цену за миллион токенов:

Тип токена Цена за миллион
Входной $1,40
Выходной $4,40
Cache hit $0,26

По соотношению интеллекта и стоимости модель находится на границе Парето среди решений своего класса. Доступность через сторонних провайдеров тоже есть, а лицензия MIT позволяет использовать модель коммерчески без ограничений.

Intelligence vs cost per task
───────────────────────────────────────
Интеллект ▲

        • GPT-o1-high
    •••••
        •
    ••••              ★ GLM-5.2
                        ~$0.
    •
────────┼────────────▶ Стоимость/задача $
        • DeepSeek V4 Pro
        •
        ● MiniMax-M3
        ● Kimi K2
───────────────────────────────────────
★ = Pareto frontier position for tier at ~51 score
GLM-5.2 находится на границе Парето для своего уровня интеллекта

Что это значит для разработчиков

На что обратить внимание перед выбором

Модель доступна на HuggingFace у THUDM, если вы хотите попробовать запуск локально или дообучение под свои задачи.

Выводы

Ссылки

Дмитрий Полухин — продуктовый дизайнер. Пишу про разработку, AI и дизайн интерфейсов. Обо мне, контакты и профили.