Glm-5.2 стал новым лидером среди open weights моделей

18.06.2026 · 5 мин

Когда открытые модели считались заметно слабее закрытых, их выбирали в основном из экономии или из-за требований к развёртыванию. Теперь это уже не выглядит компромиссом: GLM-5.2 от Z ai вышла в лидеры среди моделей с открытыми весами и показала, что разрыв с проприетарными системами в некоторых задачах почти исчез.

Что за модель и откуда взялась

GLM-5.2 построена на том же фундаменте, что и GLM-5.1: 744 миллиарда общих параметров, из которых 40 миллиардов активных при каждом запросе. Параметр active parameters важен, потому что показывает, сколько нейронных связей реально работает во время генерации ответа.

По данным Artificial Analysis, GLM-5.2 набрала 51 балл в Intelligence Index v4.1 и опередила MiniMax-M3, DeepSeek V4 Pro max и Kimi K2.6. Это заметный шаг вперёд по сравнению с предыдущей версией модели.

Результаты GLM-5.2 на ключевых задачах
─────────────────────────────────────────────────
CritPt    ████████░░░░░░░░░░░░   +16 пт → 21%
HLE       ████████████████░░     +12 пт → 40%
SciCode   ██████████████████     +7 пт → 50%
GPQA      ████████████████████   +3 пт → 89%
TerminalBench v2                  +16 пт → 78%
─────────────────────────────────────────────────
Сравнение с конкурентами:
MiniMax-M3      ────●───────────   Score: 44
DeepSeek V4 Pro ────●───────────   Score: 44
Kimi K2         ───────●─────────   Score: 43
GLM-5           ───────●─────────   Score: ~40 (prev)
GLM-5.2         ─────────────────● Score: 51 ✓ Лидер!

GLM-5.2 значительно опережает предшественника и конкурентов

Особенно заметен прогресс на задачах научного рассуждения: CritPt вырос до 21%, HLE — до 40%. Для coding и terminal control результаты тоже улучшились существенно.

Контекстное окно выросло в пять раз

Одна из самых практичных деталей — контекстное окно увеличилось с 200К токенов до 1 миллиона токенов. Это значит, что модель может видеть гораздо больше информации за один запрос: длинные документы, большие кодовые базы и сложные цепочки действий.

Миллион токенов — это примерно объём «Войны и мира». Для практики это особенно полезно в трёх сценариях: анализ крупных кодовых баз без разбиения на части, работа с длинными логами или документацией, а также агентные сценарии с длинным горизонтом планирования.

На GDPval-AA v2 GLM-5.2 набрала 1524 балла, опередив MiniMax-M3 и DeepSeek V4 Pro max, и оказалась почти на уровне GPT-o1-high reasoning mode. Это не означает равенство по всем метрикам, но показывает, что модель уже находится в одном диапазоне с сильнейшими закрытыми системами.

Стоимость использования

First-party API от Z ai предлагает такую цену за миллион токенов:

Тип токена	Цена за миллион
Входной	$1,40
Выходной	$4,40
Cache hit	$0,26

По соотношению интеллекта и стоимости модель находится на границе Парето среди решений своего класса. Доступность через сторонних провайдеров тоже есть, а лицензия MIT позволяет использовать модель коммерчески без ограничений.

Intelligence vs cost per task
───────────────────────────────────────
Интеллект ▲

        • GPT-o1-high
    •••••
        •
    ••••              ★ GLM-5.2
                        ~$0.
    •
────────┼────────────▶ Стоимость/задача $
        • DeepSeek V4 Pro
        •
        ● MiniMax-M3
        ● Kimi K2
───────────────────────────────────────
★ = Pareto frontier position for tier at ~51 score

GLM-5.2 находится на границе Парето для своего уровня интеллекта

Что это значит для разработчиков

Открытые модели догнали проприетарные по качеству в ряде прикладных сценариев, особенно в агентных и code-related задачах.
Контекстное окно в 1 миллион токенов упрощает архитектуру: меньше chunking, меньше ручной сборки контекста, проще работа с длинными данными.
MIT-лицензия снижает юридические риски и делает модель удобной для коммерческих продуктов.

На что обратить внимание перед выбором

Проверьте модель на своих данных, а не только на синтетических бенчмарках.
Оцените задержку через конкретного провайдера, если скорость критична.
Уточните поддержку vision и audio, если мультимодальность важна для вашего продукта.

Модель доступна на HuggingFace у THUDM, если вы хотите попробовать запуск локально или дообучение под свои задачи.

Выводы

GLM-5.2 стала сильным лидером среди open weights моделей.
1 миллион токенов контекста — это практическое преимущество для длинных задач.
MIT-лицензия и разумная цена делают модель особенно интересной для бизнеса.

Ссылки

GLM-5.2 is the new leading open weights model on Artificial Analysis — материал с рейтингом и бенчмарками
Z ai API — официальная информация о ценах и доступе к модели
GLM-5 на HuggingFace — страница модели для локального запуска и дообучения

Дмитрий Полухин — продуктовый дизайнер. Пишу про разработку, AI и дизайн интерфейсов. Обо мне, контакты и профили.

Что за модель и откуда взялась

Контекстное окно выросло в пять раз

Стоимость использования

Что это значит для разработчиков

На что обратить внимание перед выбором

Выводы

Ссылки

Что почитать дальше