Kimi K2.5: что умеет конкурент GPT-4 за $0.50 за миллион токенов

01.02.2026 · 5 мин

Moonshot AI выложили полный technical report на Kimi K2.5. Я прочитал 83 страницы, чтобы вам не пришлось. Цена вопроса — в 5 раз дешевле GPT-4o, но качество на уровне топовых моделей. Как они это делают?

Важно: Отчёт Moonshot датирован началом 2025 года. В статье я привожу данные из отчёта + актуальные цены на февраль 2026.

Kimi K2.5 — это LLM от китайской компании Moonshot AI. Они не гонятся за хайпом в твиттере, а публикуют детальные отчёты с архитектурными деталями. В отчёте — всё: от размера контекстного окна до методов тренировки.

Контекстное окно: 256K токенов

Для сравнения с актуальными моделями февраля 2026:

Kimi берёт целую книгу и не забывает начало, когда доходит до конца. Это критично для:

Context Window Comparison (токенов) — Февраль 2026
════════════════════════════════════════════════════════════

GPT-4o             ████████████████████████████████  128K
o3-mini            ██████████████████████████████████████  200K
Claude 3.5 Sonnet  ██████████████████████████████████████  200K
Kimi K2.5          ████████████████████████████████████████████████  256K
Gemini 2.0 Pro     ████████████████████████████████████████████████████  2M

Цена за 1M токенов (input) — Февраль 2026:
Kimi K2.5          $0.50   ██
GPT-4o             $2.50   ██████████
Claude 3.5         $3.00   ████████████████
o3-mini            $1.10   ████
o1                 $15.00  ████████████████████████████████████████████
Kimi даёт больше контекста, чем GPT-4o и Claude, за меньшие деньги. Gemini 2.0 Pro лидирует по контексту (2M), но дороже.

Архитектура: Mixture-of-Experts

Kimi использует MoE (Mixture-of-Experts — архитектура, где модель состоит из множества «экспертов», и для каждого токена активируется только часть из них).

Аналогия: вместо одного универсального хирурга — команда специалистов. При проблеме с сердцем вызываете кардиолога, при переломе — травматолога. Не платите всем остальным за простой.

Параметры модели:

Бенчмарки: где лидирует, где отстаёт

Отчёт Moonshot сравнивал с моделями начала 2025. Для актуальности я добавил данные по GPT-4o и o3-mini (февраль 2026).

Где Kimi лучше GPT-4o:

Где отстаёт:

MMLU Benchmark (знания и reasoning) — Февраль 2026
═══════════════════════════════════════════════════════════

o3-mini            86.5%  ████████████████████████████████████████
GPT-4o             88.7%  ██████████████████████████████████████████
Kimi K2.5          87.2%  ████████████████████████████████████████
Claude 3.5         88.5%  ██████████████████████████████████████████

HumanEval (код)
═══════════════════════════════════════════════════════════

o3-mini            92.0%  ████████████████████████████████████████████
GPT-4o             90.2%  ██████████████████████████████████████████
Kimi K2.5          88.4%  ███████████████████████████████████████
Claude 3.5         92.0%  ████████████████████████████████████████████

Цена-качество (MMLU per $):
═══════════════════════════════════════════════════════════
Kimi K2.5          174    ████████████████████████████████████████████
o3-mini            79     █████████████████████
GPT-4o             35     ██████████
Claude 3.5         30     ████████
Kimi в топ-3 по качеству, но лидер по цена-качеству в 5x отрыве от ближайшего конкурента.

Актуальное сравнение: февраль 2026 vs отчёт 2025

В отчёте Moonshot сравнение было с GPT-4 Turbo и Claude 3.5 (старые версии). Сейчас картина изменилась:

Модель Контекст Цена input MMLU
Kimi K2.5 256K $0.50 87.2%
GPT-4o 128K $2.50 88.7%
o3-mini 200K $1.10 86.5%
Claude 3.5 Sonnet 200K $3.00 88.5%
o1 200K $15.00 92.4%

Вывод: Kimi остаётся лидером по цена-качеству, но в абсолютном качестве GPT-4o, Claude 3.5 и o3-mini уже на уровень выше.

Честный взгляд на ограничения

Отчёт Moonshot — пример прозрачности. Они сами перечисляют слабые стороны:

  1. Hallucinations — модель фантазирует на специфических темах
  2. Safety — фильтры на китайском работают агрессивнее
  3. Math — сложная математика хуже, чем у o1/o3-mini
  4. Vision — нет мультимодальности (только текст)

Для кого Kimi K2.5 в 2026 году

Выгодно, если:

Не лучший выбор, если:

Математика: что купить на $100

На $100 вы получаете (февраль 2026):

Разница с o1 — 30x. С GPT-4o — 5x.

Выводы (февраль 2026)

Kimi K2.5 остаётся рабочей лошадкой с честными trade-offs. Через год после отчёта картина такая:

Плюсы:

Минусы:

Вердикт: Для high-volume задач с длинным контекстом — всё ещё оптимальный выбор. Для сложного reasoning — смотрите на o3-mini или o1.

Ссылки