Контекст 1 m токенов в Claude — прорыв в работе с языковыми моделями

14.03.2026 · 5 мин

Знаете, что бесит больше всего в работе с языковыми моделями? Когда у тебя есть огромный документ на 200 страниц, ты загружаешь его целиком, а в ответ получаешь: «Извини, слишком много текста, обрежу-ка я его». И ты сидишь, разбиваешь файл на куски, потом пытаешься связать ответы воедино, как пазл.

Так вот — эта проблема уходит в прошлое.

Anthropic сделали то, что многие считали невозможным: выпустили контекст 1M токенов для своих флагманских моделей Opus 4.6 и Sonnet 4.6. И это теперь общедоступно (general availability).

Что вообще такое контекст 1 m?

Давайте поясню, потому что термин «контекст» часто сбивает с толку.

В языковых моделях «контекст» — это объём информации, который модель может «держать в голове» за один запрос. Представьте, что вы ведёте разговор: если вы упомянули что-то в начале беседы, собеседник это помнит к концу. Но есть предел — сколько всего можно сказать, пока память не переполнится.

Раньше типичный лимит был 8K или 32K токенов (единицы текста, на которые модель разбивает входной материал — примерно слова или части слов). Потом появились 100K, 200K. А теперь — 1 миллион токенов.

Сколько это в реальных цифрах? Примерно 500–2 миллиона слов, в зависимости от языка и формата текста. Это несколько сотен страниц. Целые книги.

РАЗМЕР КОНТЕКСТА Claude
══════════════════════
32K   ▓▓▓▓▓▓░░░░░░░░░░░░░░░░░░░░░  ~24,000 слов (несколько глав)
100K  ▓▓▓▓▓▓▓▓▓▓▓░░░░░░░░░░░░░░█████  ~75,000 слов (книга)
1M    ▓▓▓▓▓▓▓▓▓▓▓█████████████████████  ~750,000 слов (библиотека)

Сравнение контекстных окон: от нескольких глав до целой библиотеки

Почему это важно?

Вот вам реальный пример из моей практики (и думаю, многие разработчики меня поймут).

Когда я анализирую большой кодовый репозиторий (хранилище кода проекта) или пытаюсь понять чужую архитектуру, мне нужно видеть картину целиком. Не отдельные файлы — всю систему. Как она устроена, какие зависимости.

Раньше приходилось действовать вслепую: кидал модели кусок кода — она отвечала про этот кусок. Потом другой кусок — про другой. Связать воедино? Надейся на лучшее.

С 1M контекста можно загрузить весь репозиторий и спросить: «Как тут устроена аутентификация? Покажи все файлы». И модель ответит.

Что говорят те, кто уже попробовал?

Ранние пользователи (до официального релиза) делятся интересными кейсами:

Анализ юридических документов. Один пользователь загрузил 10 000 страниц судебных материалов и попросил найти все упоминания определённого термина. Раньше на такое требовались специализированные инструменты и много ручной работы.
Аудит безопасности. Другой — прогнал через модель целую кодовую базу и попросил найти потенциальные уязвимости.
Исследовательская работа. Третий загрузил сотни научных статей и попросил сделать краткий обзор.

Все эти задачи раньше требовали либо человеческого труда, либо очень сложных пайплайнов (последовательность действий/обработки данных). Теперь — один запрос.

Но есть нюанс

Буду честен: больше контекста — не всегда лучше. Это звучит парадоксально, но есть две проблемы.

Первая — скорость. Обработка миллиона токенов занимает время. Это не мгновенно.
Вторая — attention (механизм внимания). Грубо говоря, когда модель видит очень много текста, ей сложнее фокусироваться на самом важном. Может начать «терять нить». Инженеры Anthropic честно предупреждают об этом.

Но в целом — да, это прорыв.

Что это значит для индустрии?

Лично я вижу здесь несколько важных трендов.

Во-первых, инструменты для работы с документами станут намного мощнее. Вместо того чтобы строить сложные RAG-системы (Retrieval Augmented Generation — подход к работе с большими документами через поиск релевантных кусков), можно просто дать модели весь документ.
Во-вторых, анализ кода выйдет на новый уровень. Можно будет показать модели целое приложение и попросить найти баг или объяснить архитектуру.
В-третьих, «умные ассистенты» приблизятся к тому, чтобы понимать контекст на уровне живого человека.

Все эти тренды объединяет одно: мы приближаемся к новому способу взаимодействия с AI.

Вместо вывода

Контекст 1M — это не просто цифра. Это смена парадигмы. Мы переходим от «модель помнит кусочек» к «модель видит картину целиком».

Да, технология ещё не идеальна. Да, есть ограничения. Но направление — правильное.

Вопрос, который вы должны себе задать: а что вы можете сделать, если ваш AI-ассистент вдруг сможет прочитать всё, что вы ему даёте? Всю документацию проекта? Все логи? Все письма?

У меня есть одна идея. Но это уже тема для отдельного поста.

Ссылки

Anthropic: 1M Context for Opus 4.6 and Sonnet — официальный анонс от Anthropic

Дмитрий Полухин — продуктовый дизайнер. Пишу про разработку, AI и дизайн интерфейсов. Обо мне, контакты и профили.

Что вообще такое контекст 1 m?

Почему это важно?

Что говорят те, кто уже попробовал?

Но есть нюанс

Что это значит для индустрии?

Вместо вывода

Ссылки

Что почитать дальше