When AI Builds Itself: Our progress toward recursive self-improvement
Когда ИИ начинает создавать себя
Помните тот момент, когда вы впервые показали новичку горячие клавиши в IDE (Integrated Development Environment — программа где программисты пишут код), и он вдруг начал работать в три раза быстрее? Представьте, что ИИ учит самого себя — и темп этого обучения ускоряется каждые несколько месяцев.
Anthropic опубликовали отчёт, который заставляет задуматься. Компания показывает данные: инженеры теперь отправляют в восемь раз больше кода за квартал, чем в 2024 году. Всё потому, что ИИ пишет этот код, а человек выступает редактором и постановщиком задач.
Звучит как прорыв. Но давайте разберёмся, что реально происходит и где проходит граница между ускорением разработки и полностью автономным самоулучшением.
Что такое рекурсивное самоулучшение
Рекурсивное самоулучшение — это когда система ИИ способна проектировать и разрабатывать собственную следующую версию. Не человек даёт задание, а модель сама решает, как стать лучше, и делает это.
Это не фантастика про сверхразум. Это постепенный процесс: ИИ уже помогает писать код, тестировать идеи, оптимизировать архитектуру. Вопрос в том, когда он сможет делать это полностью сам.
Anthropic рисуют такую картину прогресса:
РАЗВИТИЕ АВТОНОМНОСТИ В РАЗРАБОТКЕ ИИ ─────────────────────────────────────── 2021-2023 ░░░░░░░░░░░░░░░░░░░░░░░░░░░ Люди пишут код вручную 2023-2025 ░░░░░░░░░░░░░░░░░░░░░░░░░░░ Чат-боты генерируют сниппеты (небольшие готовые куски кода) 2025-2026 ░░░░░░░░░░░░░░░░░░░░░░░░░░░ Агенты (программы на основе ИИ, которые могут выполнять задачи почти самостоятельно) пишут целые файлы 2026 ░░░░░░░░░░░░░░░░░░░░░░░░░░░ Агенты запускают код сами 20XX? ░░░░░░░░░░░░░░░░░░░░░░░░░░░ Агенты строят модели Уровень автономности ──────────────────▶
Каждый этап сдвигает баланс: человек всё меньше «делает» и всё больше «направляет».
Что уже умеет делать ИИ в Anthropic
Цифры впечатляют. К маю 2026 года больше 80% кода в репозитории (место где хранится код проекта — как папка с файлами проекта) Anthropic написано Клодом. Ещё в начале 2025 года эта доля была в однозначных числах.
Рост продуктивности виден невооружённым глазом:
СТРОКИ КОДА НА ИНЖЕНЕРА В ДЕНЬ (индекс, 2024=1) ───────────────────────────────────────────────── 2024 Q1 ████ 1x ───────────────────────────────── 2025 Q1 ████████ 2x ──────────────── 2025 Q3 ████████████ 4x ──────────── 2026 Q1 ████████████████████████ 8x ────── Время ─────────────────────────────────────────▶
Внутренний опрос показал: инженеры оценивают свой выхлоп вчетверо выше, чем без доступа к ИИ-моделям. Один из сотрудников рассказал, что пять месяцев не писал код собственноручно — только направлял агентов.
Отдельно впечатляет история про 800 исправлений за один месяц. Клод нашёл и пофиксил баги, которые сократили ошибки API (способ как одна программа общается с другой) в тысячу раз. Один инженер оценил, что человеку понадобилось бы четыре года на такую работу.
Где ИИ всё ещё буксует
Но вот что важно: это не полностью автономный процесс. Anthropic честно описывают разрыв.
Модель отлично справляется с исполнением задачи: написать код по спецификации, провести эксперимент по плану, исправить баг по описанию. Но когда нужно выбрать цель — решить, какую проблему решать следующей, какую гипотезу проверить — здесь человеку пока нет замены.
Аналогия из жизни: джуниор фиксит баги по тикетам. Мидл сам проектирует решение. Синьор решает, над чем стоит вообще работать. Современные ИИ-агенты — это очень способные джуниоры. До уровня, когда агент сам ставит себе задачи, ещё далеко.
На бенчмарках (тест для измерения возможностей модели) это тоже видно. SWE-bench (тест на исправление багов в реальных проектах с открытым кодом) модели уже насыщают — достигают почти 100% точности. CORE-Bench (воспроизведение научных статей) тоже почти забит. Но это задачи с чёткой формулировкой. Открытые исследовательские вопросы — совсем другое дело.
Почему это важно для безопасности
Вот где тема становится серьёзной. Если системы смогут полностью улучшать себя сами, то:
- Методы контроля и мониторинга должны быть намного надёжнее
- Способы влияния на поведение модели выходят на первый план
- Потеря контроля становится реальным сценарием
Anthropic не говорят «это случится завтра». Они говорят: тренд указывает в эту сторону, и институты должны быть готовы. Темпы улучшения ускоряются — задачи, которые занимают у человека часы, модели решают уже сейчас. Через год-два это могут быть задачи на дни и недели.
Компания подчёркивает: рекурсивное самоулучшение не неизбежно. Но оно может наступить быстрее, чем многие ожидают.
Что это значит для будущего
Если тренд сохранится, ИИ-системы будут способны на всё более длительные задачи. Это открывает возможности для науки, медицины, инженерии — везде, где нужна кропотливая работа над сложными проблемами.
Но это же означает, что вопросы безопасности ИИ переходят из теоретической плоскости в практическую. Не «что если», а «когда».
Anthropic позиционируют себя как компанию, которая не просто развивает технологию, но и серьёзно думает о рисках. Отчёт написан в такой манере: вот что мы видим, вот где границы, вот почему это важно.
Для рынка это сигнал: ускорение разработки ИИ уже происходит. Компании, которые не встраивают безопасность в процесс сейчас, рискуют оказаться в ситуации, когда контроль над системой становится критической проблемой.
Ссылки
- When AI Builds Itself — Anthropic
- SWE-bench — бенчмарк для тестирования способности моделей исправлять баги в реальных проектах
- CORE-Bench — бенчмарк для воспроизведения научных результатов
- METR — организация которая проверяет на что способны ИИ-модели
Дмитрий Полухин — продуктовый дизайнер. Пишу про разработку, AI и дизайн интерфейсов. Обо мне, контакты и профили.