Почему apertus стоит вашего внимания
Зависимость от закрытых облачных моделей — это как аренда квартиры, где хозяин может в любой момент поднять цену или ограничить доступ. Модель может подорожать, API может стать недоступным, а данные — остаться у вендора. Для госструктур, банков и компаний с жёсткими требованиями к безопасности это особенно рискованно.
Что такое apertus
Швейцарская инициатива по искусственному интеллекту, в которую входят EPFL, ETH Zurich и CSCS, запустила Apertus — полностью открытую базовую модель. Здесь открыто не только название: доступны веса, код, данные, методы обучения и принципы выравнивания. Авторы сравнивают этот подход с открытым исходным кодом в программировании.
Apertus — это foundation model, то есть большая нейросеть, которую можно дообучать под перевод, классификацию текста, генерацию ответов и другие задачи. Главное отличие в том, что модель не привязана к закрытому API или облаку конкретного вендора.
Проект развивают три швейцарские организации:
- EPFL — Федеральная политехническая школа Лозанны
- ETH Zurich — Федеральная политехническая школа Цюриха
- CSCS — Швейцарский национальный суперкомпьютерный центр
Это не история про один релиз. Скорее, это инфраструктурная работа на годы вперёд.
Ключевые характеристики
Разберём по пунктам, что важно в Apertus.
Масштаб. Модель представлена в двух вариантах: 8 миллиардов и 70 миллиардов параметров. Первый вариант сопоставим по классу с Llama 3 8B, а 70B уже относится к серьёзным моделям, способным конкурировать с закрытыми решениями среднего уровня.
Многоязычность. Модель обучалась на более чем 1000 языках. Это не просто маркетинг: проект изначально проектировали под мультиязычные сценарии, включая официальные языки Швейцарии — немецкий, французский, итальянский и ретороманский.
Соответствие EU AI Act. Модель учитывает право на отказ от обучения, фильтрует персональные данные и стремится минимизировать запоминание обучающих данных. Для европейского рынка это критически важно.
Производительность. Заявлена конкурентоспособность с лучшими открытыми моделями аналогичного масштаба. Техническая статья принята на ACL 2026 — одной из ведущих конференций по NLP, что добавляет проекту доверия.
Apertus Mini. В июне 2025 года вышли 16 компактных моделей, демонстрирующих дистилляцию и квантизацию. Это полезно для сценариев, где полноценная модель на 8B параметров уже слишком тяжёлая.
Apertus for Ticino. Это донастроенная модель для машинного перевода, используемая внутри инициативы. Хороший признак того, что модель применяется на практике, а не существует только в репозитории.
APERTUS: архитектура открытости
───────────────────────────────
┌─────────────────┐
│ ДАННЫЕ │ ← Открытые, документированные
│ (1000+ языков)│
└────────┬────────┘
▼
┌─────────────────┐
│ КОД ОБУЧЕНИЯ │ ← Воспроизводимо
└────────┬────────┘
▼
┌─────────────────┐
│ ВЕСА МОДЕЛИ │ ← Open weights
│ (8B / 70B) │
└────────┬────────┘
▼
┌─────────────────┐
│ ВЫРАВНИВАНИЕ │ ← Открытые принципы
└────────┬────────┘
▼
┌─────────────────┐
│ EU AI ACT │ ← Соответствие
└─────────────────┘
Когда это полезно
Apertus имеет смысл рассматривать в нескольких сценариях.
Государственные и регулируемые организации. Когда данные нельзя отправлять в закрытое облако. Госорганы, здравоохранение и финансовый сектор — типичные примеры, где важны compliance-требования.
Компании с политикой суверенности данных. Если вам важно контролировать, где хранятся данные и кто имеет к ним доступ, локальное развёртывание решает эту задачу.
Исследователи и команды, которым важна воспроизводимость. Открытые данные и код позволяют проверить, как модель обучалась, и при необходимости повторить процесс с собственными изменениями.
Мультиязычные проекты. Поддержка 1000+ языков делает Apertus хорошей отправной точкой для продуктов, где стандартные англоязычные модели работают хуже.
Что стоит проверить перед внедрением
Открытость — это не синоним слов «бесплатно» и «без проблем». Перед внедрением стоит проверить несколько вещей.
Лицензирование. У модели может быть лицензия с ограничениями на коммерческое использование. Это нужно выяснить до интеграции.
Качество на ваших задачах. Бенчмарки выглядят убедительно, но они не гарантируют качество именно на вашем языке и в вашем домене. Тестируйте на репрезентативной выборке.
Инфраструктура. 70B параметров требуют сотен гигабайт памяти и серьёзных вычислительных ресурсов. 8B вариант реалистичнее, но тоже требует расчёта.
Стоимость владения. Локальное развёртывание не бесплатно: нужны железо, персонал, электричество и мониторинг. Иногда закрытая подписка оказывается выгоднее.
Долгосрочная поддержка. Важно понять, кто будет обновлять модель и выпускать новые версии. Академический проект даёт плюс к научной надёжности, но не всегда — к коммерческим гарантиям.
APERTUS VS ЗАКРЫТЫЕ API
───────────────────────
Apertus Закрытый API
──────── ─────────────
Контроль данных: Локально У вендора
Стоимость входа: Железо + люди Подписка
Прозрачность: Полная Закрытая
Сложность: Высокая Низкая
Гарантии: Академические Коммерческие
Языки: 1000+ Варьируется
▲ ▲
│ │
Нужен контроль Нужно быстро
и воспроизвод. запуститься
Выводы
Apertus — это практичный ответ на запрос суверенного AI. Модель не про хайп, а про контроль, воспроизводимость и возможность развернуть решение у себя.
Если вам важны прозрачность, локальное хранение данных и адаптация под свои задачи, Apertus стоит включить в шорт-лист. Если приоритет — быстрый запуск без инфраструктуры, закрытые API пока остаются проще.
Главное — не выбирать по моде. Проверьте модель на своих данных, посчитайте стоимость владения и только потом принимайте решение.
Ссылки
- Apertus.ai — официальный сайт проекта
- Swiss AI Initiative — инициатива, стоящая за проектом
- EPFL — Федеральная политехническая школа Лозанны
- ETH Zurich — Федеральная политехническая школа Цюриха
- CSCS — Швейцарский национальный суперкомпьютерный центр
- ACL 2026 — конференция, где опубликована техническая статья
Дмитрий Полухин — продуктовый дизайнер. Пишу про разработку, AI и дизайн интерфейсов. Обо мне, контакты и профили.