Создание поста: AI coding дома без разорения
Начинаю работу над постом. У меня есть статья и согласованный план — буду идти по шагам и собирать рабочий, недорогой стек для AI coding дома.
Три способа кодить с AI дома и не продать почку
Знаете, что общего между энтузиастом AI coding и геймером, который собрал топовый ПК? Оба быстро понимают, что железо — это ещё только начало расходов.
Недавно наткнулся на разбор от Стивена Бочински (Stephen Bochinski), где он разложил по полочкам три стратегии домашнего AI coding. И там есть мысль, которая переворачивает взгляд на экономику: всё упирается в то, насколько вы доверяете рынку железа и моделей через год.
Почему AI coding дома быстро дорожает
Когда я впервые попробовал AI-помощника для кода, всё казалось просто: платишь $20 в месяц — и вперёд. Потом начинаются длинные контексты, автодополнения, эксперименты с разными моделями для разных задач — и месячный чек легко улетает в $200-400.
Особенно если у вас включены дорогие модели вроде GPT-4o или Claude Opus.
- Длинные контексты — чем больше «видит» модель, тем дороже каждый запрос
- Частые автодополнения — IDE дёргает модель каждые несколько секунд
- Эксперименты с несколькими моделями — пробуете разные варианты и каждая что-то «съедает»
- Мощные модели на рутину — используете топовую модель там, где хватило бы дешёвой
Где обычно утекают деньги
Стивен выделяет три основных подхода к домашнему AI coding, и у каждого свои грабли.
Вариант 1: своё железо
Покупаете мощную GPU, ставите открытые модели вроде Llama или Mistral локально и платите только за электричество.
Плюсы: после покупки — бесплатно почти навсегда, модель работает на вашей машине, никаких ограничений.
Минусы:
- Начальные вложения — от $2000-4000 за нормальную видеокарту
- Модели, которые реально работают на домашнем железе, слабее OpenAI или Anthropic
- Железо, купленное сегодня, через год может выглядеть как переплата
Это работает, только если машина загружена почти постоянно. Для большинства людей домашний сервер будет простаивать большую часть времени.
Вариант 2: аренда через API
Берёте те же открытые модели, но арендуете их у провайдера и платите за токены — кусочки текста, из которых состоит запрос и ответ.
Самый популярный агрегатор — OpenRouter. Там десятки моделей, а цены начинаются примерно от $0.1 за миллион токенов и доходят до более дорогих вариантов.
Плюсы:
- Никаких upfront-затрат
- Можно переключаться между моделями за минуту
- Следующий месяц можно взять модель дешевле или лучше без перепродажи железа
Минусы:
- Вы всё равно зависите от провайдера
- Нужно думать об оптимизации промптов
РАБОЧИЙ СТЭК AI CODING
────────────────────────
┌─────────────────────────────────────────────┐
│ ФРОНТЬЕР ПОДПИСКИ │
│ (Claude, GPT для «думания») │
│ Hard problems: архитектура, спек, ревью │
└──────────────────────┬──────────────────────┘
│
▼
┌─────────────────────────────────────────────┐
│ OPEN SOURCE API │
│ (Llama, Mistral — через OpenRouter) │
│ Механика: форматирование, рутина, тесты │
└─────────────────────────────────────────────┘
Вариант 3: frontier подписки
OpenAI и Anthropic продают подписки на $20-200 в месяц, в которые входит определённый объём использования.
Стивен приводит интересную математику: за примерно $400 в месяц подписок можно получить эквивалент около $2800 по API-тарифам. Но есть нюанс — подписки имеют лимиты. Серьёзный AI-native рабочий процесс быстро упирается в потолок.
Подписки хороши для ручной работы, но плохо масштабируются на автономных агентов.
Базовый недорогой стек
Стивен рекомендует комбинированный подход:
Дорогие модели — только для сложного мышления: архитектурные решения, спецификации, код-ревью. Дешёвые открытые модели — для механической работы: форматирование кода, базовые тесты, автодополнения.
СПЕК ДЕЛЕГИРОВАНИЯ ЗАДАЧ
──────────────────────────
СТОИМОСТЬ
▲
│ ████ Сложная архитектура
│ ██████
│ ████████ ───────────────────────────────
│ ██████████████ Спеки, ревью
│█████████████████████
│███████████████████████████
│██████████████████████████████████
│███████████████████████████████████████ ──► ЛОКАЛЬНО
└──────────────────────────────────────────► ВРЕМЯ/ЗАДАЧИ
Простое Сложное
Как ограничить расходы
Несколько практических приёмов, которые помогают держать бюджет под контролем:
- Лимиты на токены. Ставьте ограничения на максимальный контекст.
- Шаблоны промптов. Один и тот же запрос экономит время и токены.
- Журнал расходов. Раз в неделю смотрите, куда уходят деньги.
- Кэширование. Если запрос уже был, повторное использование стоит копейки.
Когда платить за облако, а когда нет
Простой принцип — spec-driven development: дорогие модели пишут план, дешёвые модели реализуют его по кусочкам.
Это как если бы старший разработчик нарисовал архитектуру, а код писали бы младшие инженеры по чётким задачам. Только в роли «джунов» выступают модели за $0.2 за миллион токенов.
Итоговый рабочий набор
При правильном подходе можно получить производительность команды из 20 инженеров за примерно $1000 в месяц.
- Дорогие подписки на сложные задачи: около $200-400 в месяц
- API для рутины: около $300-500 в месяц
- Итого: до $1000
Что делать на практике:
- Берёте подписку на Claude или GPT для архитектурных задач и код-ревью
- Регистрируетесь на OpenRouter для дешёвой механики
- Настраиваете IDE так, чтобы автодополнения шли через дешёвую модель
- Пишете шаблоны промптов для повторяющихся задач
- Мониторите расходы раз в неделю
Выводы
Во-первых, универсального решения нет: кому-то выгоднее железо, кому-то — подписка.
Во-вторых, разделение труда между моделями — не роскошь, а необходимость.
В-третьих, $1000 в месяц — это не мало, но и не много, если сравнить с зарплатой хотя бы одного инженера.
Главное — не впадать в крайности: не экономить на всём подряд и не лить деньги в топку бездумно.
Ссылки
- AI Coding at Home Without Going Broke — оригинальная статья Стивена Бочински
- OpenRouter — агрегатор API для открытых моделей
- Anthropic Claude — подписки и API
- Llama Models — открытые модели от Meta
Дмитрий Полухин — продуктовый дизайнер. Пишу про разработку, AI и дизайн интерфейсов. Обо мне, контакты и профили.