Создание поста: AI coding дома без разорения

15.06.2026 · 5 мин

Начинаю работу над постом. У меня есть статья и согласованный план — буду идти по шагам и собирать рабочий, недорогой стек для AI coding дома.

Три способа кодить с AI дома и не продать почку

Знаете, что общего между энтузиастом AI coding и геймером, который собрал топовый ПК? Оба быстро понимают, что железо — это ещё только начало расходов.

Недавно наткнулся на разбор от Стивена Бочински (Stephen Bochinski), где он разложил по полочкам три стратегии домашнего AI coding. И там есть мысль, которая переворачивает взгляд на экономику: всё упирается в то, насколько вы доверяете рынку железа и моделей через год.

Почему AI coding дома быстро дорожает

Когда я впервые попробовал AI-помощника для кода, всё казалось просто: платишь $20 в месяц — и вперёд. Потом начинаются длинные контексты, автодополнения, эксперименты с разными моделями для разных задач — и месячный чек легко улетает в $200-400.

Особенно если у вас включены дорогие модели вроде GPT-4o или Claude Opus.

Где обычно утекают деньги

Стивен выделяет три основных подхода к домашнему AI coding, и у каждого свои грабли.

Вариант 1: своё железо

Покупаете мощную GPU, ставите открытые модели вроде Llama или Mistral локально и платите только за электричество.

Плюсы: после покупки — бесплатно почти навсегда, модель работает на вашей машине, никаких ограничений.

Минусы:

Это работает, только если машина загружена почти постоянно. Для большинства людей домашний сервер будет простаивать большую часть времени.

Вариант 2: аренда через API

Берёте те же открытые модели, но арендуете их у провайдера и платите за токены — кусочки текста, из которых состоит запрос и ответ.

Самый популярный агрегатор — OpenRouter. Там десятки моделей, а цены начинаются примерно от $0.1 за миллион токенов и доходят до более дорогих вариантов.

Плюсы:

Минусы:

РАБОЧИЙ СТЭК AI CODING
────────────────────────
┌─────────────────────────────────────────────┐
│  ФРОНТЬЕР ПОДПИСКИ                          │
│  (Claude, GPT для «думания»)                │
│  Hard problems: архитектура, спек, ревью    │
└──────────────────────┬──────────────────────┘
                       │
                       ▼
┌─────────────────────────────────────────────┐
│  OPEN SOURCE API                            │
│  (Llama, Mistral — через OpenRouter)        │
│  Механика: форматирование, рутина, тесты    │
└─────────────────────────────────────────────┘
Разделение задач по стоимости и сложности

Вариант 3: frontier подписки

OpenAI и Anthropic продают подписки на $20-200 в месяц, в которые входит определённый объём использования.

Стивен приводит интересную математику: за примерно $400 в месяц подписок можно получить эквивалент около $2800 по API-тарифам. Но есть нюанс — подписки имеют лимиты. Серьёзный AI-native рабочий процесс быстро упирается в потолок.

Подписки хороши для ручной работы, но плохо масштабируются на автономных агентов.

Базовый недорогой стек

Стивен рекомендует комбинированный подход:

Дорогие модели — только для сложного мышления: архитектурные решения, спецификации, код-ревью. Дешёвые открытые модели — для механической работы: форматирование кода, базовые тесты, автодополнения.

СПЕК ДЕЛЕГИРОВАНИЯ ЗАДАЧ
──────────────────────────
СТОИМОСТЬ
  ▲
  │     ████  Сложная архитектура
  │   ██████
  │  ████████ ───────────────────────────────
  │ ██████████████  Спеки, ревью
  │█████████████████████
  │███████████████████████████
  │██████████████████████████████████
  │███████████████████████████████████████ ──► ЛОКАЛЬНО
  └──────────────────────────────────────────► ВРЕМЯ/ЗАДАЧИ
      Простое          Сложное
Дорогие модели — на сложное, дешёвые — на простое

Как ограничить расходы

Несколько практических приёмов, которые помогают держать бюджет под контролем:

Когда платить за облако, а когда нет

Простой принцип — spec-driven development: дорогие модели пишут план, дешёвые модели реализуют его по кусочкам.

Это как если бы старший разработчик нарисовал архитектуру, а код писали бы младшие инженеры по чётким задачам. Только в роли «джунов» выступают модели за $0.2 за миллион токенов.

Итоговый рабочий набор

При правильном подходе можно получить производительность команды из 20 инженеров за примерно $1000 в месяц.

Что делать на практике:

  1. Берёте подписку на Claude или GPT для архитектурных задач и код-ревью
  2. Регистрируетесь на OpenRouter для дешёвой механики
  3. Настраиваете IDE так, чтобы автодополнения шли через дешёвую модель
  4. Пишете шаблоны промптов для повторяющихся задач
  5. Мониторите расходы раз в неделю

Выводы

Во-первых, универсального решения нет: кому-то выгоднее железо, кому-то — подписка.

Во-вторых, разделение труда между моделями — не роскошь, а необходимость.

В-третьих, $1000 в месяц — это не мало, но и не много, если сравнить с зарплатой хотя бы одного инженера.

Главное — не впадать в крайности: не экономить на всём подряд и не лить деньги в топку бездумно.

Ссылки

Дмитрий Полухин — продуктовый дизайнер. Пишу про разработку, AI и дизайн интерфейсов. Обо мне, контакты и профили.