Два мини-ПК вместо облачных API: как локальный ИИ экономит на токенах

Что произошло

Издание Tom’s Hardware 18 июня 2026 года опубликовало разбор журналиста, который перевёл большую часть своих ИИ-задач с облачных API на два домашних мини-ПК. Повод — дорожающие подписки и тарифы на инференс у крупных лабораторий: автор показывает, что на потребительском железе уже можно прокачивать десятки миллионов токенов в день.

Детали

  • Первая машина — мини-ПК GMKtec на чипе AMD Ryzen AI Max+ 395 с 96 ГБ ОЗУ, куплена в середине марта примерно за £1 500 ($2 000 по курсу на тот момент). Через неё, по словам автора, проходит от 20 до 50 млн токенов в день.
  • Софт — LM Studio и набор квантованных моделей семейства Qwen, запущенных параллельно несколькими процессами для фоновой обработки. Около двух недель назад автор добавил вторую машину уже со 128 ГБ памяти под более крупные модели (27–36B параметров); суммарно связка тянет 50–80 млн токенов в день.
  • Экономика: подписки ChatGPT Plus и GLM Coding Lite обходились автору примерно в $23 в месяц, но нужные ему объёмы быстро упёрлись бы в лимиты и дорогой API. Сейчас две трети его токенов — это локальные модели; платные сервисы остались для отладки и кода.

Что это значит

Касается практиков, которые гоняют через ИИ большие объёмы текста (ресёрч, разметка, фоновый анализ), а не разовые запросы. Нюанс честный: локальные мини-ПК выигрывают не в скорости, а в стоимости при больших объёмах — медленный «отклик до первого токена» автору не мешает, потому что задачи идут в фоне 24/7. Для интерактивной работы или сложного кода фронтир-модели из облака пока заметно сильнее. Порог входа — единоразовые $2 000+ за машину против ежемесячной подписки: окупаемость наступает только на стабильно высоких объёмах. Горизонт тренда — расширяющийся: по мере роста цен на API и улучшения open-weight моделей доля «локального» ИИ будет расти.

Контекст

Мы уже показывали на практике, как запускать локальные LLM на компактном железе — например, на Mac mini M4 Pro. Связка из мини-ПК на Ryzen AI Max+ — тот же подход, но с упором на массовый поток токенов.

до 555% Bybit · Savingsдо 555%годовых на Savings + до 5 100 USDT новичкам · 3 шагаНачни сейчас
до 5 100 USDT Bybit · новичкамдо 5 100 USDTBybit дарит новичкам за простые заданияЗабрать бонус
Поделиться
Связаться:
Крипто- и data-аналитик, инженер-программист (факультет компьютерных наук ХНУРЭ). В IT с 2008 года: администрировал корпоративный мониторинг в «Vodafone Украина», семь лет разрабатывал и продвигал веб-проекты, пять лет руководил маркетингом на метриках — конверсия, CTR, ROI, LTV.Криптовалютными рынками занимаюсь с 2021 года: ончейн-метрики, токеномика, макроэкономические индикаторы. Разработал собственную data-driven модель анализа рынка на 30+ метрик. Стек — Python (pandas, NumPy, SciPy, matplotlib), математическая статистика и EDA; сбор и сверку данных автоматизирую AI-агентами.Принцип — «Don't trust, verify»: каждая цифра проверена по первоисточнику, ключевые — минимум по двум независимым; прогнозы — только сценарии с условиями. Тезис без данных не публикуется.