Два міні-ПК замість хмарних API: як локальний ШІ економить на токенах

Останнє оновлення: 2026/06/19

Що сталося

Видання Tom’s Hardware 18 червня 2026 року опублікувало розбір журналіста, який переніс більшу частину своїх ШІ-задач із хмарних API на два домашні міні-ПК. Привід — дедалі дорожчі підписки й тарифи на інференс у великих лабораторій: автор показує, що на споживчому залізі вже можна прокачувати десятки мільйонів токенів на день.

Що сталося
Деталі
Що це означає
Контекст

Деталі

Перша машина — міні-ПК GMKtec на чипі AMD Ryzen AI Max+ 395 з 96 ГБ ОЗП, куплена в середині березня приблизно за £1 500 ($2 000 за курсом на той момент). Через неї, за словами автора, проходить від 20 до 50 млн токенів на день.
Софт — LM Studio і набір квантованих моделей родини Qwen, запущених паралельно кількома процесами для фонової обробки. Близько двох тижнів тому автор додав другу машину вже зі 128 ГБ пам’яті під більші моделі (27–36B параметрів); сумарно зв’язка тягне 50–80 млн токенів на день.
Економіка: підписки ChatGPT Plus і GLM Coding Lite коштували автору приблизно $23 на місяць, але потрібні йому обсяги швидко вперлися б у ліміти й дорогий API. Зараз дві третини його токенів — це локальні моделі; платні сервіси лишилися для налагодження й коду.

Що це означає

Стосується практиків, які ганяють через ШІ великі обсяги тексту (ресерч, розмітка, фоновий аналіз), а не разові запити. Нюанс чесний: локальні міні-ПК виграють не у швидкості, а у вартості за великих обсягів — повільний «відгук до першого токена» автору не заважає, бо задачі йдуть у фоні 24/7. Для інтерактивної роботи чи складного коду фронтир-моделі з хмари поки що помітно сильніші. Поріг входу — одноразові $2 000+ за машину проти щомісячної підписки: окупність настає лише на стабільно високих обсягах. Горизонт тренду — розширюваний: у міру зростання цін на API й покращення open-weight моделей частка «локального» ШІ зростатиме.

Контекст

Ми вже показували на практиці, як запускати локальні LLM на компактному залізі — наприклад, на Mac mini M4 Pro. Зв’язка з міні-ПК на Ryzen AI Max+ — той самий підхід, але з акцентом на масовий потік токенів.

до 555%

Bybit · Savingsдо 555%річних на Savings + до 5 100 USDT новачкам · 3 крокиПочни зараз

до 5 100 USDT

Bybit · новачкамдо 5 100 USDTДепозит $100 — і до 5 100 USDT у нагородахЗабери бонус

ТЕГИ:lm-studio local-llm mini-pc strix-halo

ДЖЕРЕЛА:Tom's Hardware Tom's Hardware (обзор GMKtec Evo X2, Ryzen AI Max+ 395)

Поділитися

ByVolodymyr Polkovnichenko

Зв'язатися:

Крипто- та data-аналітик, інженер-програміст (факультет комп'ютерних наук ХНУРЕ). В IT з 2008 року: адміністрував корпоративний моніторинг у «Vodafone Україна», сім років розробляв і просував веб-проєкти, п'ять років керував маркетингом на метриках — конверсія, CTR, ROI, LTV.Криптовалютними ринками займаюся з 2021 року: ончейн-метрики, токеноміка, макроекономічні індикатори. Розробив власну data-driven модель аналізу ринку на 30+ метрик. Стек — Python (pandas, NumPy, SciPy, matplotlib), математична статистика та EDA; збір і звірку даних автоматизую AI-агентами.Принцип — «Don't trust, verify»: кожна цифра перевірена за першоджерелом, ключові — щонайменше за двома незалежними; прогнози — лише сценарії з умовами. Теза без даних не публікується.