Що сталося
Видання Tom’s Hardware 18 червня 2026 року опублікувало розбір журналіста, який переніс більшу частину своїх ШІ-задач із хмарних API на два домашні міні-ПК. Привід — дедалі дорожчі підписки й тарифи на інференс у великих лабораторій: автор показує, що на споживчому залізі вже можна прокачувати десятки мільйонів токенів на день.
Деталі
- Перша машина — міні-ПК GMKtec на чипі AMD Ryzen AI Max+ 395 з 96 ГБ ОЗП, куплена в середині березня приблизно за £1 500 ($2 000 за курсом на той момент). Через неї, за словами автора, проходить від 20 до 50 млн токенів на день.
- Софт — LM Studio і набір квантованих моделей родини Qwen, запущених паралельно кількома процесами для фонової обробки. Близько двох тижнів тому автор додав другу машину вже зі 128 ГБ пам’яті під більші моделі (27–36B параметрів); сумарно зв’язка тягне 50–80 млн токенів на день.
- Економіка: підписки ChatGPT Plus і GLM Coding Lite коштували автору приблизно $23 на місяць, але потрібні йому обсяги швидко вперлися б у ліміти й дорогий API. Зараз дві третини його токенів — це локальні моделі; платні сервіси лишилися для налагодження й коду.
Що це означає
Стосується практиків, які ганяють через ШІ великі обсяги тексту (ресерч, розмітка, фоновий аналіз), а не разові запити. Нюанс чесний: локальні міні-ПК виграють не у швидкості, а у вартості за великих обсягів — повільний «відгук до першого токена» автору не заважає, бо задачі йдуть у фоні 24/7. Для інтерактивної роботи чи складного коду фронтир-моделі з хмари поки що помітно сильніші. Поріг входу — одноразові $2 000+ за машину проти щомісячної підписки: окупність настає лише на стабільно високих обсягах. Горизонт тренду — розширюваний: у міру зростання цін на API й покращення open-weight моделей частка «локального» ШІ зростатиме.
Контекст
Ми вже показували на практиці, як запускати локальні LLM на компактному залізі — наприклад, на Mac mini M4 Pro. Зв’язка з міні-ПК на Ryzen AI Max+ — той самий підхід, але з акцентом на масовий потік токенів.




