Що сталося
Команда WeiboAI виклала VibeThinker-3B — мовну модель усього на 3 млрд параметрів, яка на математичних і кодових бенчмарках сперечається із системами в сотні разів більшими. Модель опубліковано під ліцензією MIT у середині червня 2026 року (препринт arXiv 2606.16140) і доступна для вільного завантаження.
Деталі
- Розмір — 3 млрд параметрів; спеціалізація — задачі на міркування (reasoning).
- На бенчмарку IMO-AnswerBench (400 задач рівня Міжнародної математичної олімпіади) модель набирає 76,4, а з оптимізацією CLR — 80,6.
- На LeetCode проходить 123 зі 128 задач з першої спроби (96,1%).
- Для порівняння, заявленого авторами на тому ж IMO-AnswerBench: DeepSeek V3.2 (671 млрд) — 78,3, GLM-5 (744 млрд) — 82,5, Kimi K2.5 (1 трлн) — 81,8.
- Важливе обмеження: модель не навчалася на виклику інструментів і агентних сценаріях — автори не рекомендують її для function calling і автономних кодинг-агентів.
Що це означає
Кого стосується: ентузіастів локального ШІ й розробників на скромному залізі — 3B-модель запускається на звичайному ноутбуці, а то й на телефоні, без хмари і без оплати за токени. Можливість із цифрою: рівень міркування, порівнянний з моделями на сотні мільярдів параметрів, за розміру в 3 млрд — це різке зростання «інтелекту на ват»; але вузька спеціалізація означає, що для агентів і роботи з інструментами вона не годиться. Горизонт: доступна вже зараз, ліцензія MIT не накладає обмежень на використання, зокрема комерційне.
Контекст
VibeThinker продовжує тренд «маленьких, але розумних» моделей: замість гонки за трильйонами параметрів команди вчать компактні мережі вузьких, перевірюваних навичок — тут це математика й алгоритмічні задачі з однозначно перевірюваною відповіддю, на яких таку модель зручно дотреновувати.




