Weibo випустила VibeThinker-3B — крихітну ризонінг-модель, що сперечається із системами в сотні разів більшими

Що сталося

Команда WeiboAI виклала VibeThinker-3B — мовну модель усього на 3 млрд параметрів, яка на математичних і кодових бенчмарках сперечається із системами в сотні разів більшими. Модель опубліковано під ліцензією MIT у середині червня 2026 року (препринт arXiv 2606.16140) і доступна для вільного завантаження.

Деталі

  • Розмір — 3 млрд параметрів; спеціалізація — задачі на міркування (reasoning).
  • На бенчмарку IMO-AnswerBench (400 задач рівня Міжнародної математичної олімпіади) модель набирає 76,4, а з оптимізацією CLR — 80,6.
  • На LeetCode проходить 123 зі 128 задач з першої спроби (96,1%).
  • Для порівняння, заявленого авторами на тому ж IMO-AnswerBench: DeepSeek V3.2 (671 млрд) — 78,3, GLM-5 (744 млрд) — 82,5, Kimi K2.5 (1 трлн) — 81,8.
  • Важливе обмеження: модель не навчалася на виклику інструментів і агентних сценаріях — автори не рекомендують її для function calling і автономних кодинг-агентів.

Що це означає

Кого стосується: ентузіастів локального ШІ й розробників на скромному залізі — 3B-модель запускається на звичайному ноутбуці, а то й на телефоні, без хмари і без оплати за токени. Можливість із цифрою: рівень міркування, порівнянний з моделями на сотні мільярдів параметрів, за розміру в 3 млрд — це різке зростання «інтелекту на ват»; але вузька спеціалізація означає, що для агентів і роботи з інструментами вона не годиться. Горизонт: доступна вже зараз, ліцензія MIT не накладає обмежень на використання, зокрема комерційне.

Контекст

VibeThinker продовжує тренд «маленьких, але розумних» моделей: замість гонки за трильйонами параметрів команди вчать компактні мережі вузьких, перевірюваних навичок — тут це математика й алгоритмічні задачі з однозначно перевірюваною відповіддю, на яких таку модель зручно дотреновувати.

до 555% Bybit · Savingsдо 555%річних на Savings + до 5 100 USDT новачкам · 3 крокиПочни зараз
до 555% Bybit · Savingsдо 555%річних на Savings + до 5 100 USDT новачкам · 3 крокиПочни зараз
Поділитися
Зв'язатися:
Крипто- та data-аналітик, інженер-програміст (факультет комп'ютерних наук ХНУРЕ). В IT з 2008 року: адміністрував корпоративний моніторинг у «Vodafone Україна», сім років розробляв і просував веб-проєкти, п'ять років керував маркетингом на метриках — конверсія, CTR, ROI, LTV.Криптовалютними ринками займаюся з 2021 року: ончейн-метрики, токеноміка, макроекономічні індикатори. Розробив власну data-driven модель аналізу ринку на 30+ метрик. Стек — Python (pandas, NumPy, SciPy, matplotlib), математична статистика та EDA; збір і звірку даних автоматизую AI-агентами.Принцип — «Don't trust, verify»: кожна цифра перевірена за першоджерелом, ключові — щонайменше за двома незалежними; прогнози — лише сценарії з умовами. Теза без даних не публікується.