Weibo выпустила VibeThinker-3B — крошечную ризонинг-модель, спорящую с системами в сотни раз больше

Что произошло

Команда WeiboAI выложила VibeThinker-3B — языковую модель всего на 3 млрд параметров, которая на математических и кодовых бенчмарках спорит с системами в сотни раз крупнее. Модель опубликована под лицензией MIT в середине июня 2026 года (препринт arXiv 2606.16140) и доступна для свободного скачивания.

Детали

  • Размер — 3 млрд параметров; специализация — задачи на рассуждение (reasoning).
  • На бенчмарке IMO-AnswerBench (400 задач уровня Международной математической олимпиады) модель набирает 76,4, а с оптимизацией CLR — 80,6.
  • На LeetCode проходит 123 из 128 задач с первой попытки (96,1%).
  • Для сравнения, заявленного авторами на том же IMO-AnswerBench: DeepSeek V3.2 (671 млрд) — 78,3, GLM-5 (744 млрд) — 82,5, Kimi K2.5 (1 трлн) — 81,8.
  • Важное ограничение: модель не обучалась на вызове инструментов и агентных сценариях — авторы не рекомендуют её для function calling и автономных кодинг-агентов.

Что это значит

Кого касается: энтузиастов локального ИИ и разработчиков на скромном железе — 3B-модель запускается на обычном ноутбуке, а то и на телефоне, без облака и без оплаты за токены. Возможность с цифрой: уровень рассуждения, сопоставимый с моделями на сотни миллиардов параметров, при размере в 3 млрд — это резкий рост «интеллекта на ватт»; но узкая специализация означает, что для агентов и работы с инструментами она не годится. Горизонт: доступна уже сейчас, лицензия MIT не накладывает ограничений на использование, включая коммерческое.

Контекст

VibeThinker продолжает тренд «маленьких, но умных» моделей: вместо гонки за триллионами параметров команды учат компактные сети узким, проверяемым навыкам — здесь это математика и алгоритмические задачи с однозначно проверяемым ответом, на которых такую модель удобно дообучать.

до 555% Bybit · Savingsдо 555%годовых на Savings + до 5 100 USDT новичкам · 3 шагаНачни сейчас
до 5 100 USDT Bybit · новичкамдо 5 100 USDTBybit дарит новичкам за простые заданияЗабрать бонус
Поделиться
Связаться:
Крипто- и data-аналитик, инженер-программист (факультет компьютерных наук ХНУРЭ). В IT с 2008 года: администрировал корпоративный мониторинг в «Vodafone Украина», семь лет разрабатывал и продвигал веб-проекты, пять лет руководил маркетингом на метриках — конверсия, CTR, ROI, LTV.Криптовалютными рынками занимаюсь с 2021 года: ончейн-метрики, токеномика, макроэкономические индикаторы. Разработал собственную data-driven модель анализа рынка на 30+ метрик. Стек — Python (pandas, NumPy, SciPy, matplotlib), математическая статистика и EDA; сбор и сверку данных автоматизирую AI-агентами.Принцип — «Don't trust, verify»: каждая цифра проверена по первоисточнику, ключевые — минимум по двум независимым; прогнозы — только сценарии с условиями. Тезис без данных не публикуется.