Mistral відкрила Leanstral 1.5: 100% на формальній математиці та 5 знайдених багів

2 хв. читання
BINANCE TRADERS LEAGUE S3
Спот і ф'ючерси · старт ф'ючерсів 23.06
Приєднатися →

Що сталося

Французька Mistral AI випустила Leanstral 1.5 — відкриту модель для формальної верифікації мовою Lean 4. Модель поширюється за ліцензією Apache 2.0 і доступна на Hugging Face та через безкоштовний API (оголошено 4 липня 2026 року).

Деталі

  • Архітектура: MoE-модель Leanstral-1.5-119B-A6B — 119 млрд параметрів усього, близько 6 млрд активних.
  • Бенчмарки з формальної математики: 100% на miniF2F; 587 із 672 завдань PutnamBench (математична олімпіада Патнема); 87% на FATE-H (алгебра рівня магістратури) і 34% на FATE-X (докторський рівень).
  • На верифікації коду модель просканувала 57 open-source репозиторіїв і знайшла п’ять раніше невідомих багів — зокрема переповнення в Rust-бібліотеці varinteger.

Що це означає

Формальна верифікація — це математичний доказ того, що код або теорема правильні без винятків. Раніше така робота була справою вузьких фахівців вручну; Leanstral показує, що LLM уже здатна доводити теореми й знаходити реальні баги в бойовому коді, а не лише розв’язувати навчальні завдання. Практичний наслідок для розробника: відкриту модель можна завантажити й запустити локально, отримавши інструмент, який ловить класи помилок, невидимі звичайним тестам, — переповнення, граничні випадки. Поки це нішевий інструмент для критичного коду (криптографія, фінанси, ядро ОС), але планку «що вміє відкрита модель» помітно піднято.

Контекст

Leanstral продовжує хвилю сильних open-weights релізів — услід за GLM-5.2 від Zhipu AI. Відкриті моделі дедалі частіше наздоганяють закриті у вузьких, але складних завданнях.

Приз-фонд $40K+
BINANCE
Приз-фонд $40K+
Перший до $175M обсягу — +7000 USDC
ТОРГУВАТИ
Поділитися
Зв'язатися:
Крипто- та data-аналітик, інженер-програміст (факультет комп'ютерних наук ХНУРЕ). В IT з 2008 року: адміністрував корпоративний моніторинг у «Vodafone Україна», сім років розробляв і просував веб-проєкти, п'ять років керував маркетингом на метриках — конверсія, CTR, ROI, LTV.Криптовалютними ринками займаюся з 2021 року: ончейн-метрики, токеноміка, макроекономічні індикатори. Розробив власну data-driven модель аналізу ринку на 30+ метрик. Стек — Python (pandas, NumPy, SciPy, matplotlib), математична статистика та EDA; збір і звірку даних автоматизую AI-агентами.Принцип — «Don't trust, verify»: кожна цифра перевірена за першоджерелом, ключові — щонайменше за двома незалежними; прогнози — лише сценарії з умовами. Теза без даних не публікується.