Что произошло
30 июня 2026 года китайская компания Meituan (известна прежде всего сервисами доставки) открыла исходники большой языковой модели LongCat-2.0 — на GitHub, Hugging Face и собственной платформе. Главная особенность: 1,6 трлн параметров и обучение целиком на китайских чипах, без оборудования NVIDIA. Модель раздаётся по лицензии MIT — то есть бесплатно и с правом коммерческого использования.
Детали
- Архитектура — Mixture-of-Experts (MoE, «смесь экспертов»): из 1,6 трлн параметров на каждый токен активируется лишь часть, порядка 33–56 млрд. Это делает модель заметно дешевле в работе, чем «плотная» модель того же размера.
- Контекстное окно — 1 млн токенов «из коробки» (объём текста, который модель удерживает в одном запросе).
- Обучение и инференс прошли на кластере из 50 000 отечественных чипов — это первая модель такого масштаба, полностью обученная на китайском «железе».
- LongCat-2.0 заточена под агентные задачи: многошаговая инженерия, работа с инструментами, автоматические правки в репозиториях кода.
- Два месяца модель работала на OpenRouter (агрегатор доступа к разным LLM) инкогнито под именем Owl Alpha и вошла в мировую тройку лидеров: ~10,1 трлн токенов в месяц, в среднем 559 млрд в день — рост на 242% за месяц (данные OpenRouter на конец июня 2026).
Что это значит
Для разработчиков это ещё один сильный и при этом бесплатный инструмент для кодинга: открытые веса под MIT означают, что модель можно развернуть у себя или использовать через дешёвый сторонний API, не завязываясь на одного вендора. Для индустрии важнее другое: модель near-frontier-уровня (почти как у лидеров рынка), обученная без чипов NVIDIA, показывает, что Китай способен строить передовой ИИ на собственном «железе» — а это снижает эффект экспортных ограничений США. Ощутимо это уже сейчас: веса доступны для скачивания, а не «появятся позже».
Контекст
LongCat — не единичный случай: ранее в открытый доступ так же выходили сильные китайские модели, например GLM-5.2 от Zhipu AI.
