Moonshot AI выпустила Kimi K2.7 Code — триллион параметров и -30% токенов мышления

Что произошло

11 июня 2026 года Moonshot AI опубликовала Kimi K2.7 Code на Hugging Face. Модель сосредоточена на агентном кодинге и создана поверх Kimi K2.6. Ключевое улучшение — снижение расхода токенов на «думание» (thinking) примерно на 30% при сохранении качества. За три дня после выхода модель набрала trendingScore 548 — один из самых высоких показателей на HF.

Детали

Архитектура и характеристики (по официальной карточке HF):

ПараметрЗначение
АрхитектураMoE (Mixture-of-Experts)
Всего параметров1T (триллион)
Активных на инференс32B
Контекстное окно256K токенов
Vision encoderMoonViT (400M параметров)

Сравнение с конкурентами на ключевых бенчмарках (данные Moonshot AI, 11 июня 2026):

БенчмаркK2.6K2.7 CodeGPT-5.5Claude Opus 4.8
Kimi Code Bench v250.962.069.067.4
MCPMark-Verified72.881.192.976.4
MCP Atlas69.476.079.481.3

MCPMark-Verified проверяет реальное использование MCP-инструментов (Notion, GitHub, Filesystem, Postgres, Playwright). Kimi K2.7 Code (+8.3 п.п. vs K2.6) обгоняет Claude Opus 4.8 на этом бенчмарке.

Модель доступна через OpenAI/Anthropic-совместимый API на platform.moonshot.ai, а также у провайдеров fireworks-ai и novita. Для локального запуска поддерживаются vLLM, SGLang, KTransformers.

Что это значит

Для разработчиков, которые строят AI-агентов под кодинг: K2.7 Code — сильный вариант в нише «агентный инженер», особенно для задач с MCP-инструментами. Снижение thinking-токенов на 30% означает реальную экономию в длинных агентных сессиях. Слабое место — GPT-5.5 опережает на большинстве бенчмарков; для максимального качества кода K2.7 подойдёт как бюджетная альтернатива.

Для команд с ограниченным бюджетом на API: 1T/32B MoE через novita или fireworks — дешевле, чем GPT-5.5 или Opus 4.8; при этом 256K контекст и MCPMark ≥81% делают модель рабочим выбором для агентных пайплайнов прямо сейчас.

Горизонт: модель новая, сторонние ревью появятся на этой неделе — следим за независимыми оценками на SWE-bench и LiveCodeBench.

Поделиться
Связаться:
Крипто- и data-аналитик, инженер-программист (факультет компьютерных наук ХНУРЭ). В IT с 2008 года: администрировал корпоративный мониторинг в «Vodafone Украина», семь лет разрабатывал и продвигал веб-проекты, пять лет руководил маркетингом на метриках — конверсия, CTR, ROI, LTV.Криптовалютными рынками занимаюсь с 2021 года: ончейн-метрики, токеномика, макроэкономические индикаторы. Разработал собственную data-driven модель анализа рынка на 30+ метрик. Стек — Python (pandas, NumPy, SciPy, matplotlib), математическая статистика и EDA; сбор и сверку данных автоматизирую AI-агентами.Принцип — «Don't trust, verify»: каждая цифра проверена по первоисточнику, ключевые — минимум по двум независимым; прогнозы — только сценарии с условиями. Тезис без данных не публикуется.