Moonshot AI випустила Kimi K2.7 Code — трильйон параметрів і -30% токенів мислення

Що сталося

11 червня 2026 року Moonshot AI опублікувала Kimi K2.7 Code на Hugging Face. Модель зосереджена на агентному кодингу та побудована поверх Kimi K2.6. Ключове поліпшення — зниження витрат токенів на «мислення» (thinking) приблизно на 30% при збереженні якості. За три дні після виходу модель набрала trendingScore 548 — один із найвищих показників на HF.

Деталі

Архітектура та характеристики (за офіційною карткою HF):

ПараметрЗначення
АрхітектураMoE (Mixture-of-Experts)
Усього параметрів1T (трильйон)
Активних на інференс32B
Контекстне вікно256K токенів
Vision encoderMoonViT (400M параметрів)

Порівняння з конкурентами на ключових бенчмарках (дані Moonshot AI, 11 червня 2026):

БенчмаркK2.6K2.7 CodeGPT-5.5Claude Opus 4.8
Kimi Code Bench v250.962.069.067.4
MCPMark-Verified72.881.192.976.4
MCP Atlas69.476.079.481.3

MCPMark-Verified перевіряє реальне використання MCP-інструментів (Notion, GitHub, Filesystem, Postgres, Playwright). Kimi K2.7 Code (+8.3 п.п. vs K2.6) перевершує Claude Opus 4.8 на цьому бенчмарку.

Модель доступна через OpenAI/Anthropic-сумісний API на platform.moonshot.ai, а також у провайдерів fireworks-ai та novita. Для локального запуску підтримуються vLLM, SGLang, KTransformers.

Що це означає

Для розробників, які будують AI-агентів під кодинг: K2.7 Code — сильний варіант у ніші «агентний інженер», особливо для задач із MCP-інструментами. Зниження thinking-токенів на 30% означає реальну економію в довгих агентних сесіях. Слабке місце — GPT-5.5 випереджає на більшості бенчмарків; для максимальної якості коду K2.7 підійде як бюджетна альтернатива.

Для команд з обмеженим бюджетом на API: 1T/32B MoE через novita або fireworks — дешевше, ніж GPT-5.5 або Opus 4.8; при цьому 256K контекст і MCPMark ≥81% роблять модель робочим вибором для агентних пайплайнів прямо зараз.

Горизонт: модель нова, сторонні ревью з’являться цього тижня — стежимо за незалежними оцінками на SWE-bench і LiveCodeBench.

Поділитися
Зв'язатися:
Крипто- та data-аналітик, інженер-програміст (факультет комп'ютерних наук ХНУРЕ). В IT з 2008 року: адміністрував корпоративний моніторинг у «Vodafone Україна», сім років розробляв і просував веб-проєкти, п'ять років керував маркетингом на метриках — конверсія, CTR, ROI, LTV.Криптовалютними ринками займаюся з 2021 року: ончейн-метрики, токеноміка, макроекономічні індикатори. Розробив власну data-driven модель аналізу ринку на 30+ метрик. Стек — Python (pandas, NumPy, SciPy, matplotlib), математична статистика та EDA; збір і звірку даних автоматизую AI-агентами.Принцип — «Don't trust, verify»: кожна цифра перевірена за першоджерелом, ключові — щонайменше за двома незалежними; прогнози — лише сценарії з умовами. Теза без даних не публікується.