Що сталося
11 червня 2026 року Moonshot AI опублікувала Kimi K2.7 Code на Hugging Face. Модель зосереджена на агентному кодингу та побудована поверх Kimi K2.6. Ключове поліпшення — зниження витрат токенів на «мислення» (thinking) приблизно на 30% при збереженні якості. За три дні після виходу модель набрала trendingScore 548 — один із найвищих показників на HF.
Деталі
Архітектура та характеристики (за офіційною карткою HF):Параметр Значення Архітектура MoE (Mixture-of-Experts) Усього параметрів 1T (трильйон) Активних на інференс 32B Контекстне вікно 256K токенів Vision encoder MoonViT (400M параметрів)
Порівняння з конкурентами на ключових бенчмарках (дані Moonshot AI, 11 червня 2026):Бенчмарк K2.6 K2.7 Code GPT-5.5 Claude Opus 4.8 Kimi Code Bench v2 50.9 62.0 69.0 67.4 MCPMark-Verified 72.8 81.1 92.9 76.4 MCP Atlas 69.4 76.0 79.4 81.3
MCPMark-Verified перевіряє реальне використання MCP-інструментів (Notion, GitHub, Filesystem, Postgres, Playwright). Kimi K2.7 Code (+8.3 п.п. vs K2.6) перевершує Claude Opus 4.8 на цьому бенчмарку.
Модель доступна через OpenAI/Anthropic-сумісний API на platform.moonshot.ai, а також у провайдерів fireworks-ai та novita. Для локального запуску підтримуються vLLM, SGLang, KTransformers.
Що це означає
Для розробників, які будують AI-агентів під кодинг: K2.7 Code — сильний варіант у ніші «агентний інженер», особливо для задач із MCP-інструментами. Зниження thinking-токенів на 30% означає реальну економію в довгих агентних сесіях. Слабке місце — GPT-5.5 випереджає на більшості бенчмарків; для максимальної якості коду K2.7 підійде як бюджетна альтернатива.
Для команд з обмеженим бюджетом на API: 1T/32B MoE через novita або fireworks — дешевше, ніж GPT-5.5 або Opus 4.8; при цьому 256K контекст і MCPMark ≥81% роблять модель робочим вибором для агентних пайплайнів прямо зараз.
Горизонт: модель нова, сторонні ревью з’являться цього тижня — стежимо за незалежними оцінками на SWE-bench і LiveCodeBench.


