Moonshot AI випустила Kimi K2.7 Code — трильйон параметрів і -30% токенів мислення

Останнє оновлення: 2026/06/14

Що сталося

11 червня 2026 року Moonshot AI опублікувала Kimi K2.7 Code на Hugging Face. Модель зосереджена на агентному кодингу та побудована поверх Kimi K2.6. Ключове поліпшення — зниження витрат токенів на «мислення» (thinking) приблизно на 30% при збереженні якості. За три дні після виходу модель набрала trendingScore 548 — один із найвищих показників на HF.

Що сталося
Деталі
Що це означає

Деталі

Архітектура та характеристики (за офіційною карткою HF):

Параметр	Значення
Архітектура	MoE (Mixture-of-Experts)
Усього параметрів	1T (трильйон)
Активних на інференс	32B
Контекстне вікно	256K токенів
Vision encoder	MoonViT (400M параметрів)

Порівняння з конкурентами на ключових бенчмарках (дані Moonshot AI, 11 червня 2026):

Бенчмарк	K2.6	K2.7 Code	GPT-5.5	Claude Opus 4.8
Kimi Code Bench v2	50.9	62.0	69.0	67.4
MCPMark-Verified	72.8	81.1	92.9	76.4
MCP Atlas	69.4	76.0	79.4	81.3

MCPMark-Verified перевіряє реальне використання MCP-інструментів (Notion, GitHub, Filesystem, Postgres, Playwright). Kimi K2.7 Code (+8.3 п.п. vs K2.6) перевершує Claude Opus 4.8 на цьому бенчмарку.

Модель доступна через OpenAI/Anthropic-сумісний API на platform.moonshot.ai, а також у провайдерів fireworks-ai та novita. Для локального запуску підтримуються vLLM, SGLang, KTransformers.

Що це означає

Для розробників, які будують AI-агентів під кодинг: K2.7 Code — сильний варіант у ніші «агентний інженер», особливо для задач із MCP-інструментами. Зниження thinking-токенів на 30% означає реальну економію в довгих агентних сесіях. Слабке місце — GPT-5.5 випереджає на більшості бенчмарків; для максимальної якості коду K2.7 підійде як бюджетна альтернатива.

Для команд з обмеженим бюджетом на API: 1T/32B MoE через novita або fireworks — дешевше, ніж GPT-5.5 або Opus 4.8; при цьому 256K контекст і MCPMark ≥81% роблять модель робочим вибором для агентних пайплайнів прямо зараз.

Горизонт: модель нова, сторонні ревью з’являться цього тижня — стежимо за незалежними оцінками на SWE-bench і LiveCodeBench.

ТЕГИ:agents ai-models fine-tuning llama-cpp quantization

ДЖЕРЕЛА:HuggingFace / Moonshot AI Moonshot AI Platform

Поділитися

ByVolodymyr Polkovnichenko

Зв'язатися:

Крипто- та data-аналітик, інженер-програміст (факультет комп'ютерних наук ХНУРЕ). В IT з 2008 року: адміністрував корпоративний моніторинг у «Vodafone Україна», сім років розробляв і просував веб-проєкти, п'ять років керував маркетингом на метриках — конверсія, CTR, ROI, LTV.Криптовалютними ринками займаюся з 2021 року: ончейн-метрики, токеноміка, макроекономічні індикатори. Розробив власну data-driven модель аналізу ринку на 30+ метрик. Стек — Python (pandas, NumPy, SciPy, matplotlib), математична статистика та EDA; збір і звірку даних автоматизую AI-агентами.Принцип — «Don't trust, verify»: кожна цифра перевірена за першоджерелом, ключові — щонайменше за двома незалежними; прогнози — лише сценарії з умовами. Теза без даних не публікується.