Что произошло
13 июня 2026 года китайская лаборатория ZhipuAI (бренд Z.ai) выпустила GLM-5.2 — открытую языковую модель с архитектурой Mixture-of-Experts. На 27 июня 2026 года модель набрала 83 тысячи загрузок и входит в топ трендов Hugging Face. По данным независимых бенчмарков Artificial Analysis, GLM-5.2 занимает первое место среди открытых моделей мира по интеллектуальному индексу и четвёртое место в общем зачёте — после Fable 5, Opus 4.8 и GPT-5.5.
Детали
Ключевые параметры GLM-5.2:Характеристика Значение Архитектура Mixture-of-Experts (MoE) Всего параметров ~750 млрд Активных параметров ~40 млрд на токен Контекст 1 млн токенов Лицензия MIT (без ограничений по региону)
Бенчмарки (независимые, июнь 2026): SWE-bench Pro — 62,1 балла (лучший open-weights), Terminal-Bench 2.1 — 81,0 балла.
Цены через OpenRouter (на 27 июня 2026): $1,40 за 1M входных токенов / $4,40 за выходные. Для сравнения: GPT-5.5 стоит $5 / $30, Claude Opus 4.8 — $5 / $25.
Что это значит
Для разработчиков, которые строят coding-агентов и agentic-пайплайны, GLM-5.2 меняет расчёт. Качество уровня GPT-5.5 при стоимости примерно в 6 раз ниже — это реальная альтернатива для задач с высоким объёмом токенов. MIT-лицензия без региональных ограничений означает возможность деплоя на собственной инфраструктуре без зависимости от API-провайдера.
Для пользователей, которые запускают LLM локально: с 40 млрд активных параметров в MoE-архитектуре для комфортного инференса нужны несколько GPU с суммарно 80+ ГБ VRAM. Квантованные GGUF-варианты уже доступны на Hugging Face. На потребительском железе (RTX 4090 / 3090) — только квантованные версии с потерей качества.
Горизонт: Artificial Analysis обновляет бенчмарки ежемесячно — позиция GLM-5.2 изменится с выходом новых моделей Q3 2026.
