Що сталося
13 червня 2026 року китайська лабораторія ZhipuAI (бренд Z.ai) випустила GLM-5.2 — відкриту мовну модель з архітектурою Mixture-of-Experts. На 27 червня 2026 року модель набрала 83 тисячі завантажень і входить до топу трендів Hugging Face. За даними незалежних бенчмарків Artificial Analysis, GLM-5.2 займає перше місце серед відкритих моделей світу за інтелектуальним індексом і четверте місце в загальному заліку — після Fable 5, Opus 4.8 і GPT-5.5.
Деталі
Ключові параметри GLM-5.2:Характеристика Значення Архітектура Mixture-of-Experts (MoE) Усього параметрів ~750 млрд Активних параметрів ~40 млрд на токен Контекст 1 млн токенів Ліцензія MIT (без обмежень за регіоном)
Бенчмарки (незалежні, червень 2026): SWE-bench Pro — 62,1 бала (найкраща open-weights), Terminal-Bench 2.1 — 81,0 бала.
Ціни через OpenRouter (на 27 червня 2026): $1,40 за 1M вхідних токенів / $4,40 за вихідні. Для порівняння: GPT-5.5 коштує $5 / $30, Claude Opus 4.8 — $5 / $25.
Що це означає
Для розробників, які будують coding-агентів і agentic-пайплайни, GLM-5.2 змінює розрахунок. Якість рівня GPT-5.5 при вартості приблизно в 6 разів нижчій — це реальна альтернатива для задач з великим обсягом токенів. MIT-ліцензія без регіональних обмежень означає можливість деплою на власній інфраструктурі без залежності від API-провайдера.
Для користувачів, які запускають LLM локально: з 40 млрд активних параметрів у MoE-архітектурі для комфортного інференсу потрібні кілька GPU із сумарно 80+ ГБ VRAM. Квантовані GGUF-варіанти вже доступні на Hugging Face. На споживчому залізі (RTX 4090 / 3090) — лише квантовані версії з утратою якості.
Горизонт: Artificial Analysis оновлює бенчмарки щомісяця — позиція GLM-5.2 зміниться з виходом нових моделей Q3 2026.
