GLM-5.2 від Z.ai: open-weight флагман, що цілить у Claude Code

23 хв. читання

Коротко (TL;DR)

GLM-5.2 — флагманська мовна нейромережа китайської лабораторії Z.ai (колишня Zhipu AI), що вийшла в середині червня 2026 року з відкритими вагами під ліцензією MIT. Якщо прибрати маркетинг, суть така: це перша відкрита модель, яка на довгих агентних завданнях із кодом підійшла до Claude Opus 4.8 буквально на один крок, а коштує за токенами в рази дешевше. Разом із моделлю Z.ai випустила власне середовище розробки ZCode — пряму відповідь Claude Code від Anthropic.

Кому підходить: командам і розробникам, які ганяють великий обсяг кодинг-агента й хочуть зрізати рахунок за API, або тим, у кого є інфраструктура для самостійного хостингу та вимога не віддавати код у зовнішню хмару. Кому не підходить: завданням із картинками (у моделі немає зору), а також командам у регульованих галузях і держсекторі — використання хмарного API Z.ai означає, що дані проходять через інфраструктуру під китайською юрисдикцією. Головний конкурент за ціною/якістю — DeepSeek-V4-Pro серед відкритих і Claude Opus 4.8 серед закритих.

Далі — за фактами: архітектура, бенчмарки кодування з позначкою «вендор чи незалежний тест», розбір середовища ZCode, тарифи, запуск локально, порівняння з альтернативами та ризики.

Що таке GLM-5.2: архітектура, контекст, ліцензія

GLM-5.2 — це велика мовна модель з архітектурою Mixture-of-Experts (MoE). Простими словами: усередині моделі багато «експертів»-підмереж, але на кожен запит активується лише мала їх частина. Це дає якість великої моделі за вартістю обчислень невеликої. У GLM-5.2 активні близько 40 млрд параметрів із загального пулу.

$3 млн+ TRADERS LEAGUE · SEASON 3$3 млн+Що довше зволікаєш — то важче наздогнати лідерів у таблицяхДолучайся до Ліги →

З розміром загального пулу є важливий нюанс, який варто проговорити одразу: офіційні джерела Z.ai розходяться самі із собою. GitHub-репозиторій і блог указують «744B», а картка моделі на Hugging Face та більшість незалежних оглядів (Simon Willison, VentureBeat, TechTimes) — «753B». Розбіжність близько 1,2%, найімовірніше через різну методику підрахунку embedding-шарів. Ми наводимо обидва значення, а не обираємо зручне — це якраз той випадок, коли навіть першоджерело не ідеальне.

Ключові характеристики (за даними на 3 липня 2026 року):

ПараметрЗначення
РозробникZ.ai (Zhipu AI), Китай
Дата релізу13 червня 2026 (Coding Plan) / 16 червня 2026 (відкриті ваги)
АрхітектураMoE, ~744–753 млрд параметрів усього, ~40 млрд активних
Контекст1 048 576 токенів (1M), макс. вивід 131 072
ЛіцензіяMIT (без регіональних обмежень)
Модальністьлише текст (зору немає)
Вагивідкриті, на Hugging Face

Окремо про ліцензію MIT — це важливий і часто неправильно зрозумілий пункт. MIT дозволяє комерційне використання, донавчання та self-hosting без регіональних обмежень і роялті. Ваги при цьому доступні безкоштовно. Але «відкриті ваги» не дорівнює «повністю прозора модель»: навчальні дані та процес Z.ai не розкриває, тому перевірити модель на упередженість чи закладки збоку не можна — можна лише тестувати поведінку. Хибне уявлення «open source = безкоштовно й безпечно для будь-якого застосування» тут не працює: безкоштовні ваги, а не інфраструктура для їхнього запуску, і не аудит.

Контекстне вікно в 1 мільйон токенів — це приблизно середній за розміром репозиторій цілком: вихідники, тести, конфіги та історія діалогу в одному запиті. Для агентних завдань із кодом це і є головний практичний сенс моделі.

GLM-5.2 для кодування: що показують бенчмарки та незалежні прогони

Кодування — те, заради чого GLM-5.2 передусім і зроблено. Слоган репозиторію Z.ai звучить буквально як «From Vibe Coding to Agentic Engineering». Розберемо, наскільки це підтверджується вимірами — і де закінчується вендорська цифра й починається незалежна.

Важливе застереження про нашу методику. У нас немає доступу до платного API, щоб прогнати GLM-5.2 на власних завданнях, тому ми не видаємо чужі результати за власний тест. Нижче — цифри з першоджерел (картка моделі, блог Z.ai, незалежний агрегатор Artificial Analysis) і спостереження практиків з атрибуцією. Де джерело вендорське, ми це позначаємо: заява розробника — не те саме, що незалежний вимір.

Зведення за бенчмарками кодування (дані на 16 червня 2026 року):

$3 млн+ TRADERS LEAGUE · SEASON 3$3 млн+Що довше зволікаєш — то важче наздогнати лідерів у таблицяхДолучайся до Ліги →
БенчмаркGLM-5.2Claude Opus 4.8GPT-5.5Тип джерела
SWE-bench Pro62,169,258,6вендор + картка HF
Terminal-Bench 2.181,085,084,0вендор (z.ai/blog)
FrontierSWE74,475,172,6незалежний (Proximal, виноска HF)
Artificial Analysis Intelligence Index51незалежний (AA)
GLM-5.2 на SWE-bench Pro проти Claude Opus 4.8 та GPT-5.5, червень 2026

Що з цього випливає. На SWE-bench Pro (репозиторні баг-фікси) GLM-5.2 обходить GPT-5.5, але поступається Claude Opus 4.8 близько 7 пунктів — тобто модель сильна, але не «вбивця» топового закритого флагмана. На FrontierSWE (довгі агентні завдання) розрив з Opus 4.8 скорочується до менш ніж 1 пункт (74,4 проти 75,1), а GPT-5.5 залишається позаду (72,6) — ось звідки теза «на крок від Claude». А на незалежному Artificial Analysis Intelligence Index (на 17 червня 2026) GLM-5.2 набрала 51 бал і стала найкращою open-weight моделлю у світі, випередивши MiniMax-M3 (44) і Kimi K2.6 (43).

Найцінніше — незалежні сліпі голосування, де люди порівнюють відповіді, не знаючи, яка модель їх дала. На Code Arena (за даними на 25 червня 2026) GLM-5.2 посіла 2-ге місце у світі з фронтенду та веброзробки з рейтингом Elo 1595 — поступившись лише Claude Fable 5 та випередивши всі варіанти Claude Opus. Сліпий тест важче «накрутити» під бенчмарк, тому це сильний сигнал саме про реальний код, а не про завчені відповіді.

Практики підтверджують картину, але з нюансами. Автор korben.info за підсумками тестів виніс GLM-5.2 прямо в заголовок огляду — «перша відкрита модель, яку я залишаю собі». Simon Willison в оцінці стриманіший: він вражений другим місцем моделі на Code Arena за повної відсутності зору й похвалив один зі своїх SVG-тестів («дуже вражає»), але на іншому відзначив регрес — «це такий крок назад порівняно з GLM-5.1». Тобто не однозначний захват, а «сильно, але із застереженнями». При цьому видання technology.org радить не вибір «або-або», а тактичний роутинг: основну масу завдань із кодом ганяти через GLM-5.2 задля економії, а на Claude Opus 4.8 ескалувати лише найскладніші repo-level фікси. Це, мабуть, найпрактичніший висновок з усіх оглядів.

Є й скепсис, який варто згадати. Частина спільноти (зокрема, Bindu Reddy) вважає, що модель «заточена під бенчмарки» (bench-maxxed) — тобто цифри красивіші за реальний досвід. Контраргумент дав аналітик Teortaxes: попередня GLM-5.1 показувала 0,0% на низці завдань, де 5.2 працює впевнено, тож прогрес реальний, а не лише табличний. Істина, як завжди, посередині: модель чудова для свого класу й ціни, але «китайська модель обійшла весь Захід» — спрощення.

Приклад: підключити GLM-5.2 у свій воркфлоу

Оскільки API Z.ai сумісний із форматом Anthropic, GLM-5.2 можна підключити прямо у звичний клієнт. Автор korben.info опублікував відтворюваний рецепт: підмінити в Claude Code адресу й токен через змінні оточення:

export ANTHROPIC_BASE_URL="https://api.z.ai/api/anthropic"
export ANTHROPIC_AUTH_TOKEN="<ваш_ключ_z.ai>"
claude

Після цього Claude Code працює поверх GLM-5.2. З практики є важливе застереження: розробники фіксували помилку HTTP 429 (код 1305) за деяких системних промптів у цьому проксі-режимі (баг-репорт від 23 червня 2026) — тобто режим «GLM через клієнт Anthropic» робочий, але не завжди стабільний на межових промптах.

ZCode — офіційне середовище розробки Z.ai

Найцікавіше в релізі GLM-5.2 — не лише модель, а й те, що Z.ai випустила під неї власний агентний harness (середовище-обгортку, яке дає моделі інструменти: файли, термінал, виконання коду). Називається він ZCode, і цілить він прямо в Claude Code від Anthropic — що відкрито підтвердив заголовок South China Morning Post «Zhipu випустила harness для GLM-5.2… цілить в Anthropic». Жоден зі знайдених нами оглядів не розбирає ZCode докладно, тож зупинимося на ньому окремо.

Що це. ZCode — десктопний агент-розробник. Починався у грудні 2025 року як форк VS Code, а до релізу GLM-5.2 виріс в окремий продукт (актуальна версія v3.2.2 на 1 липня 2026). На відміну від Claude Code, який живе в терміналі як CLI, ZCode — це повноцінний застосунок із графічним інтерфейсом.

Що вміє. Ключові функції:

  • Команда /goal — постановка високорівневої мети, яку агент сам розкладає на кроки й виконує в довгому ланцюжку (те саме «agentic engineering»).
  • SSH remote — робота з віддаленою машиною, зручно для серверної розробки.
  • Інтеграції з месенджерами — Telegram, WeChat, Feishu: агенту можна ставити завдання й отримувати звіти прямо в чат.

Чим відрізняється від Claude Code. Claude Code — мінімалістичний CLI, ZCode — «важкий» GUI-застосунок з ухилом у довгі (long-running) завдання та віддалену роботу. Важливе обмеження, яке підсвітила спільнота (баг-трекери, 22 червня 2026): у ZCode немає програмного CLI чи daemon-API — тобто автоматизувати сам ZCode як частину свого конвеєра поки не можна. Якщо потрібна автоматизація — підключайте GLM-5.2 безпосередньо через Anthropic-сумісний API (див. рецепт вище), а не через ZCode.

Сумісність зі сторонніми інструментами. Тут GLM-5.2 зіграла розумно: завдяки Anthropic-сумісному API модель з першого дня працює не лише в ZCode, а й у популярних сторонніх середовищах — Cline, Roo Code, Kilo Code, OpenClaw, а також доступна через агрегатор OpenRouter. Тобто переходити на ZCode необов’язково: можна залишитися у своєму інструменті й просто перемкнути модель. Для багатьох це і є головний аргумент — GLM-5.2 вбудовується туди, де ви вже працюєте.

Якщо хочеться порівняти підхід Z.ai з тим, як влаштований агент від Anthropic, стане в пригоді наш огляд Claude Sonnet 5 — там розібрано філософію «модель + інструменти», від якої ZCode відштовхується.

Ціна GLM 5.2: API та тарифи Coding Plan

Економіка — другий козир моделі після кодування. Тут важливо не плутати офіційну ціну API від Z.ai і ринкову ціну у сторонніх хостерів.

Офіційний прайс Z.ai (на 3 липня 2026 року): 1,40 долара за 1 млн вхідних токенів і 4,40 долара за 1 млн вихідних, кешоване введення — 0,26 долара. Для порівняння масштабу: Claude Opus 4.8 коштує в рази дорожче за той самий обсяг, і саме на цьому будується теза VentureBeat «обходить GPT-5.5 за кількома бенчмарками кодування за 1/6 ціни».

На OpenRouter і в незалежних провайдерів ціна нижча за офіційну — картка показує близько 0,93 долара за введення й 3,00 за виведення, медіана по 25 провайдерах — приблизно 1,20 і 4,10 долара. Це не помилка й не «сірий» доступ, а конкуренція хостерів, які самі розгортають відкриті ваги. Мінус — у стороннього провайдера свої політики логування, що важливо для приватності (про це в розділі ризиків).

Для тих, хто пише код щодня, цікавіший не поштучний API, а підписка. Тарифи GLM Coding Plan (за даними на 1 липня 2026 року):

ТарифЦіна/місПромо-ціна
Lite$18$12,60
Pro$72$50,40
Max$160$112

Підписка дає доступ до моделі через ZCode і сумісні інструменти з лімітами за обсягом — прямий аналог тарифних планів Claude Code, але помітно дешевший у верхньому сегменті.

Доступність з України. У жодному джерелі ми не знайшли даних про спеціальні регіональні блоки Z.ai для України, але й підтвердження гарантованої доступності теж немає. Реєстрація й оплата закордонною карткою технічно можливі; про всяк випадок практичний шлях — доступ через OpenRouter, який абстрагує і оплату, і провайдера. Перевіряти доступність і спосіб оплати варто на момент підключення.

Запустити GLM-5.2 локально: реалії

Відкриті ваги породжують резонне запитання — а чи можна запустити GLM-5.2 у себе й не платити за API взагалі? Технічно так, практично — це завдання для серйозного заліза, а не для домашнього ПК.

Причина проста: 744–753 млрд параметрів треба десь тримати. Розклад за пам’яттю (за даними Unsloth і незалежних оглядів на 3 липня 2026 року):

ФорматПотрібна пам’ятьЗастереження
1-bit (динамічний квант)~223 ГБ сумарної пам’ятіпомітна втрата якості
2-bit (UD-IQ2_M)~239 ГБкомпроміс якість/розмір
FP8~744 ГБ (8×H200/H20)серверний клас
BF16 (повна точність)~1,49 ТБ (8×H200)датацентр

Квантизація — це стиснення ваг моделі до меншої розрядності (з 16 біт до 8, 4, 2 чи навіть 1), щоб умістити її в менший обсяг пам’яті ціною частини точності. Навіть в агресивному 2-бітному кванті GLM-5.2 потребує близько 239 ГБ — це вже не одна відеокарта, а зв’язка чи потужна система з великим обсягом єдиної пам’яті. На типовому ігровому ПК із 24 ГБ VRAM повноцінно запустити флагман не вийде.

Якщо хочете розібратися в локальному запуску моделей GLM предметно — кванти, бекенди (vLLM, llama.cpp, SGLang), добір заліза — у нас є окремий докладний розбір: як запустити фронтир-моделі GLM на своєму ПК. Тут же висновок короткий: локальний запуск GLM-5.2 має сенс передусім для тих, у кого вимога не віддавати код назовні переважує вартість заліза; усім іншим дешевше й простіше хмарний API чи підписка.

GLM-5.2 проти Claude та інших: проти альтернатив

«Найкращої моделі взагалі» не буває — є найкраща під завдання й бюджет. Зведемо ключових конкурентів в одну таблицю (дані на 3 липня 2026 року):

МодельТипЦіна API (вхід/вихід за 1M)КодуванняЛіцензія
GLM-5.2open-weight, MoE$1,40 / $4,40дуже сильнеMIT
Claude Opus 4.8закритапомітно дорожчееталонвласницька
GPT-5.5закритадорожчедуже сильневласницька
DeepSeek-V4-Proopen-weightпорівнянно низькасильневідкрита
Kimi K2.6open-weightнизькасильневідкрита
Gemini 3.1 Proзакритасереднясильневласницька

Розстановка сил така. Проти Claude Opus 4.8 GLM-5.2 — це «90–95% якості за 15–20% ціни»: для потоку завдань вигідно, для найскладніших — Opus і далі еталон. Проти GPT-5.5 — паритет чи перевага на низці бенчмарків кодування за кратно меншої ціни. Усередині табору відкритих моделей головний спаринг — DeepSeek-V4-Pro: обидві дешеві й відкриті, GLM-5.2 зазвичай попереду з агентного кодування й має власний harness, DeepSeek сильний у міркуваннях і математиці.

Окремо для тих, хто дивиться саме на локальний запуск відкритих моделей: робочою «конячкою за замовчуванням» удома частіше називають не флагмани, а компактні моделі — наприклад, Qwen3 для локального ШІ, яка вміщується на споживче залізо. GLM-5.2 у цій лізі — не про «вдома», а про «сервер чи хмару».

Кому яку версію обрати

Зберемо рекомендації за сценаріями — без води.

  • Агенція фронтенду / продуктова команда. GLM-5.2 через Coding Plan чи ZCode — сильне кодування за невеликі гроші, а високий результат на Code Arena з вебу це підтверджує. Ескалація на Claude Opus 4.8 — лише на найважчих завданнях.
  • Стартап на бюджеті. Офіційний API чи OpenRouter, тактичний роутинг: потік — на GLM-5.2, рідкісні складні фікси — на топовий закритий флагман. Економія на рахунку за токени — кратна.
  • Регульована індустрія / держсектор / чутливі дані. Хмарний API Z.ai — не варіант через юрисдикцію (див. ризики). Припустимо лише за повного self-host на своїй інфраструктурі, а це дороге залізо.
  • Ентузіаст self-host. Готові до 239+ ГБ пам’яті й налаштування бекендів — можна ганяти локально в кванті; інакше простіше й дешевше хмара.
  • Завдання із зображеннями. GLM-5.2 не підходить взагалі — зору немає, потрібна інша модель.

Ризики й обмеження

Розділ ризиків для GLM-5.2 — це не формальність, а частина рішення. Тут кілька пунктів, які мейнстрим-огляди зазвичай замовчують.

Приватність даних за хмарного доступу. Це головний ризик. Z.ai — китайська компанія, а отже її інфраструктура підпадає під Закон КНР про національну розвідку (ст. 7), який зобов’язує організації сприяти органам держбезпеки. На це прямо вказували профільні видання (TechTimes, 17 червня 2026) та аналітики. Практичний висновок: код і дані, надіслані в хмарний API Z.ai (чи до стороннього хостера), варто вважати потенційно доступними третій стороні. Для самостійного запуску ваг це не застосовне — там дані не залишають вашу інфраструктуру. Саме тому межа «хмара проти self-host» для цієї моделі — не про зручність, а про безпеку.

Експортний контроль. Zhipu AI внесена до Entity List Бюро промисловості та безпеки США (BIS) ще в січні 2025 року — із презумпцією відмови в експортних ліцензіях. На використання відкритих ваг це безпосередньо не впливає, але це чинник для компаній, чутливих до комплаєнсу й роботи з американськими контрагентами.

Немає зору. GLM-5.2 працює лише з текстом. Мультимодальна GLM-5V-Turbo існує окремо, і у відкритому доступі її немає. Для завдань із картинками, скриншотами, діаграмами це жорстке обмеження — незалежні огляди (kie.ai) називають його «binding constraint» для автодослідницьких сценаріїв.

Скепсис до бенчмарків. Як зазначено вище, частина спільноти вважає частину заявлених цифр «заточеними під тести». Плюс окрема гігієна фактчекінгу: ми натрапили на сторонні агрегатори (наприклад, hokai.io), які публікують неправильні цифри — GPQA-Diamond там указаний як 80,3% за офіційних 91,2%, а в Claude Opus у тій самій таблиці занижений до ~74% замість 93,6%. Висновок для читача: звіряйте бенчмарки за першоджерелом, а не за красивими SEO-таблицями.

Галюцинації. За одним виміром (AA-Omniscience, у переказі kie.ai) рівень галюцинацій GLM-5.2 — близько 28% проти 67–95% у попередніх GLM-4.5/4.6, тобто помітне поліпшення. Застереження: це поодиноке джерело без незалежного підтвердження, тому сприймати цифру варто як орієнтир, а не як твердий факт.

FAQ

Що таке GLM-5.2 простими словами? Це велика мовна нейромережа від китайської лабораторії Z.ai із відкритими вагами під ліцензією MIT, що вийшла в червні 2026 року. Вона заточена під програмування та агентні завдання, а з кодування наближається до Claude Opus 4.8, коштуючи при цьому в рази дешевше.

GLM-5.2 справді кращий за Claude у коді? Не «кращий», а «майже врівень за частку ціни». На довгих агентних завданнях (FrontierSWE) розрив із Claude Opus 4.8 менший за один пункт, але на репозиторних фіксах (SWE-bench Pro) Opus попереду приблизно на 7 пунктів. Практичний підхід — потік завдань на GLM-5.2, найскладніші — на Claude.

Скільки коштує GLM 5.2? Офіційна ціна API Z.ai — 1,40 долара за 1 млн вхідних токенів і 4,40 за вихідні (на 3 липня 2026). Є підписка GLM Coding Plan: Lite близько 18, Pro 72 і Max 160 доларів на місяць. У сторонніх провайдерів на OpenRouter ціна буває нижчою за офіційну.

Що таке ZCode і чи потрібно на нього переходити? ZCode — офіційне десктопне середовище розробки Z.ai під GLM-5.2, аналог Claude Code, але у вигляді GUI-застосунку з командою /goal та віддаленою роботою по SSH. Переходити необов’язково: завдяки Anthropic-сумісному API GLM-5.2 працює й у Claude Code, Cline, Roo Code, Kilo Code.

Чи можна запустити GLM-5.2 на домашньому ПК? Повноцінно — ні. Навіть у 2-бітному кванті модель потребує близько 239 ГБ пам’яті, а в повній точності — до 1,49 ТБ. Це рівень сервера чи зв’язки відеокарт, а не ігрового ПК із 24 ГБ VRAM.

Чи безпечно віддавати код у GLM-5.2? Через хмарний API Z.ai — із застереженнями: інфраструктура під китайською юрисдикцією та Законом про нацрозвідку, тому чутливий код краще туди не надсилати. Безпечний шлях для приватних даних — self-hosting відкритих ваг на своїй інфраструктурі.

Поділитися
Зв'язатися:
Крипто- та data-аналітик, інженер-програміст (факультет комп'ютерних наук ХНУРЕ). В IT з 2008 року: адміністрував корпоративний моніторинг у «Vodafone Україна», сім років розробляв і просував веб-проєкти, п'ять років керував маркетингом на метриках — конверсія, CTR, ROI, LTV.Криптовалютними ринками займаюся з 2021 року: ончейн-метрики, токеноміка, макроекономічні індикатори. Розробив власну data-driven модель аналізу ринку на 30+ метрик. Стек — Python (pandas, NumPy, SciPy, matplotlib), математична статистика та EDA; збір і звірку даних автоматизую AI-агентами.Принцип — «Don't trust, verify»: кожна цифра перевірена за першоджерелом, ключові — щонайменше за двома незалежними; прогнози — лише сценарії з умовами. Теза без даних не публікується.