GLM-5.2 от Z.ai: open-weight флагман, который целит в Claude Code

23 мин. чтения
SpaceX за крипту
Bybit
SpaceX за крипту
Дробные доли · 24/7
Открыть рынок →

Коротко (TL;DR)

GLM-5.2 — флагманская языковая модель китайской лаборатории Z.ai (бывшая Zhipu AI), вышедшая в середине июня 2026 года с открытыми весами под лицензией MIT. Если убрать маркетинг, суть такая: это первая открытая модель, которая на длинных агентных задачах по коду подошла к Claude Opus 4.8 буквально на один шаг, а стоит по токенам в разы дешевле. Вместе с моделью Z.ai выпустила собственную среду разработки ZCode — прямой ответ Claude Code от Anthropic.

Кому подходит: командам и разработчикам, которые гоняют большой объём кодинг-агента и хотят срезать счёт за API, либо тем, у кого есть инфраструктура для самостоятельного хостинга и требование не отдавать код во внешнее облако. Кому не подходит: задачам с картинками (у модели нет зрения), а также командам в регулируемых отраслях и госсекторе — использование облачного API Z.ai означает, что данные проходят через инфраструктуру под китайской юрисдикцией. Главный конкурент по цене/качеству — DeepSeek-V4-Pro среди открытых и Claude Opus 4.8 среди закрытых.

Дальше — по фактам: архитектура, кодинг-бенчмарки с пометкой «вендор или независимый тест», разбор среды ZCode, тарифы, запуск локально, сравнение с альтернативами и риски.

Что такое GLM-5.2: архитектура, контекст, лицензия

GLM-5.2 — это большая языковая модель с архитектурой Mixture-of-Experts (MoE). Простыми словами: внутри модели много «экспертов»-подсетей, но на каждый запрос активируется лишь малая их часть. Это даёт качество крупной модели при стоимости вычислений небольшой. У GLM-5.2 активны около 40 млрд параметров из общего пула.

Смотришь матч без позиции? BYBIT · ЧМ ПО ФУТБОЛУСмотришь матч без позиции?Эмоции есть, заработка нет. Торгуй исход матча с плечом 5× — авто-расчёт по финальному свистку.Начать на Bybit →

С размером общего пула есть важный нюанс, который стоит проговорить сразу: официальные источники Z.ai расходятся сами с собой. GitHub-репозиторий и блог указывают «744B», а карточка модели на Hugging Face и большинство независимых обзоров (Simon Willison, VentureBeat, TechTimes) — «753B». Расхождение около 1,2%, скорее всего из-за разной методики подсчёта embedding-слоёв. Мы приводим оба значения, а не выбираем удобное — это как раз тот случай, когда даже первоисточник не идеален.

Ключевые характеристики (по данным на 3 июля 2026 года):

ПараметрЗначение
РазработчикZ.ai (Zhipu AI), Китай
Дата релиза13 июня 2026 (Coding Plan) / 16 июня 2026 (открытые веса)
АрхитектураMoE, ~744–753 млрд параметров всего, ~40 млрд активных
Контекст1 048 576 токенов (1M), макс. вывод 131 072
ЛицензияMIT (без региональных ограничений)
Модальностьтолько текст (зрения нет)
Весаоткрытые, на Hugging Face

Отдельно про лицензию MIT — это важный и часто неправильно понимаемый пункт. MIT разрешает коммерческое использование, дообучение и self-hosting без региональных ограничений и роялти. Но «открытые веса» не равно «полностью прозрачная модель»: обучающие данные и процесс Z.ai не раскрывает, поэтому проверить модель на предвзятость или закладки со стороны нельзя — можно только тестировать поведение. Заблуждение «open source = бесплатно и безопасно для любого применения» здесь не работает: бесплатны веса, а не инфраструктура для их запуска, и не аудит.

Контекстное окно в 1 миллион токенов — это примерно средний по размеру репозиторий целиком: исходники, тесты, конфиги и история диалога в одном запросе. Для агентных задач по коду это и есть главный практический смысл модели.

GLM-5.2 для кодинга: что показывают бенчмарки и независимые прогоны

Кодинг — то, ради чего GLM-5.2 в первую очередь и сделана. Слоган репозитория Z.ai звучит буквально как «From Vibe Coding to Agentic Engineering». Разберём, насколько это подтверждается измерениями — и где заканчивается вендорская цифра и начинается независимая.

Важная оговорка о нашей методике. У нас нет доступа к платному API, чтобы прогнать GLM-5.2 на собственных задачах, поэтому мы не выдаём чужие результаты за свой тест. Ниже — цифры с первоисточников (карточка модели, блог Z.ai, независимый агрегатор Artificial Analysis) и наблюдения практиков с атрибуцией. Где источник вендорский, мы это помечаем: заявление разработчика — не то же самое, что независимый замер.

Сводка по кодинг-бенчмаркам (данные на 16 июня 2026 года):

Крипта лежит — рынки растут Bybit TradFiКрипта лежит — рынки растутТоргуй акциями и индексами на Bybit. Новым — награды до 5 030 USDT.Начать на TradFi →
БенчмаркGLM-5.2Claude Opus 4.8GPT-5.5Тип источника
SWE-bench Pro62,169,258,6вендор + HF-карточка
Terminal-Bench 2.181,085,084,0вендор (z.ai/blog)
FrontierSWE74,475,172,6независимый (Proximal, сноска HF)
Artificial Analysis Intelligence Index51независимый (AA)
GLM-5.2 на SWE-bench Pro против Claude Opus 4.8 и GPT-5.5, июнь 2026

Что из этого следует. На SWE-bench Pro (репозиторные баг-фиксы) GLM-5.2 обходит GPT-5.5, но уступает Claude Opus 4.8 около 7 пунктов — то есть модель сильная, но не «убийца» топового закрытого флагмана. На FrontierSWE (длинные агентные задачи) разрыв с Opus 4.8 сокращается до менее чем 1 пункта (74,4 против 75,1), а GPT-5.5 остаётся позади (72,6) — вот откуда тезис «в шаге от Claude». А на независимом Artificial Analysis Intelligence Index (на 17 июня 2026) GLM-5.2 набрала 51 балл и стала лучшей open-weight моделью в мире, опередив MiniMax-M3 (44) и Kimi K2.6 (43).

Самое ценное — независимые слепые голосования, где люди сравнивают ответы, не зная, какая модель их дала. На Code Arena (по данным на 25 июня 2026) GLM-5.2 заняла 2-е место в мире по фронтенду и веб-разработке с рейтингом Elo 1595 — уступив только Claude Fable 5 и опередив все варианты Claude Opus. Слепой тест труднее «накрутить» под бенчмарк, поэтому это сильный сигнал именно про реальный код, а не про заученные ответы.

Практики подтверждают картину, но с нюансами. Автор korben.info по итогам тестов вынес GLM-5.2 прямо в заголовок обзора — «первая открытая модель, которую я оставляю себе». Simon Willison в оценке сдержаннее: он впечатлён вторым местом модели на Code Arena при полном отсутствии зрения и похвалил один из своих SVG-тестов («очень впечатляюще»), но на другом отметил регресс — «это такой шаг назад по сравнению с GLM-5.1». То есть не однозначный восторг, а «сильно, но с оговорками». При этом издание technology.org советует не выбор «или-или», а тактический роутинг: основную массу кодинг-задач гнать через GLM-5.2 ради экономии, а на Claude Opus 4.8 эскалировать только самые сложные repo-level фиксы. Это, пожалуй, самый практичный вывод из всех обзоров.

Есть и скепсис, который стоит упомянуть. Часть комьюнити (в частности, Bindu Reddy) считает, что модель «заточена под бенчмарки» (bench-maxxed) — то есть цифры красивее реального опыта. Контраргумент дал аналитик Teortaxes: предыдущая GLM-5.1 показывала 0,0% на ряде задач, где 5.2 работает уверенно, так что прогресс реальный, а не только табличный. Истина, как обычно, посередине: модель отличная для своего класса и цены, но «китайская модель обошла весь Запад» — упрощение.

Пример: подключить GLM-5.2 в свой воркфлоу

Поскольку API Z.ai совместим с форматом Anthropic, GLM-5.2 можно подключить прямо в привычный клиент. Автор korben.info опубликовал воспроизводимый рецепт: подменить в Claude Code адрес и токен через переменные окружения:

export ANTHROPIC_BASE_URL="https://api.z.ai/api/anthropic"
export ANTHROPIC_AUTH_TOKEN="<ваш_ключ_z.ai>"
claude

После этого Claude Code работает поверх GLM-5.2. Из практики есть важная оговорка: разработчики фиксировали ошибку HTTP 429 (код 1305) при некоторых системных промптах в этом прокси-режиме (баг-репорт от 23 июня 2026) — то есть режим «GLM через клиент Anthropic» рабочий, но не всегда стабильный на пограничных промптах.

ZCode — официальная среда разработки Z.ai

Самое интересное в релизе GLM-5.2 — не только модель, но и то, что Z.ai выпустила под неё собственный агентный harness (среду-обёртку, которая даёт модели инструменты: файлы, терминал, выполнение кода). Называется он ZCode, и метит он прямо в Claude Code от Anthropic — что открыто подтвердил заголовок South China Morning Post «Zhipu releases harness for GLM-5.2… takes aim at Anthropic». Ни один из найденных нами обзоров не разбирает ZCode подробно, поэтому остановимся на нём отдельно.

Что это. ZCode — десктопный агент-разработчик. Начинался в декабре 2025 года как форк VS Code, а к релизу GLM-5.2 вырос в отдельный продукт (актуальная версия v3.2.2 на 1 июля 2026). В отличие от Claude Code, который живёт в терминале как CLI, ZCode — это полноценное приложение с графическим интерфейсом.

Что умеет. Ключевые функции:

  • Команда /goal — постановка высокоуровневой цели, которую агент сам декомпозирует на шаги и выполняет в длинной цепочке (то самое «agentic engineering»).
  • SSH remote — работа с удалённой машиной, удобно для серверной разработки.
  • Интеграции с мессенджерами — Telegram, WeChat, Feishu: агенту можно ставить задачи и получать отчёты прямо в чат.

Чем отличается от Claude Code. Claude Code — минималистичный CLI, ZCode — «тяжёлое» GUI-приложение с уклоном в длительные (long-running) задачи и удалённую работу. Важное ограничение, которое подсветило сообщество (баг-трекеры, 22 июня 2026): у ZCode нет программного CLI или daemon-API — то есть автоматизировать сам ZCode как часть своего пайплайна пока нельзя. Если нужна автоматизация — подключайте GLM-5.2 напрямую через Anthropic-совместимый API (см. рецепт выше), а не через ZCode.

Совместимость с чужими инструментами. Здесь GLM-5.2 сыграла умно: благодаря Anthropic-совместимому API модель с первого дня работает не только в ZCode, но и в популярных сторонних средах — Cline, Roo Code, Kilo Code, OpenClaw, а также доступна через агрегатор OpenRouter. То есть переходить на ZCode необязательно: можно остаться в своём инструменте и просто переключить модель. Для многих это и есть главный аргумент — GLM-5.2 встраивается туда, где вы уже работаете.

Если хочется сравнить подход Z.ai с тем, как устроен агент от Anthropic, полезен наш обзор Claude Sonnet 5 — там разобрана философия «модель + инструменты», от которой ZCode отталкивается.

Цена GLM 5.2: API и тарифы Coding Plan

Экономика — второй козырь модели после кодинга. Здесь важно не путать официальную цену API от Z.ai и рыночную цену у сторонних хостеров.

Официальный прайс Z.ai (на 3 июля 2026 года): 1,40 доллара за 1 млн входных токенов и 4,40 доллара за 1 млн выходных, кэшированный ввод — 0,26 доллара. Для сравнения масштаба: Claude Opus 4.8 стоит в разы дороже за тот же объём, и именно на этом строится тезис VentureBeat «обходит GPT-5.5 по нескольким кодинг-бенчмаркам за 1/6 цены».

На OpenRouter и у независимых провайдеров цена ниже официальной — карточка показывает около 0,93 доллара за ввод и 3,00 за вывод, медиана по 25 провайдерам — примерно 1,20 и 4,10 доллара. Это не ошибка и не «серый» доступ, а конкуренция хостеров, которые сами разворачивают открытые веса. Минус — у стороннего провайдера свои политики логирования, что важно для приватности (об этом в разделе рисков).

Для тех, кто пишет код каждый день, интереснее не поштучный API, а подписка. Тарифы GLM Coding Plan (по данным на 1 июля 2026 года):

ТарифЦена/месПромо-цена
Lite$18$12,60
Pro$72$50,40
Max$160$112

Подписка даёт доступ к модели через ZCode и совместимые инструменты с лимитами по объёму — прямой аналог тарифных планов Claude Code, но заметно дешевле в верхнем сегменте.

Доступность из Украины. Ни в одном источнике мы не нашли данных о специальных региональных блоках Z.ai для Украины, но и подтверждения гарантированной доступности тоже нет. Регистрация и оплата зарубежной картой технически возможны; на всякий случай практичный путь — доступ через OpenRouter, который абстрагирует и оплату, и провайдера. Проверять доступность и способ оплаты стоит на момент подключения.

Запустить GLM-5.2 локально: реалии

Открытые веса рождают резонный вопрос — а можно ли запустить GLM-5.2 у себя и не платить за API вовсе? Технически да, практически — это задача для серьёзного железа, а не для домашнего ПК.

Причина проста: 744–753 млрд параметров надо где-то держать. Расклад по памяти (по данным Unsloth и независимых обзоров на 3 июля 2026 года):

ФорматТребуемая памятьОговорка
1-bit (динамический квант)~223 ГБ суммарной памятизаметная потеря качества
2-bit (UD-IQ2_M)~239 ГБкомпромисс качество/размер
FP8~744 ГБ (8×H200/H20)серверный класс
BF16 (полная точность)~1,49 ТБ (8×H200)датацентр

Квантизация — это сжатие весов модели до меньшей разрядности (с 16 бит до 8, 4, 2 или даже 1), чтобы уместить её в меньший объём памяти ценой части точности. Даже в агрессивном 2-битном кванте GLM-5.2 требует около 239 ГБ — это уже не одна видеокарта, а связка или мощная система с большим объёмом единой памяти. На типичном игровом ПК с 24 ГБ VRAM полноценно запустить флагман не выйдет.

Если хотите разобраться в локальном запуске моделей GLM предметно — кванты, бэкенды (vLLM, llama.cpp, SGLang), подбор железа — у нас есть отдельный подробный разбор: как запустить фронтир-модели GLM на своём ПК. Здесь же вывод короткий: локальный запуск GLM-5.2 имеет смысл прежде всего для тех, у кого требование не отдавать код наружу перевешивает стоимость железа; всем остальным дешевле и проще облачный API или подписка.

GLM-5.2 vs Claude и другие: против альтернатив

«Лучшей модели вообще» не бывает — есть лучшая под задачу и бюджет. Сведём ключевых конкурентов в одну таблицу (данные на 3 июля 2026 года):

МодельТипЦена API (вход/выход за 1M)КодингЛицензия
GLM-5.2open-weight, MoE$1,40 / $4,40очень сильныйMIT
Claude Opus 4.8закрытаязаметно дорожеэталонпроприетарная
GPT-5.5закрытаядорожеочень сильныйпроприетарная
DeepSeek-V4-Proopen-weightсопоставимо низкаясильныйоткрытая
Kimi K2.6open-weightнизкаясильныйоткрытая
Gemini 3.1 Proзакрытаясредняясильныйпроприетарная

Расстановка сил такая. Против Claude Opus 4.8 GLM-5.2 — это «90–95% качества за 15–20% цены»: для потока задач выгодно, для самых сложных — Opus всё ещё эталон. Против GPT-5.5 — паритет или преимущество на ряде кодинг-бенчмарков при кратно меньшей цене. Внутри лагеря открытых моделей главный спарринг — DeepSeek-V4-Pro: обе дешёвые и открытые, GLM-5.2 обычно впереди по агентному кодингу и имеет свой harness, DeepSeek силён в рассуждениях и математике.

Отдельно для тех, кто смотрит именно на локальный запуск открытых моделей: рабочей «лошадкой по умолчанию» дома чаще называют не флагманы, а компактные модели — например, Qwen3 для локального ИИ, которая помещается на потребительское железо. GLM-5.2 в этой лиге — не про «дома», а про «сервер или облако».

Кому какую версию выбрать

Соберём рекомендации по сценариям — без воды.

  • Агентство фронтенда / продуктовая команда. GLM-5.2 через Coding Plan или ZCode — сильный кодинг за небольшие деньги, а высокий результат на Code Arena по вебу это подтверждает. Эскалация на Claude Opus 4.8 — только на самых тяжёлых задачах.
  • Стартап на бюджете. Официальный API или OpenRouter, тактический роутинг: поток — на GLM-5.2, редкие сложные фиксы — на топовый закрытый флагман. Экономия на счёте за токены — кратная.
  • Регулируемая индустрия / госсектор / чувствительные данные. Облачный API Z.ai — не вариант из-за юрисдикции (см. риски). Допустимо только при полном self-host на своей инфраструктуре, а это дорогое железо.
  • Энтузиаст self-host. Готовы к 239+ ГБ памяти и настройке бэкендов — можно гонять локально в кванте; иначе проще и дешевле облако.
  • Задачи с изображениями. GLM-5.2 не подходит вовсе — зрения нет, нужна другая модель.

Риски и ограничения

Раздел рисков для GLM-5.2 — это не формальность, а часть решения. Здесь несколько пунктов, которые мейнстрим-обзоры обычно замалчивают.

Приватность данных при облачном доступе. Это главный риск. Z.ai — китайская компания, а значит её инфраструктура подпадает под Закон КНР о национальной разведке (ст. 7), который обязывает организации содействовать органам госбезопасности. На это прямо указывали профильные издания (TechTimes, 17 июня 2026) и аналитики. Практический вывод: код и данные, отправленные в облачный API Z.ai (или к стороннему хостеру), стоит считать потенциально доступными третьей стороне. Для самостоятельного запуска весов это неприменимо — там данные не покидают вашу инфраструктуру. Именно поэтому граница «облако против self-host» для этой модели — не про удобство, а про безопасность.

Экспортный контроль. Zhipu AI внесена в Entity List Бюро промышленности и безопасности США (BIS) ещё в январе 2025 года — с презумпцией отказа в экспортных лицензиях. На использование открытых весов это напрямую не влияет, но это фактор для компаний, чувствительных к комплаенсу и работе с американскими контрагентами.

Нет зрения. GLM-5.2 работает только с текстом. Мультимодальная GLM-5V-Turbo существует отдельно и в открытом доступе её нет. Для задач с картинками, скриншотами, диаграммами это жёсткое ограничение — независимые обзоры (kie.ai) называют его «binding constraint» для автоисследовательских сценариев.

Скепсис к бенчмаркам. Как отмечено выше, часть сообщества считает часть заявленных цифр «заточенными под тесты». Плюс отдельная гигиена факт-чекинга: мы наткнулись на сторонние агрегаторы (например, hokai.io), которые публикуют неверные цифры — GPQA-Diamond там указан как 80,3% при официальных 91,2%, а у Claude Opus в той же таблице занижен до ~74% вместо 93,6%. Вывод для читателя: сверяйте бенчмарки по первоисточнику, а не по красивым SEO-таблицам.

Галлюцинации. По одному замеру (AA-Omniscience, в пересказе kie.ai) уровень галлюцинаций GLM-5.2 — около 28% против 67–95% у предыдущих GLM-4.5/4.6, то есть заметное улучшение. Оговорка: это единичный источник без независимого подтверждения, поэтому воспринимать цифру стоит как ориентир, а не как твёрдый факт.

FAQ

Что такое GLM-5.2 простыми словами? Это большая языковая модель от китайской лаборатории Z.ai с открытыми весами под лицензией MIT, вышедшая в июне 2026 года. Она заточена под программирование и агентные задачи, а по кодингу приближается к Claude Opus 4.8, стоя при этом в разы дешевле.

GLM-5.2 действительно лучше Claude в коде? Не «лучше», а «почти вровень за долю цены». На длинных агентных задачах (FrontierSWE) разрыв с Claude Opus 4.8 меньше одного пункта, но на репозиторных фиксах (SWE-bench Pro) Opus впереди примерно на 7 пунктов. Практичный подход — поток задач на GLM-5.2, самые сложные — на Claude.

Сколько стоит GLM 5.2? Официальная цена API Z.ai — 1,40 доллара за 1 млн входных токенов и 4,40 за выходных (на 3 июля 2026). Есть подписка GLM Coding Plan: Lite около 18, Pro 72 и Max 160 долларов в месяц. У сторонних провайдеров на OpenRouter цена бывает ниже официальной.

Что такое ZCode и нужно ли на него переходить? ZCode — официальная десктопная среда разработки Z.ai под GLM-5.2, аналог Claude Code, но в виде GUI-приложения с командой /goal и удалённой работой по SSH. Переходить необязательно: благодаря Anthropic-совместимому API GLM-5.2 работает и в Claude Code, Cline, Roo Code, Kilo Code.

Можно ли запустить GLM-5.2 на домашнем ПК? Полноценно — нет. Даже в 2-битном кванте модель требует около 239 ГБ памяти, а в полной точности — до 1,49 ТБ. Это уровень сервера или связки видеокарт, а не игрового ПК с 24 ГБ VRAM.

Безопасно ли отдавать код в GLM-5.2? Через облачный API Z.ai — с оговорками: инфраструктура под китайской юрисдикцией и Законом о нацразведке, поэтому чувствительный код лучше туда не отправлять. Безопасный путь для приватных данных — self-hosting открытых весов на своей инфраструктуре.

Плечо 5× на исход матча
BYBIT · ЧМ ПО ФУТБОЛУ
Плечо 5× на исход матча
Первый в мире фьючерс на счёт матча. Авто-расчёт по финалу.
Торговать →
Поделиться
Связаться:
Крипто- и data-аналитик, инженер-программист (факультет компьютерных наук ХНУРЭ). В IT с 2008 года: администрировал корпоративный мониторинг в «Vodafone Украина», семь лет разрабатывал и продвигал веб-проекты, пять лет руководил маркетингом на метриках — конверсия, CTR, ROI, LTV.Криптовалютными рынками занимаюсь с 2021 года: ончейн-метрики, токеномика, макроэкономические индикаторы. Разработал собственную data-driven модель анализа рынка на 30+ метрик. Стек — Python (pandas, NumPy, SciPy, matplotlib), математическая статистика и EDA; сбор и сверку данных автоматизирую AI-агентами.Принцип — «Don't trust, verify»: каждая цифра проверена по первоисточнику, ключевые — минимум по двум независимым; прогнозы — только сценарии с условиями. Тезис без данных не публикуется.