GLM-5.2: обзор open-weight модели для кодинга

Коротко (TL;DR)

GLM-5.2 — флагманская языковая модель китайской лаборатории Z.ai (бывшая Zhipu AI), вышедшая в середине июня 2026 года с открытыми весами под лицензией MIT. Если убрать маркетинг, суть такая: это первая открытая модель, которая на длинных агентных задачах по коду подошла к Claude Opus 4.8 буквально на один шаг, а стоит по токенам в разы дешевле. Вместе с моделью Z.ai выпустила собственную среду разработки ZCode — прямой ответ Claude Code от Anthropic.

Коротко (TL;DR)
Что такое GLM-5.2: архитектура, контекст, лицензия
GLM-5.2 для кодинга: что показывают бенчмарки и независимые прогоны
ZCode — официальная среда разработки Z.ai
Цена GLM 5.2: API и тарифы Coding Plan
Запустить GLM-5.2 локально: реалии
GLM-5.2 vs Claude и другие: против альтернатив
Кому какую версию выбрать
Риски и ограничения
FAQ

Кому подходит: командам и разработчикам, которые гоняют большой объём кодинг-агента и хотят срезать счёт за API, либо тем, у кого есть инфраструктура для самостоятельного хостинга и требование не отдавать код во внешнее облако. Кому не подходит: задачам с картинками (у модели нет зрения), а также командам в регулируемых отраслях и госсекторе — использование облачного API Z.ai означает, что данные проходят через инфраструктуру под китайской юрисдикцией. Главный конкурент по цене/качеству — DeepSeek-V4-Pro среди открытых и Claude Opus 4.8 среди закрытых.

Дальше — по фактам: архитектура, кодинг-бенчмарки с пометкой «вендор или независимый тест», разбор среды ZCode, тарифы, запуск локально, сравнение с альтернативами и риски.

Что такое GLM-5.2: архитектура, контекст, лицензия

GLM-5.2 — это большая языковая модель с архитектурой Mixture-of-Experts (MoE). Простыми словами: внутри модели много «экспертов»-подсетей, но на каждый запрос активируется лишь малая их часть. Это даёт качество крупной модели при стоимости вычислений небольшой. У GLM-5.2 активны около 40 млрд параметров из общего пула.

Смотришь матч без позиции?

BYBIT · ЧМ ПО ФУТБОЛУСмотришь матч без позиции?Эмоции есть, заработка нет. Торгуй исход матча с плечом 5× — авто-расчёт по финальному свистку.Начать на Bybit →

С размером общего пула есть важный нюанс, который стоит проговорить сразу: официальные источники Z.ai расходятся сами с собой. GitHub-репозиторий и блог указывают «744B», а карточка модели на Hugging Face и большинство независимых обзоров (Simon Willison, VentureBeat, TechTimes) — «753B». Расхождение около 1,2%, скорее всего из-за разной методики подсчёта embedding-слоёв. Мы приводим оба значения, а не выбираем удобное — это как раз тот случай, когда даже первоисточник не идеален.

Ключевые характеристики (по данным на 3 июля 2026 года):

Параметр	Значение
Разработчик	Z.ai (Zhipu AI), Китай
Дата релиза	13 июня 2026 (Coding Plan) / 16 июня 2026 (открытые веса)
Архитектура	MoE, ~744–753 млрд параметров всего, ~40 млрд активных
Контекст	1 048 576 токенов (1M), макс. вывод 131 072
Лицензия	MIT (без региональных ограничений)
Модальность	только текст (зрения нет)
Веса	открытые, на Hugging Face

Отдельно про лицензию MIT — это важный и часто неправильно понимаемый пункт. MIT разрешает коммерческое использование, дообучение и self-hosting без региональных ограничений и роялти. Но «открытые веса» не равно «полностью прозрачная модель»: обучающие данные и процесс Z.ai не раскрывает, поэтому проверить модель на предвзятость или закладки со стороны нельзя — можно только тестировать поведение. Заблуждение «open source = бесплатно и безопасно для любого применения» здесь не работает: бесплатны веса, а не инфраструктура для их запуска, и не аудит.

Контекстное окно в 1 миллион токенов — это примерно средний по размеру репозиторий целиком: исходники, тесты, конфиги и история диалога в одном запросе. Для агентных задач по коду это и есть главный практический смысл модели.

GLM-5.2 для кодинга: что показывают бенчмарки и независимые прогоны

Кодинг — то, ради чего GLM-5.2 в первую очередь и сделана. Слоган репозитория Z.ai звучит буквально как «From Vibe Coding to Agentic Engineering». Разберём, насколько это подтверждается измерениями — и где заканчивается вендорская цифра и начинается независимая.

Важная оговорка о нашей методике. У нас нет доступа к платному API, чтобы прогнать GLM-5.2 на собственных задачах, поэтому мы не выдаём чужие результаты за свой тест. Ниже — цифры с первоисточников (карточка модели, блог Z.ai, независимый агрегатор Artificial Analysis) и наблюдения практиков с атрибуцией. Где источник вендорский, мы это помечаем: заявление разработчика — не то же самое, что независимый замер.

Сводка по кодинг-бенчмаркам (данные на 16 июня 2026 года):

Крипта лежит — рынки растут

Bybit TradFiКрипта лежит — рынки растутТоргуй акциями и индексами на Bybit. Новым — награды до 5 030 USDT.Начать на TradFi →

Бенчмарк	GLM-5.2	Claude Opus 4.8	GPT-5.5	Тип источника
SWE-bench Pro	62,1	69,2	58,6	вендор + HF-карточка
Terminal-Bench 2.1	81,0	85,0	84,0	вендор (z.ai/blog)
FrontierSWE	74,4	75,1	72,6	независимый (Proximal, сноска HF)
Artificial Analysis Intelligence Index	51	—	—	независимый (AA)

GLM-5.2 на SWE-bench Pro против Claude Opus 4.8 и GPT-5.5, июнь 2026

Что из этого следует. На SWE-bench Pro (репозиторные баг-фиксы) GLM-5.2 обходит GPT-5.5, но уступает Claude Opus 4.8 около 7 пунктов — то есть модель сильная, но не «убийца» топового закрытого флагмана. На FrontierSWE (длинные агентные задачи) разрыв с Opus 4.8 сокращается до менее чем 1 пункта (74,4 против 75,1), а GPT-5.5 остаётся позади (72,6) — вот откуда тезис «в шаге от Claude». А на независимом Artificial Analysis Intelligence Index (на 17 июня 2026) GLM-5.2 набрала 51 балл и стала лучшей open-weight моделью в мире, опередив MiniMax-M3 (44) и Kimi K2.6 (43).

Самое ценное — независимые слепые голосования, где люди сравнивают ответы, не зная, какая модель их дала. На Code Arena (по данным на 25 июня 2026) GLM-5.2 заняла 2-е место в мире по фронтенду и веб-разработке с рейтингом Elo 1595 — уступив только Claude Fable 5 и опередив все варианты Claude Opus. Слепой тест труднее «накрутить» под бенчмарк, поэтому это сильный сигнал именно про реальный код, а не про заученные ответы.

Практики подтверждают картину, но с нюансами. Автор korben.info по итогам тестов вынес GLM-5.2 прямо в заголовок обзора — «первая открытая модель, которую я оставляю себе». Simon Willison в оценке сдержаннее: он впечатлён вторым местом модели на Code Arena при полном отсутствии зрения и похвалил один из своих SVG-тестов («очень впечатляюще»), но на другом отметил регресс — «это такой шаг назад по сравнению с GLM-5.1». То есть не однозначный восторг, а «сильно, но с оговорками». При этом издание technology.org советует не выбор «или-или», а тактический роутинг: основную массу кодинг-задач гнать через GLM-5.2 ради экономии, а на Claude Opus 4.8 эскалировать только самые сложные repo-level фиксы. Это, пожалуй, самый практичный вывод из всех обзоров.

Есть и скепсис, который стоит упомянуть. Часть комьюнити (в частности, Bindu Reddy) считает, что модель «заточена под бенчмарки» (bench-maxxed) — то есть цифры красивее реального опыта. Контраргумент дал аналитик Teortaxes: предыдущая GLM-5.1 показывала 0,0% на ряде задач, где 5.2 работает уверенно, так что прогресс реальный, а не только табличный. Истина, как обычно, посередине: модель отличная для своего класса и цены, но «китайская модель обошла весь Запад» — упрощение.

Пример: подключить GLM-5.2 в свой воркфлоу

Поскольку API Z.ai совместим с форматом Anthropic, GLM-5.2 можно подключить прямо в привычный клиент. Автор korben.info опубликовал воспроизводимый рецепт: подменить в Claude Code адрес и токен через переменные окружения:

export ANTHROPIC_BASE_URL="https://api.z.ai/api/anthropic"
export ANTHROPIC_AUTH_TOKEN="<ваш_ключ_z.ai>"
claude

После этого Claude Code работает поверх GLM-5.2. Из практики есть важная оговорка: разработчики фиксировали ошибку HTTP 429 (код 1305) при некоторых системных промптах в этом прокси-режиме (баг-репорт от 23 июня 2026) — то есть режим «GLM через клиент Anthropic» рабочий, но не всегда стабильный на пограничных промптах.

ZCode — официальная среда разработки Z.ai

Самое интересное в релизе GLM-5.2 — не только модель, но и то, что Z.ai выпустила под неё собственный агентный harness (среду-обёртку, которая даёт модели инструменты: файлы, терминал, выполнение кода). Называется он ZCode, и метит он прямо в Claude Code от Anthropic — что открыто подтвердил заголовок South China Morning Post «Zhipu releases harness for GLM-5.2… takes aim at Anthropic». Ни один из найденных нами обзоров не разбирает ZCode подробно, поэтому остановимся на нём отдельно.

Что это. ZCode — десктопный агент-разработчик. Начинался в декабре 2025 года как форк VS Code, а к релизу GLM-5.2 вырос в отдельный продукт (актуальная версия v3.2.2 на 1 июля 2026). В отличие от Claude Code, который живёт в терминале как CLI, ZCode — это полноценное приложение с графическим интерфейсом.

Что умеет. Ключевые функции:

Команда /goal — постановка высокоуровневой цели, которую агент сам декомпозирует на шаги и выполняет в длинной цепочке (то самое «agentic engineering»).
SSH remote — работа с удалённой машиной, удобно для серверной разработки.
Интеграции с мессенджерами — Telegram, WeChat, Feishu: агенту можно ставить задачи и получать отчёты прямо в чат.

Чем отличается от Claude Code. Claude Code — минималистичный CLI, ZCode — «тяжёлое» GUI-приложение с уклоном в длительные (long-running) задачи и удалённую работу. Важное ограничение, которое подсветило сообщество (баг-трекеры, 22 июня 2026): у ZCode нет программного CLI или daemon-API — то есть автоматизировать сам ZCode как часть своего пайплайна пока нельзя. Если нужна автоматизация — подключайте GLM-5.2 напрямую через Anthropic-совместимый API (см. рецепт выше), а не через ZCode.

Совместимость с чужими инструментами. Здесь GLM-5.2 сыграла умно: благодаря Anthropic-совместимому API модель с первого дня работает не только в ZCode, но и в популярных сторонних средах — Cline, Roo Code, Kilo Code, OpenClaw, а также доступна через агрегатор OpenRouter. То есть переходить на ZCode необязательно: можно остаться в своём инструменте и просто переключить модель. Для многих это и есть главный аргумент — GLM-5.2 встраивается туда, где вы уже работаете.

Если хочется сравнить подход Z.ai с тем, как устроен агент от Anthropic, полезен наш обзор Claude Sonnet 5 — там разобрана философия «модель + инструменты», от которой ZCode отталкивается.

Цена GLM 5.2: API и тарифы Coding Plan

Экономика — второй козырь модели после кодинга. Здесь важно не путать официальную цену API от Z.ai и рыночную цену у сторонних хостеров.

Официальный прайс Z.ai (на 3 июля 2026 года): 1,40 доллара за 1 млн входных токенов и 4,40 доллара за 1 млн выходных, кэшированный ввод — 0,26 доллара. Для сравнения масштаба: Claude Opus 4.8 стоит в разы дороже за тот же объём, и именно на этом строится тезис VentureBeat «обходит GPT-5.5 по нескольким кодинг-бенчмаркам за 1/6 цены».

На OpenRouter и у независимых провайдеров цена ниже официальной — карточка показывает около 0,93 доллара за ввод и 3,00 за вывод, медиана по 25 провайдерам — примерно 1,20 и 4,10 доллара. Это не ошибка и не «серый» доступ, а конкуренция хостеров, которые сами разворачивают открытые веса. Минус — у стороннего провайдера свои политики логирования, что важно для приватности (об этом в разделе рисков).

Для тех, кто пишет код каждый день, интереснее не поштучный API, а подписка. Тарифы GLM Coding Plan (по данным на 1 июля 2026 года):

Тариф	Цена/мес	Промо-цена
Lite	$18	$12,60
Pro	$72	$50,40
Max	$160	$112

Подписка даёт доступ к модели через ZCode и совместимые инструменты с лимитами по объёму — прямой аналог тарифных планов Claude Code, но заметно дешевле в верхнем сегменте.

Доступность из Украины. Ни в одном источнике мы не нашли данных о специальных региональных блоках Z.ai для Украины, но и подтверждения гарантированной доступности тоже нет. Регистрация и оплата зарубежной картой технически возможны; на всякий случай практичный путь — доступ через OpenRouter, который абстрагирует и оплату, и провайдера. Проверять доступность и способ оплаты стоит на момент подключения.

Запустить GLM-5.2 локально: реалии

Открытые веса рождают резонный вопрос — а можно ли запустить GLM-5.2 у себя и не платить за API вовсе? Технически да, практически — это задача для серьёзного железа, а не для домашнего ПК.

Причина проста: 744–753 млрд параметров надо где-то держать. Расклад по памяти (по данным Unsloth и независимых обзоров на 3 июля 2026 года):

Формат	Требуемая память	Оговорка
1-bit (динамический квант)	~223 ГБ суммарной памяти	заметная потеря качества
2-bit (UD-IQ2_M)	~239 ГБ	компромисс качество/размер
FP8	~744 ГБ (8×H200/H20)	серверный класс
BF16 (полная точность)	~1,49 ТБ (8×H200)	датацентр

Квантизация — это сжатие весов модели до меньшей разрядности (с 16 бит до 8, 4, 2 или даже 1), чтобы уместить её в меньший объём памяти ценой части точности. Даже в агрессивном 2-битном кванте GLM-5.2 требует около 239 ГБ — это уже не одна видеокарта, а связка или мощная система с большим объёмом единой памяти. На типичном игровом ПК с 24 ГБ VRAM полноценно запустить флагман не выйдет.

Если хотите разобраться в локальном запуске моделей GLM предметно — кванты, бэкенды (vLLM, llama.cpp, SGLang), подбор железа — у нас есть отдельный подробный разбор: как запустить фронтир-модели GLM на своём ПК. Здесь же вывод короткий: локальный запуск GLM-5.2 имеет смысл прежде всего для тех, у кого требование не отдавать код наружу перевешивает стоимость железа; всем остальным дешевле и проще облачный API или подписка.

GLM-5.2 vs Claude и другие: против альтернатив

«Лучшей модели вообще» не бывает — есть лучшая под задачу и бюджет. Сведём ключевых конкурентов в одну таблицу (данные на 3 июля 2026 года):

Модель	Тип	Цена API (вход/выход за 1M)	Кодинг	Лицензия
GLM-5.2	open-weight, MoE	$1,40 / $4,40	очень сильный	MIT
Claude Opus 4.8	закрытая	заметно дороже	эталон	проприетарная
GPT-5.5	закрытая	дороже	очень сильный	проприетарная
DeepSeek-V4-Pro	open-weight	сопоставимо низкая	сильный	открытая
Kimi K2.6	open-weight	низкая	сильный	открытая
Gemini 3.1 Pro	закрытая	средняя	сильный	проприетарная

Расстановка сил такая. Против Claude Opus 4.8 GLM-5.2 — это «90–95% качества за 15–20% цены»: для потока задач выгодно, для самых сложных — Opus всё ещё эталон. Против GPT-5.5 — паритет или преимущество на ряде кодинг-бенчмарков при кратно меньшей цене. Внутри лагеря открытых моделей главный спарринг — DeepSeek-V4-Pro: обе дешёвые и открытые, GLM-5.2 обычно впереди по агентному кодингу и имеет свой harness, DeepSeek силён в рассуждениях и математике.

Отдельно для тех, кто смотрит именно на локальный запуск открытых моделей: рабочей «лошадкой по умолчанию» дома чаще называют не флагманы, а компактные модели — например, Qwen3 для локального ИИ, которая помещается на потребительское железо. GLM-5.2 в этой лиге — не про «дома», а про «сервер или облако».

Кому какую версию выбрать

Соберём рекомендации по сценариям — без воды.

Агентство фронтенда / продуктовая команда. GLM-5.2 через Coding Plan или ZCode — сильный кодинг за небольшие деньги, а высокий результат на Code Arena по вебу это подтверждает. Эскалация на Claude Opus 4.8 — только на самых тяжёлых задачах.
Стартап на бюджете. Официальный API или OpenRouter, тактический роутинг: поток — на GLM-5.2, редкие сложные фиксы — на топовый закрытый флагман. Экономия на счёте за токены — кратная.
Регулируемая индустрия / госсектор / чувствительные данные. Облачный API Z.ai — не вариант из-за юрисдикции (см. риски). Допустимо только при полном self-host на своей инфраструктуре, а это дорогое железо.
Энтузиаст self-host. Готовы к 239+ ГБ памяти и настройке бэкендов — можно гонять локально в кванте; иначе проще и дешевле облако.
Задачи с изображениями. GLM-5.2 не подходит вовсе — зрения нет, нужна другая модель.

Риски и ограничения

Раздел рисков для GLM-5.2 — это не формальность, а часть решения. Здесь несколько пунктов, которые мейнстрим-обзоры обычно замалчивают.

Приватность данных при облачном доступе. Это главный риск. Z.ai — китайская компания, а значит её инфраструктура подпадает под Закон КНР о национальной разведке (ст. 7), который обязывает организации содействовать органам госбезопасности. На это прямо указывали профильные издания (TechTimes, 17 июня 2026) и аналитики. Практический вывод: код и данные, отправленные в облачный API Z.ai (или к стороннему хостеру), стоит считать потенциально доступными третьей стороне. Для самостоятельного запуска весов это неприменимо — там данные не покидают вашу инфраструктуру. Именно поэтому граница «облако против self-host» для этой модели — не про удобство, а про безопасность.

Экспортный контроль. Zhipu AI внесена в Entity List Бюро промышленности и безопасности США (BIS) ещё в январе 2025 года — с презумпцией отказа в экспортных лицензиях. На использование открытых весов это напрямую не влияет, но это фактор для компаний, чувствительных к комплаенсу и работе с американскими контрагентами.

Нет зрения. GLM-5.2 работает только с текстом. Мультимодальная GLM-5V-Turbo существует отдельно и в открытом доступе её нет. Для задач с картинками, скриншотами, диаграммами это жёсткое ограничение — независимые обзоры (kie.ai) называют его «binding constraint» для автоисследовательских сценариев.

Скепсис к бенчмаркам. Как отмечено выше, часть сообщества считает часть заявленных цифр «заточенными под тесты». Плюс отдельная гигиена факт-чекинга: мы наткнулись на сторонние агрегаторы (например, hokai.io), которые публикуют неверные цифры — GPQA-Diamond там указан как 80,3% при официальных 91,2%, а у Claude Opus в той же таблице занижен до ~74% вместо 93,6%. Вывод для читателя: сверяйте бенчмарки по первоисточнику, а не по красивым SEO-таблицам.

Галлюцинации. По одному замеру (AA-Omniscience, в пересказе kie.ai) уровень галлюцинаций GLM-5.2 — около 28% против 67–95% у предыдущих GLM-4.5/4.6, то есть заметное улучшение. Оговорка: это единичный источник без независимого подтверждения, поэтому воспринимать цифру стоит как ориентир, а не как твёрдый факт.

FAQ

Что такое GLM-5.2 простыми словами? Это большая языковая модель от китайской лаборатории Z.ai с открытыми весами под лицензией MIT, вышедшая в июне 2026 года. Она заточена под программирование и агентные задачи, а по кодингу приближается к Claude Opus 4.8, стоя при этом в разы дешевле.

GLM-5.2 действительно лучше Claude в коде? Не «лучше», а «почти вровень за долю цены». На длинных агентных задачах (FrontierSWE) разрыв с Claude Opus 4.8 меньше одного пункта, но на репозиторных фиксах (SWE-bench Pro) Opus впереди примерно на 7 пунктов. Практичный подход — поток задач на GLM-5.2, самые сложные — на Claude.

Сколько стоит GLM 5.2? Официальная цена API Z.ai — 1,40 доллара за 1 млн входных токенов и 4,40 за выходных (на 3 июля 2026). Есть подписка GLM Coding Plan: Lite около 18, Pro 72 и Max 160 долларов в месяц. У сторонних провайдеров на OpenRouter цена бывает ниже официальной.

Что такое ZCode и нужно ли на него переходить? ZCode — официальная десктопная среда разработки Z.ai под GLM-5.2, аналог Claude Code, но в виде GUI-приложения с командой /goal и удалённой работой по SSH. Переходить необязательно: благодаря Anthropic-совместимому API GLM-5.2 работает и в Claude Code, Cline, Roo Code, Kilo Code.

Можно ли запустить GLM-5.2 на домашнем ПК? Полноценно — нет. Даже в 2-битном кванте модель требует около 239 ГБ памяти, а в полной точности — до 1,49 ТБ. Это уровень сервера или связки видеокарт, а не игрового ПК с 24 ГБ VRAM.

Безопасно ли отдавать код в GLM-5.2? Через облачный API Z.ai — с оговорками: инфраструктура под китайской юрисдикцией и Законом о нацразведке, поэтому чувствительный код лучше туда не отправлять. Безопасный путь для приватных данных — self-hosting открытых весов на своей инфраструктуре.