Коротко (TL;DR)
GLM-5.2 — флагманская языковая модель китайской лаборатории Z.ai (бывшая Zhipu AI), вышедшая в середине июня 2026 года с открытыми весами под лицензией MIT. Если убрать маркетинг, суть такая: это первая открытая модель, которая на длинных агентных задачах по коду подошла к Claude Opus 4.8 буквально на один шаг, а стоит по токенам в разы дешевле. Вместе с моделью Z.ai выпустила собственную среду разработки ZCode — прямой ответ Claude Code от Anthropic.
- Коротко (TL;DR)
- Что такое GLM-5.2: архитектура, контекст, лицензия
- GLM-5.2 для кодинга: что показывают бенчмарки и независимые прогоны
- ZCode — официальная среда разработки Z.ai
- Цена GLM 5.2: API и тарифы Coding Plan
- Запустить GLM-5.2 локально: реалии
- GLM-5.2 vs Claude и другие: против альтернатив
- Кому какую версию выбрать
- Риски и ограничения
- FAQ
Кому подходит: командам и разработчикам, которые гоняют большой объём кодинг-агента и хотят срезать счёт за API, либо тем, у кого есть инфраструктура для самостоятельного хостинга и требование не отдавать код во внешнее облако. Кому не подходит: задачам с картинками (у модели нет зрения), а также командам в регулируемых отраслях и госсекторе — использование облачного API Z.ai означает, что данные проходят через инфраструктуру под китайской юрисдикцией. Главный конкурент по цене/качеству — DeepSeek-V4-Pro среди открытых и Claude Opus 4.8 среди закрытых.
Дальше — по фактам: архитектура, кодинг-бенчмарки с пометкой «вендор или независимый тест», разбор среды ZCode, тарифы, запуск локально, сравнение с альтернативами и риски.
Что такое GLM-5.2: архитектура, контекст, лицензия
GLM-5.2 — это большая языковая модель с архитектурой Mixture-of-Experts (MoE). Простыми словами: внутри модели много «экспертов»-подсетей, но на каждый запрос активируется лишь малая их часть. Это даёт качество крупной модели при стоимости вычислений небольшой. У GLM-5.2 активны около 40 млрд параметров из общего пула.
С размером общего пула есть важный нюанс, который стоит проговорить сразу: официальные источники Z.ai расходятся сами с собой. GitHub-репозиторий и блог указывают «744B», а карточка модели на Hugging Face и большинство независимых обзоров (Simon Willison, VentureBeat, TechTimes) — «753B». Расхождение около 1,2%, скорее всего из-за разной методики подсчёта embedding-слоёв. Мы приводим оба значения, а не выбираем удобное — это как раз тот случай, когда даже первоисточник не идеален.
Ключевые характеристики (по данным на 3 июля 2026 года):Параметр Значение Разработчик Z.ai (Zhipu AI), Китай Дата релиза 13 июня 2026 (Coding Plan) / 16 июня 2026 (открытые веса) Архитектура MoE, ~744–753 млрд параметров всего, ~40 млрд активных Контекст 1 048 576 токенов (1M), макс. вывод 131 072 Лицензия MIT (без региональных ограничений) Модальность только текст (зрения нет) Веса открытые, на Hugging Face
Отдельно про лицензию MIT — это важный и часто неправильно понимаемый пункт. MIT разрешает коммерческое использование, дообучение и self-hosting без региональных ограничений и роялти. Но «открытые веса» не равно «полностью прозрачная модель»: обучающие данные и процесс Z.ai не раскрывает, поэтому проверить модель на предвзятость или закладки со стороны нельзя — можно только тестировать поведение. Заблуждение «open source = бесплатно и безопасно для любого применения» здесь не работает: бесплатны веса, а не инфраструктура для их запуска, и не аудит.
Контекстное окно в 1 миллион токенов — это примерно средний по размеру репозиторий целиком: исходники, тесты, конфиги и история диалога в одном запросе. Для агентных задач по коду это и есть главный практический смысл модели.
GLM-5.2 для кодинга: что показывают бенчмарки и независимые прогоны
Кодинг — то, ради чего GLM-5.2 в первую очередь и сделана. Слоган репозитория Z.ai звучит буквально как «From Vibe Coding to Agentic Engineering». Разберём, насколько это подтверждается измерениями — и где заканчивается вендорская цифра и начинается независимая.
Важная оговорка о нашей методике. У нас нет доступа к платному API, чтобы прогнать GLM-5.2 на собственных задачах, поэтому мы не выдаём чужие результаты за свой тест. Ниже — цифры с первоисточников (карточка модели, блог Z.ai, независимый агрегатор Artificial Analysis) и наблюдения практиков с атрибуцией. Где источник вендорский, мы это помечаем: заявление разработчика — не то же самое, что независимый замер.
Сводка по кодинг-бенчмаркам (данные на 16 июня 2026 года):
| Бенчмарк | GLM-5.2 | Claude Opus 4.8 | GPT-5.5 | Тип источника |
|---|---|---|---|---|
| SWE-bench Pro | 62,1 | 69,2 | 58,6 | вендор + HF-карточка |
| Terminal-Bench 2.1 | 81,0 | 85,0 | 84,0 | вендор (z.ai/blog) |
| FrontierSWE | 74,4 | 75,1 | 72,6 | независимый (Proximal, сноска HF) |
| Artificial Analysis Intelligence Index | 51 | — | — | независимый (AA) |

Что из этого следует. На SWE-bench Pro (репозиторные баг-фиксы) GLM-5.2 обходит GPT-5.5, но уступает Claude Opus 4.8 около 7 пунктов — то есть модель сильная, но не «убийца» топового закрытого флагмана. На FrontierSWE (длинные агентные задачи) разрыв с Opus 4.8 сокращается до менее чем 1 пункта (74,4 против 75,1), а GPT-5.5 остаётся позади (72,6) — вот откуда тезис «в шаге от Claude». А на независимом Artificial Analysis Intelligence Index (на 17 июня 2026) GLM-5.2 набрала 51 балл и стала лучшей open-weight моделью в мире, опередив MiniMax-M3 (44) и Kimi K2.6 (43).
Самое ценное — независимые слепые голосования, где люди сравнивают ответы, не зная, какая модель их дала. На Code Arena (по данным на 25 июня 2026) GLM-5.2 заняла 2-е место в мире по фронтенду и веб-разработке с рейтингом Elo 1595 — уступив только Claude Fable 5 и опередив все варианты Claude Opus. Слепой тест труднее «накрутить» под бенчмарк, поэтому это сильный сигнал именно про реальный код, а не про заученные ответы.
Практики подтверждают картину, но с нюансами. Автор korben.info по итогам тестов вынес GLM-5.2 прямо в заголовок обзора — «первая открытая модель, которую я оставляю себе». Simon Willison в оценке сдержаннее: он впечатлён вторым местом модели на Code Arena при полном отсутствии зрения и похвалил один из своих SVG-тестов («очень впечатляюще»), но на другом отметил регресс — «это такой шаг назад по сравнению с GLM-5.1». То есть не однозначный восторг, а «сильно, но с оговорками». При этом издание technology.org советует не выбор «или-или», а тактический роутинг: основную массу кодинг-задач гнать через GLM-5.2 ради экономии, а на Claude Opus 4.8 эскалировать только самые сложные repo-level фиксы. Это, пожалуй, самый практичный вывод из всех обзоров.
Есть и скепсис, который стоит упомянуть. Часть комьюнити (в частности, Bindu Reddy) считает, что модель «заточена под бенчмарки» (bench-maxxed) — то есть цифры красивее реального опыта. Контраргумент дал аналитик Teortaxes: предыдущая GLM-5.1 показывала 0,0% на ряде задач, где 5.2 работает уверенно, так что прогресс реальный, а не только табличный. Истина, как обычно, посередине: модель отличная для своего класса и цены, но «китайская модель обошла весь Запад» — упрощение.
Пример: подключить GLM-5.2 в свой воркфлоу
Поскольку API Z.ai совместим с форматом Anthropic, GLM-5.2 можно подключить прямо в привычный клиент. Автор korben.info опубликовал воспроизводимый рецепт: подменить в Claude Code адрес и токен через переменные окружения:
export ANTHROPIC_BASE_URL="https://api.z.ai/api/anthropic"
export ANTHROPIC_AUTH_TOKEN="<ваш_ключ_z.ai>"
claude
После этого Claude Code работает поверх GLM-5.2. Из практики есть важная оговорка: разработчики фиксировали ошибку HTTP 429 (код 1305) при некоторых системных промптах в этом прокси-режиме (баг-репорт от 23 июня 2026) — то есть режим «GLM через клиент Anthropic» рабочий, но не всегда стабильный на пограничных промптах.
ZCode — официальная среда разработки Z.ai
Самое интересное в релизе GLM-5.2 — не только модель, но и то, что Z.ai выпустила под неё собственный агентный harness (среду-обёртку, которая даёт модели инструменты: файлы, терминал, выполнение кода). Называется он ZCode, и метит он прямо в Claude Code от Anthropic — что открыто подтвердил заголовок South China Morning Post «Zhipu releases harness for GLM-5.2… takes aim at Anthropic». Ни один из найденных нами обзоров не разбирает ZCode подробно, поэтому остановимся на нём отдельно.
Что это. ZCode — десктопный агент-разработчик. Начинался в декабре 2025 года как форк VS Code, а к релизу GLM-5.2 вырос в отдельный продукт (актуальная версия v3.2.2 на 1 июля 2026). В отличие от Claude Code, который живёт в терминале как CLI, ZCode — это полноценное приложение с графическим интерфейсом.
Что умеет. Ключевые функции:
- Команда
/goal— постановка высокоуровневой цели, которую агент сам декомпозирует на шаги и выполняет в длинной цепочке (то самое «agentic engineering»). - SSH remote — работа с удалённой машиной, удобно для серверной разработки.
- Интеграции с мессенджерами — Telegram, WeChat, Feishu: агенту можно ставить задачи и получать отчёты прямо в чат.
Чем отличается от Claude Code. Claude Code — минималистичный CLI, ZCode — «тяжёлое» GUI-приложение с уклоном в длительные (long-running) задачи и удалённую работу. Важное ограничение, которое подсветило сообщество (баг-трекеры, 22 июня 2026): у ZCode нет программного CLI или daemon-API — то есть автоматизировать сам ZCode как часть своего пайплайна пока нельзя. Если нужна автоматизация — подключайте GLM-5.2 напрямую через Anthropic-совместимый API (см. рецепт выше), а не через ZCode.
Совместимость с чужими инструментами. Здесь GLM-5.2 сыграла умно: благодаря Anthropic-совместимому API модель с первого дня работает не только в ZCode, но и в популярных сторонних средах — Cline, Roo Code, Kilo Code, OpenClaw, а также доступна через агрегатор OpenRouter. То есть переходить на ZCode необязательно: можно остаться в своём инструменте и просто переключить модель. Для многих это и есть главный аргумент — GLM-5.2 встраивается туда, где вы уже работаете.
Если хочется сравнить подход Z.ai с тем, как устроен агент от Anthropic, полезен наш обзор Claude Sonnet 5 — там разобрана философия «модель + инструменты», от которой ZCode отталкивается.
Цена GLM 5.2: API и тарифы Coding Plan
Экономика — второй козырь модели после кодинга. Здесь важно не путать официальную цену API от Z.ai и рыночную цену у сторонних хостеров.
Официальный прайс Z.ai (на 3 июля 2026 года): 1,40 доллара за 1 млн входных токенов и 4,40 доллара за 1 млн выходных, кэшированный ввод — 0,26 доллара. Для сравнения масштаба: Claude Opus 4.8 стоит в разы дороже за тот же объём, и именно на этом строится тезис VentureBeat «обходит GPT-5.5 по нескольким кодинг-бенчмаркам за 1/6 цены».
На OpenRouter и у независимых провайдеров цена ниже официальной — карточка показывает около 0,93 доллара за ввод и 3,00 за вывод, медиана по 25 провайдерам — примерно 1,20 и 4,10 доллара. Это не ошибка и не «серый» доступ, а конкуренция хостеров, которые сами разворачивают открытые веса. Минус — у стороннего провайдера свои политики логирования, что важно для приватности (об этом в разделе рисков).
Для тех, кто пишет код каждый день, интереснее не поштучный API, а подписка. Тарифы GLM Coding Plan (по данным на 1 июля 2026 года):Тариф Цена/мес Промо-цена Lite $18 $12,60 Pro $72 $50,40 Max $160 $112
Подписка даёт доступ к модели через ZCode и совместимые инструменты с лимитами по объёму — прямой аналог тарифных планов Claude Code, но заметно дешевле в верхнем сегменте.
Доступность из Украины. Ни в одном источнике мы не нашли данных о специальных региональных блоках Z.ai для Украины, но и подтверждения гарантированной доступности тоже нет. Регистрация и оплата зарубежной картой технически возможны; на всякий случай практичный путь — доступ через OpenRouter, который абстрагирует и оплату, и провайдера. Проверять доступность и способ оплаты стоит на момент подключения.
Запустить GLM-5.2 локально: реалии
Открытые веса рождают резонный вопрос — а можно ли запустить GLM-5.2 у себя и не платить за API вовсе? Технически да, практически — это задача для серьёзного железа, а не для домашнего ПК.
Причина проста: 744–753 млрд параметров надо где-то держать. Расклад по памяти (по данным Unsloth и независимых обзоров на 3 июля 2026 года):Формат Требуемая память Оговорка 1-bit (динамический квант) ~223 ГБ суммарной памяти заметная потеря качества 2-bit (UD-IQ2_M) ~239 ГБ компромисс качество/размер FP8 ~744 ГБ (8×H200/H20) серверный класс BF16 (полная точность) ~1,49 ТБ (8×H200) датацентр
Квантизация — это сжатие весов модели до меньшей разрядности (с 16 бит до 8, 4, 2 или даже 1), чтобы уместить её в меньший объём памяти ценой части точности. Даже в агрессивном 2-битном кванте GLM-5.2 требует около 239 ГБ — это уже не одна видеокарта, а связка или мощная система с большим объёмом единой памяти. На типичном игровом ПК с 24 ГБ VRAM полноценно запустить флагман не выйдет.
Если хотите разобраться в локальном запуске моделей GLM предметно — кванты, бэкенды (vLLM, llama.cpp, SGLang), подбор железа — у нас есть отдельный подробный разбор: как запустить фронтир-модели GLM на своём ПК. Здесь же вывод короткий: локальный запуск GLM-5.2 имеет смысл прежде всего для тех, у кого требование не отдавать код наружу перевешивает стоимость железа; всем остальным дешевле и проще облачный API или подписка.
GLM-5.2 vs Claude и другие: против альтернатив
«Лучшей модели вообще» не бывает — есть лучшая под задачу и бюджет. Сведём ключевых конкурентов в одну таблицу (данные на 3 июля 2026 года):Модель Тип Цена API (вход/выход за 1M) Кодинг Лицензия GLM-5.2 open-weight, MoE $1,40 / $4,40 очень сильный MIT Claude Opus 4.8 закрытая заметно дороже эталон проприетарная GPT-5.5 закрытая дороже очень сильный проприетарная DeepSeek-V4-Pro open-weight сопоставимо низкая сильный открытая Kimi K2.6 open-weight низкая сильный открытая Gemini 3.1 Pro закрытая средняя сильный проприетарная
Расстановка сил такая. Против Claude Opus 4.8 GLM-5.2 — это «90–95% качества за 15–20% цены»: для потока задач выгодно, для самых сложных — Opus всё ещё эталон. Против GPT-5.5 — паритет или преимущество на ряде кодинг-бенчмарков при кратно меньшей цене. Внутри лагеря открытых моделей главный спарринг — DeepSeek-V4-Pro: обе дешёвые и открытые, GLM-5.2 обычно впереди по агентному кодингу и имеет свой harness, DeepSeek силён в рассуждениях и математике.
Отдельно для тех, кто смотрит именно на локальный запуск открытых моделей: рабочей «лошадкой по умолчанию» дома чаще называют не флагманы, а компактные модели — например, Qwen3 для локального ИИ, которая помещается на потребительское железо. GLM-5.2 в этой лиге — не про «дома», а про «сервер или облако».
Кому какую версию выбрать
Соберём рекомендации по сценариям — без воды.
- Агентство фронтенда / продуктовая команда. GLM-5.2 через Coding Plan или ZCode — сильный кодинг за небольшие деньги, а высокий результат на Code Arena по вебу это подтверждает. Эскалация на Claude Opus 4.8 — только на самых тяжёлых задачах.
- Стартап на бюджете. Официальный API или OpenRouter, тактический роутинг: поток — на GLM-5.2, редкие сложные фиксы — на топовый закрытый флагман. Экономия на счёте за токены — кратная.
- Регулируемая индустрия / госсектор / чувствительные данные. Облачный API Z.ai — не вариант из-за юрисдикции (см. риски). Допустимо только при полном self-host на своей инфраструктуре, а это дорогое железо.
- Энтузиаст self-host. Готовы к 239+ ГБ памяти и настройке бэкендов — можно гонять локально в кванте; иначе проще и дешевле облако.
- Задачи с изображениями. GLM-5.2 не подходит вовсе — зрения нет, нужна другая модель.
Риски и ограничения
Раздел рисков для GLM-5.2 — это не формальность, а часть решения. Здесь несколько пунктов, которые мейнстрим-обзоры обычно замалчивают.
Приватность данных при облачном доступе. Это главный риск. Z.ai — китайская компания, а значит её инфраструктура подпадает под Закон КНР о национальной разведке (ст. 7), который обязывает организации содействовать органам госбезопасности. На это прямо указывали профильные издания (TechTimes, 17 июня 2026) и аналитики. Практический вывод: код и данные, отправленные в облачный API Z.ai (или к стороннему хостеру), стоит считать потенциально доступными третьей стороне. Для самостоятельного запуска весов это неприменимо — там данные не покидают вашу инфраструктуру. Именно поэтому граница «облако против self-host» для этой модели — не про удобство, а про безопасность.
Экспортный контроль. Zhipu AI внесена в Entity List Бюро промышленности и безопасности США (BIS) ещё в январе 2025 года — с презумпцией отказа в экспортных лицензиях. На использование открытых весов это напрямую не влияет, но это фактор для компаний, чувствительных к комплаенсу и работе с американскими контрагентами.
Нет зрения. GLM-5.2 работает только с текстом. Мультимодальная GLM-5V-Turbo существует отдельно и в открытом доступе её нет. Для задач с картинками, скриншотами, диаграммами это жёсткое ограничение — независимые обзоры (kie.ai) называют его «binding constraint» для автоисследовательских сценариев.
Скепсис к бенчмаркам. Как отмечено выше, часть сообщества считает часть заявленных цифр «заточенными под тесты». Плюс отдельная гигиена факт-чекинга: мы наткнулись на сторонние агрегаторы (например, hokai.io), которые публикуют неверные цифры — GPQA-Diamond там указан как 80,3% при официальных 91,2%, а у Claude Opus в той же таблице занижен до ~74% вместо 93,6%. Вывод для читателя: сверяйте бенчмарки по первоисточнику, а не по красивым SEO-таблицам.
Галлюцинации. По одному замеру (AA-Omniscience, в пересказе kie.ai) уровень галлюцинаций GLM-5.2 — около 28% против 67–95% у предыдущих GLM-4.5/4.6, то есть заметное улучшение. Оговорка: это единичный источник без независимого подтверждения, поэтому воспринимать цифру стоит как ориентир, а не как твёрдый факт.
FAQ
Что такое GLM-5.2 простыми словами? Это большая языковая модель от китайской лаборатории Z.ai с открытыми весами под лицензией MIT, вышедшая в июне 2026 года. Она заточена под программирование и агентные задачи, а по кодингу приближается к Claude Opus 4.8, стоя при этом в разы дешевле.
GLM-5.2 действительно лучше Claude в коде? Не «лучше», а «почти вровень за долю цены». На длинных агентных задачах (FrontierSWE) разрыв с Claude Opus 4.8 меньше одного пункта, но на репозиторных фиксах (SWE-bench Pro) Opus впереди примерно на 7 пунктов. Практичный подход — поток задач на GLM-5.2, самые сложные — на Claude.
Сколько стоит GLM 5.2? Официальная цена API Z.ai — 1,40 доллара за 1 млн входных токенов и 4,40 за выходных (на 3 июля 2026). Есть подписка GLM Coding Plan: Lite около 18, Pro 72 и Max 160 долларов в месяц. У сторонних провайдеров на OpenRouter цена бывает ниже официальной.
Что такое ZCode и нужно ли на него переходить?
ZCode — официальная десктопная среда разработки Z.ai под GLM-5.2, аналог Claude Code, но в виде GUI-приложения с командой /goal и удалённой работой по SSH. Переходить необязательно: благодаря Anthropic-совместимому API GLM-5.2 работает и в Claude Code, Cline, Roo Code, Kilo Code.
Можно ли запустить GLM-5.2 на домашнем ПК? Полноценно — нет. Даже в 2-битном кванте модель требует около 239 ГБ памяти, а в полной точности — до 1,49 ТБ. Это уровень сервера или связки видеокарт, а не игрового ПК с 24 ГБ VRAM.
Безопасно ли отдавать код в GLM-5.2? Через облачный API Z.ai — с оговорками: инфраструктура под китайской юрисдикцией и Законом о нацразведке, поэтому чувствительный код лучше туда не отправлять. Безопасный путь для приватных данных — self-hosting открытых весов на своей инфраструктуре.
