Unsloth выложила diffusiongemma-26B-GGUF — 80 000 загрузок за 4 дня, диффузионный LLM на Gemma

Что произошло

Около 10 июня 2026 года команда Unsloth опубликовала GGUF-квантизацию модели diffusiongemma-26B-A4B-it на Hugging Face. За четыре дня после выхода модель собрала более 80 000 загрузок — крайне высокий показатель для специализированного формата локального инференса. Это квантизованная версия diffusion-LLM, построенного на архитектуре Gemma, для запуска на локальных машинах через llama.cpp или совместимые движки.

Детали

DiffusionGemma — это «диффузионный» языковой трансформер: в отличие от стандартных авторегрессионных LLM, которые генерируют текст токен за токеном, диффузионные модели итеративно «обезашумливают» весь контекст. Такой подход потенциально позволяет лучше работать с задачами, требующими осознания всего выхода целиком.

Unsloth специализируется на квантизации и оптимизации моделей для локального запуска (слот trendingScore 249 на HF). Формат GGUF совместим с llama.cpp и производными (LM Studio, Ollama, Jan).

ПараметрЗначение
Базовая модельDiffusionGemma 26B
КвантизацияA4B (4-bit активации)
ФорматGGUF (llama.cpp-совместимый)
Загрузок за 4 дня80 000+
Публикация~10 июня 2026

Что это значит

Для энтузиастов локальных LLM: diffusiongemma в GGUF означает, что диффузионный подход к генерации текста теперь доступен на домашней машине с достаточным объёмом RAM. 80K загрузок говорят о том, что сообщество активно экспериментирует.

Практическое ограничение: диффузионные LLM пока уступают лучшим авторегрессионным моделям по итоговому качеству текста. Это скорее исследовательская территория, чем продакшн-инструмент. Если вам нужно лучшее качество — возьмите llama3 или mistral в GGUF. Если интересна альтернативная архитектура для экспериментов — diffusiongemma-26B ценный объект изучения.

Горизонт: активные скачивания сигнализируют о растущем интересе к диффузионным LLM как альтернативе классическим авторегрессионным. На этой неделе в сообществе LocalLLM появятся первые независимые тесты.

Поделиться
Связаться:
Крипто- и data-аналитик, инженер-программист (факультет компьютерных наук ХНУРЭ). В IT с 2008 года: администрировал корпоративный мониторинг в «Vodafone Украина», семь лет разрабатывал и продвигал веб-проекты, пять лет руководил маркетингом на метриках — конверсия, CTR, ROI, LTV.Криптовалютными рынками занимаюсь с 2021 года: ончейн-метрики, токеномика, макроэкономические индикаторы. Разработал собственную data-driven модель анализа рынка на 30+ метрик. Стек — Python (pandas, NumPy, SciPy, matplotlib), математическая статистика и EDA; сбор и сверку данных автоматизирую AI-агентами.Принцип — «Don't trust, verify»: каждая цифра проверена по первоисточнику, ключевые — минимум по двум независимым; прогнозы — только сценарии с условиями. Тезис без данных не публикуется.