MLPerf Training 6.0: Blackwell от NVIDIA выиграла все тесты, новое поколение GB300 быстрее GB200

Что произошло

16 июня 2026 года консорциум MLCommons опубликовал результаты MLPerf Training v6.0 — отраслевого набора тестов скорости обучения ИИ. Системы на архитектуре NVIDIA Blackwell заняли первые места во всех бенчмарках раунда: и по абсолютному времени обучения «на масштабе», и по производительности в расчёте на один ускоритель.

Детали

  • Новое поколение NVIDIA GB300 NVL72 показало до 1,6× более быстрое обучение, чем прошлогодняя GB200 NVL72.
  • На самой крупной MoE-модели набора — DeepSeek-V3 на 671 млрд параметров — NVIDIA масштабировала прогон до 8192 ускорителей (GB200 NVL72): крупнейшая Blackwell-заявка в истории MLPerf. Microsoft Azure обучила Llama 3.1 405B на 8192 ускорителях и достигла целевого качества за 7,07 минуты.
  • В раунд добавили два новых теста на MoE-моделях (DeepSeek-V3 671B и GPT-OSS 20B) — разреженные вычисления стали главным трендом. Участников рекордно много: 24 организации, 95 уникальных систем, 13 типов ускорителей; 60% конфигураций — многоузловые.

Что это значит

Касается тех, кто арендует или строит инфраструктуру для обучения и инференса больших моделей — от стартапов до облаков. Главное здесь не «NVIDIA снова первая» (это ожидаемо), а две практичные вещи. Первая: рост GB300 к GB200 в 1,6× означает, что один и тот же бюджет на обучение даёт заметно больше — короче цикл итераций и ниже цена обучения. Вторая: появление в тестах MoE-моделей вроде DeepSeek-V3 671B фиксирует, куда сместилась индустрия — массовые модели теперь разреженные, и железо оптимизируют именно под них. Горизонт — практический уже сейчас: эти системы доступны в облаках, а независимый характер MLPerf (результаты проверяет MLCommons, а не только вендор) делает цифры достаточно надёжной точкой отсчёта при выборе провайдера.

до 5 100 USDT Bybit · новичкамдо 5 100 USDTBybit дарит новичкам за простые заданияЗабрать бонус
до 555% Bybit · Savingsдо 555%годовых на Savings + до 5 100 USDT новичкам · 3 шагаНачни сейчас
Поделиться
Связаться:
Крипто- и data-аналитик, инженер-программист (факультет компьютерных наук ХНУРЭ). В IT с 2008 года: администрировал корпоративный мониторинг в «Vodafone Украина», семь лет разрабатывал и продвигал веб-проекты, пять лет руководил маркетингом на метриках — конверсия, CTR, ROI, LTV.Криптовалютными рынками занимаюсь с 2021 года: ончейн-метрики, токеномика, макроэкономические индикаторы. Разработал собственную data-driven модель анализа рынка на 30+ метрик. Стек — Python (pandas, NumPy, SciPy, matplotlib), математическая статистика и EDA; сбор и сверку данных автоматизирую AI-агентами.Принцип — «Don't trust, verify»: каждая цифра проверена по первоисточнику, ключевые — минимум по двум независимым; прогнозы — только сценарии с условиями. Тезис без данных не публикуется.