Что произошло
16 июня 2026 года консорциум MLCommons опубликовал результаты MLPerf Training v6.0 — отраслевого набора тестов скорости обучения ИИ. Системы на архитектуре NVIDIA Blackwell заняли первые места во всех бенчмарках раунда: и по абсолютному времени обучения «на масштабе», и по производительности в расчёте на один ускоритель.
Детали
- Новое поколение NVIDIA GB300 NVL72 показало до 1,6× более быстрое обучение, чем прошлогодняя GB200 NVL72.
- На самой крупной MoE-модели набора — DeepSeek-V3 на 671 млрд параметров — NVIDIA масштабировала прогон до 8192 ускорителей (GB200 NVL72): крупнейшая Blackwell-заявка в истории MLPerf. Microsoft Azure обучила Llama 3.1 405B на 8192 ускорителях и достигла целевого качества за 7,07 минуты.
- В раунд добавили два новых теста на MoE-моделях (DeepSeek-V3 671B и GPT-OSS 20B) — разреженные вычисления стали главным трендом. Участников рекордно много: 24 организации, 95 уникальных систем, 13 типов ускорителей; 60% конфигураций — многоузловые.
Что это значит
Касается тех, кто арендует или строит инфраструктуру для обучения и инференса больших моделей — от стартапов до облаков. Главное здесь не «NVIDIA снова первая» (это ожидаемо), а две практичные вещи. Первая: рост GB300 к GB200 в 1,6× означает, что один и тот же бюджет на обучение даёт заметно больше — короче цикл итераций и ниже цена обучения. Вторая: появление в тестах MoE-моделей вроде DeepSeek-V3 671B фиксирует, куда сместилась индустрия — массовые модели теперь разреженные, и железо оптимизируют именно под них. Горизонт — практический уже сейчас: эти системы доступны в облаках, а независимый характер MLPerf (результаты проверяет MLCommons, а не только вендор) делает цифры достаточно надёжной точкой отсчёта при выборе провайдера.




