Коротко (TL;DR)
NVIDIA RTX PRO 6000 Blackwell — это «помощнее» в чистом виде: 96 ГБ памяти GDDR7 с ECC на одной карте. Главный её смысл — запускать большие модели целиком, без мультикарты и шардинга. Llama 3.3 70B в высокой точности (FP8, ~70 ГБ) грузится на одну PRO 6000 и идёт около 19 токенов/с — примерно вдвое быстрее, чем Mac Studio M3 Ultra на той же модели. А RTX 5090 (32 ГБ) такую модель не запускает вовсе.
К 96 ГБ прилагаются профессиональные плюсы: ECC-память ловит однобитовые ошибки (важно для многодневного дообучения, чтобы не получить молча испорченные веса) и стабильные pro-драйверы, которые не ломают CUDA внезапным авто-апдейтом. По пропускной способности (1 792 ГБ/с) и архитектуре это тот же чип GB202, что у 5090, но с втрое большей памятью.
Расплата — цена. Рекомендованная — около $8 500, версия Max-Q бывает за $7 999, но из-за дефицита розница доходит до ~$13 250 (июнь 2026). Это самая дорогая часть любой сборки. Ниже — что именно карта тянет с цифрами, полный воркстейшн-BOM, честное сравнение с мультикартой и Mac, и кому она реально нужна, а кому это переплата.
(Данные актуальны на 15 июня 2026; цены и бенчмарки — с датами в тексте.)
Задача и бюджет
Эта рабочая станция — под профессиональный локальный ИИ: инференс и дообучение моделей 70B-класса в высокой точности, продакшн-сервинг, многодневные тренировки с ECC-надёжностью, плюс тяжёлая профграфика и рендер. Ключевая идея — одна большая карта вместо связки из нескольких: непрерывные 96 ГБ проще в настройке и эксплуатации, чем 3× RTX 5090 или 2× RTX 3090 с их шиной, питанием и шардингом.
Бюджет высокий и определяется картой. Сама PRO 6000 — от $8 500 (а в дефиците до ~$13 250), остальное (CPU, плата, память, БП, корпус) добавляет ~$1 500–2 500. Полная станция выходит от ~$10 000, а с уличной ценой карты — и до ~$15 000. Это инструмент для тех, кому время, надёжность и отсутствие возни с мультикартой важнее денег. Типичные покупатели — продуктовые ML-команды, исследовательские лаборатории, студии генеративного видео и графики, а также соло-разработчики, которым нужен полный приватный стек под 70B без зависимости от облака.
Трезвая оговорка: если 70B-модели нужны вам лишь иногда, ту же карту дешевле арендовать в облаке (об этом ниже), чем покупать.
Конфигурация (BOM)
Сбалансированная станция под одну PRO 6000. Карта двухслотовая и питается одним 16-pin разъёмом, поэтому требований к корпусу меньше, чем у трёхслотовой 5090, — но запас по питанию нужен.Компонент Модель Цена Зачем именно это Видеокарта RTX PRO 6000 96 ГБ (Workstation/Max-Q) $8 500–13 250 96 ГБ ECC — ядро станции Процессор Ryzen 9 9950X / Threadripper ~$550–1 200 вся работа на GPU, CPU — обвязка Мат. плата X870E / TRX50 (PCIe 5.0) ~$350–600 PCIe 5.0 ×16, линии под апгрейд Память 96–128 ГБ DDR5 ~$300–450 под систему и загрузку моделей Блок питания 1000–1200 Вт (или 850 для Max-Q) ~$200 600 Вт карты + запас Корпус + NVMe с продувкой + 4 ТБ NVMe ~$400 быстрый SSD под веса 70B+ Итого от ~$10 000 (ориентир, июнь 2026)
Замечание: процессор намеренно можно взять не топовый (например, Ryzen 9 9900X) — вся нагрузка ложится на GPU, а более горячий CPU только добавит тепла. Быстрый NVMe важен: модель на 70 ГБ должна успевать подгружаться с диска в память.
Что реально потянет
Главная ценность 96 ГБ — большие модели в высокой точности на одной карте. Скорость (decode) при этом достойная: пропускная способность 1 792 ГБ/с — на уровне 5090.Модель Точность Влезает в 96 ГБ Скорость, ток/с Llama 8B / Mistral 7B FP16 да, с огромным запасом 270–326 Llama 3.3 70B FP8 (~70 ГБ) да ~19 Qwen 27B Q8 (~27 ГБ) да, с большим запасом высокая DeepSeek R1 671B 4-бит нет (нужен Mac/датацентр) —
Ключевой замер — Llama 3.3 70B в FP8 (это ~70 ГБ): на одной PRO 6000 модель целиком в видеопамяти (занято ~73 из 96 ГБ) и выдаёт ~19 токенов/с — быстрее, чем читает человек (по hands-on тесту Alex Ziskind, июль 2025). Важная деталь: это высокая точность FP8, а не агрессивный 4-бит, на который приходится идти на картах поменьше. На компактных моделях карта просто летит — в тестах StorageReview она обгоняет 5090, 4090 и прошлую 6000 Ada (Phi ~326 ток/с, Mistral ~272).
Почему важна именно высокая точность. На картах с 24–32 ГБ модель на 70B приходится сжимать до агрессивного 4-бит и резать контекст — это бьёт по качеству ответов на сложных задачах вроде кода и рассуждений. На 96 ГБ та же 70B живёт в FP8 с большим контекстным окном: ответы заметно качественнее, а длинные документы можно подавать целиком. Запас памяти также позволяет держать несколько моделей загруженными одновременно — например, быстрый помощник и крупный генералист — без постоянной перезагрузки.
Потолок тоже честный: frontier-модели вроде DeepSeek R1 671B одна карта не грузит — для них по-прежнему нужен Mac Studio с 512 ГБ или датацентровый GPU. 96 ГБ — это «70B с запасом», а не «всё на свете».
Сколько стоит
С ценой PRO 6000 отдельная история. Рекомендованная — около $8 500 (StorageReview), версия Max-Q бывает за $7 999 в рознице (Microcenter). Но спрос высокий, а предложение ограничено, и в июне 2026 карту выставляют уже по ~$13 250 — один из самых дорогих GPU на рынке (вирусный тейк в X, 13 июня 2026). Перед покупкой проверяйте актуальный прайс: разброс огромный.
Отсюда — важная альтернатива. Если карта нужна не постоянно, её дешевле арендовать в облаке: RTX PRO 6000 на RunPod — от ~$1,69/ч, на Northflank — $3,00/ч (с CPU/RAM/диском). При редких задачах аренда окупается годами против покупки за $8 500+; покупка оправдана только при постоянной загрузке и требованиях к приватности. Грубый ориентир: при цене $8 500 и аренде ~$2/ч карта «отбивается» примерно за 4 250 часов работы — разумно для постоянно загруженной станции и невыгодно для эпизодических прогонов.
RTX PRO 6000 против альтернатив
Где платить за одну большую карту, а где взять что-то другое (данные на июнь 2026).Решение VRAM / ПС ECC Цена (карты) Когда RTX PRO 6000 96 ГБ / 1 792 ГБ/с да $8 500–13 250 70B на одной карте, продакшн RTX 5090 32 ГБ / 1 792 ГБ/с нет $2 500–3 200 модели ≤30B, максимум скорости 2× RTX 3090 (б/у) 48 ГБ (2×24) / 936 ГБ/с на карту нет $1 400–2 000 70B бюджетно через NVLink Mac Studio M3 Ultra до 512 ГБ / 819 ГБ/с — от $3 999 модели 200B–671B
Главный довод PRO 6000 — одна карта вместо мультикарты. Чтобы догнать её 96 ГБ потребительскими картами, нужно 3× RTX 5090 (а это два блока питания на 1000 Вт+, плата с тремя слотами PCIe 5.0 ×16 и дорогой Threadripper) — против сборки на одной RTX 5090 это совсем другой уровень сложности. Бюджетная альтернатива — пара б/у RTX 3090: 48 ГБ через NVLink за ~$1 800, но это меньше памяти, возня с б/у и шумный риг. PRO 6000 экономит не деньги, а сложность и время: «один непрерывный пул на 96 ГБ» вместо склейки карт.
Против Mac Studio M3 Ultra расклад зеркальный: на 70B PRO 6000 примерно вдвое быстрее (19 против 9 ток/с) и даёт CUDA/FP8, зато Mac с его 512 ГБ грузит DeepSeek R1 671B, который 96-ГБ карта не вместит. Снова та же развилка «скорость против ёмкости», только на верхнем уровне.
Есть и неочевидная экономия. Мультикарта — это не только деньги: это подбор платы с нужными линиями PCIe, мощный или двойной блок питания, корпус под три-четыре карты, шум, тепло и время на настройку tensor parallelism. PRO 6000 в двухслотовом исполнении и с одним 16-pin ставится в обычную рабочую станцию без особых требований к питанию и продувке. Для студии или команды, где простой стоит дороже железа, «одна карта, которая просто работает» — весомый аргумент.
ECC, pro-драйверы и редакции
За что именно вы доплачиваете против обычной 5090 — три профессиональные вещи.
- ECC-память. Исправляет однобитовые ошибки на лету. В играх случайная ошибка памяти — это глитч; в многодневной тренировке — молча испорченные веса и потерянный чекпойнт без единого сообщения об ошибке. Для продакшн-тюнинга ECC — не маркетинг, а страховка.
- Профессиональные драйверы. Pro/Studio-драйверы выходят на медленных стабильных циклах, валидированы под ИИ и не ставятся авто-апдейтом. Геймерский драйвер, сломавший CUDA посреди проекта, — реальный риск, которого тут нет.
- Полноценное дообучение. 96 ГБ + ECC позволяют LoRA/QLoRA и тяжёлый тюнинг моделей 70B-класса прямо на станции — то, чего не сделать на 32-ГБ 5090 или 48-ГБ паре 3090. Для исследователя или команды это эксперименты «у себя», без облачных очередей и счетов.
- Две редакции. Полная Workstation Edition — 600 Вт (turbine-кулер, без RGB, двухслотовая). Версия Max-Q — 300 Вт, тише (один вентилятор) и холоднее, по близкой цене: отличный выбор для тесных и SFF-корпусов, где 600 Вт некуда девать.
Сборка и настройка
Несколько практических нюансов под одну PRO 6000:
- Питание и коннектор. Карта питается одним 16-pin (12V-2×6) — берите БП ATX 3.1 с нативным кабелем, без переходников из четырёх 8-pin. Для полной 600-Вт версии — 1000–1200 Вт, для Max-Q (300 Вт) хватит 850 Вт.
- Охлаждение. Workstation Edition — турбинный (blower) кулер, выбрасывающий воздух наружу: ставится в обычный корпус без особых требований, но под нагрузкой шумит. Max-Q тише и холоднее. В любом случае обеспечьте сквозную продувку.
- Драйверы. Ставьте профессиональный Studio/Enterprise-драйвер, а не GeForce Game Ready — он валидирован под ИИ и не обновляется сам, ломая CUDA посреди проекта.
- Софт. Модели запускаются привычно: Ollama и LM Studio для простоты, vLLM/SGLang с FP8 — для продакшн-сервинга. Пошаговый разбор инференса (Ollama, кванты, бэкенды) — в разделе локальные нейросети.
Апгрейд-путь
Куда расти, если 96 ГБ перестанет хватать:
- Вторая PRO 6000. Две карты дают 192 ГБ совокупной видеопамяти под модели 140B+. Важная оговорка: NVLink здесь нет (как и у всех потребительских/воркстейшн Blackwell) — карты общаются по PCIe Gen5 ×16, это не «единый пул как один чип», но для инференса и LoRA/QLoRA-тюнинга достаточно.
- Облако под пики. Разовые тяжёлые прогоны логичнее не докупать второй картой, а арендовать (RunPod от ~$1,69/ч).
- Датацентр. Если нужен именно NVLink (полный тюнинг 70B на нескольких картах, тензор-параллелизм в проде) — это уже SXM-карты (H100/H200/B200) в EPYC-сервере, другой класс бюджета.
Риски и слабые места
Честный список (с датами):
- Экстремальная цена. MSRP ~$8 500, но из-за дефицита розница доходит до ~$13 250 (X, июнь 2026) — карта дороже, чем целая сборка на 2× 3090 или 5090.
- Потолок 96 ГБ. Frontier-модели (DeepSeek R1 671B и подобные) одна карта не грузит — для них нужен Mac Studio (512 ГБ) или датацентр (Ziskind, 2025).
- Нет NVLink. Две карты — это PCIe Gen5, а не единый пул на 192 ГБ «как один чип»; для NVLink-нагрузок путь — датацентровые SXM (VRLA Tech, 2026).
- 600 Вт и тепло. Полная версия требует БП 1000 Вт+ и продувки; для тихой/компактной станции берите Max-Q на 300 Вт (StorageReview/Ziskind, 2026).
- Окупаемость. $8 500+ железа против аренды от $1,69/ч — при редкой нагрузке покупка не оправдывается (Northflank, 2026).
Справедливости ради — плюсы весомы: единственный простой способ держать 70B в высокой точности на одной карте, ECC и pro-драйверы для продакшна, ~2× скорость M3 Ultra на 70B, и при этом топовая карта для рендера и профграфики.
Кому подходит, а кому нет
- Берите RTX PRO 6000, если вам нужны модели 70B-класса в высокой точности на одной карте, важны ECC под долгие тренировки и стабильные драйверы, а сложность мультикарты вы хотите обойти — и готовы к цене от $8 500.
- Соберите 2× RTX 3090, если нужны те же ~48–96 ГБ, но бюджетно, и вы готовы к б/у и возне с мультикартой.
- Возьмите RTX 5090, если ваши модели влезают в 32 ГБ — это в разы дешевле.
- Идите в Mac Studio, если нужны frontier-модели крупнее 96 ГБ (200B–671B).
- Арендуйте в облаке, если тяжёлые задачи редкие — $8 500 железа не окупятся.
FAQ
Запустит ли RTX PRO 6000 модель Llama 70B? Да, и в высокой точности. Llama 3.3 70B в FP8 весит ~70 ГБ и целиком помещается в 96 ГБ карты, выдавая ~19 токенов/с — быстрее, чем читает человек. Это ключевое отличие от RTX 5090 (32 ГБ), которая 70B не вмещает вовсе.
Сколько стоит RTX PRO 6000 Blackwell? Рекомендованная цена — около $8 500, версия Max-Q бывает за $7 999. Но из-за дефицита в июне 2026 розница доходит до ~$13 250. Полная рабочая станция выходит от ~$10 000. Если карта нужна нечасто, дешевле арендовать в облаке (RunPod от ~$1,69/ч).
RTX PRO 6000 или две RTX 3090? PRO 6000 — это непрерывные 96 ГБ ECC на одной карте без шардинга и возни с мультикартой, плюс pro-драйверы. 2× 3090 дают 48 ГБ через NVLink-мост в разы дешевле (~$1 800), но это б/у-карты, шум и сложная сборка. PRO 6000 берут за простоту, надёжность и ёмкость, а не за экономию.
Чем PRO 6000 отличается от RTX 5090, кроме памяти? Тот же чип GB202 и 1 792 ГБ/с, но у PRO 6000 96 ГБ против 32, есть ECC-память, профессиональные драйверы (без авто-апдейтов, ломающих CUDA), двухслотовый форм-фактор и редакция Max-Q на 300 Вт. 5090 быстрее окупается для моделей ≤30B; PRO 6000 — для 70B+ и продакшна.
Поддерживает ли RTX PRO 6000 NVLink? Нет. Как и все потребительские и воркстейшн-карты Blackwell, PRO 6000 обходится без NVLink — две карты общаются по PCIe Gen5 ×16 и дают 192 ГБ совокупной памяти. NVLink в 2026 остался только у датацентровых SXM-карт (H100/H200/B200).




