Рабочая станция на NVIDIA RTX PRO 6000 Blackwell: 96 ГБ на одной карте под 70B без мультикарты

Коротко (TL;DR)

NVIDIA RTX PRO 6000 Blackwell — это «помощнее» в чистом виде: 96 ГБ памяти GDDR7 с ECC на одной карте. Главный её смысл — запускать большие модели целиком, без мультикарты и шардинга. Llama 3.3 70B в высокой точности (FP8, ~70 ГБ) грузится на одну PRO 6000 и идёт около 19 токенов/с — примерно вдвое быстрее, чем Mac Studio M3 Ultra на той же модели. А RTX 5090 (32 ГБ) такую модель не запускает вовсе.

К 96 ГБ прилагаются профессиональные плюсы: ECC-память ловит однобитовые ошибки (важно для многодневного дообучения, чтобы не получить молча испорченные веса) и стабильные pro-драйверы, которые не ломают CUDA внезапным авто-апдейтом. По пропускной способности (1 792 ГБ/с) и архитектуре это тот же чип GB202, что у 5090, но с втрое большей памятью.

Расплата — цена. Рекомендованная — около $8 500, версия Max-Q бывает за $7 999, но из-за дефицита розница доходит до ~$13 250 (июнь 2026). Это самая дорогая часть любой сборки. Ниже — что именно карта тянет с цифрами, полный воркстейшн-BOM, честное сравнение с мультикартой и Mac, и кому она реально нужна, а кому это переплата.

(Данные актуальны на 15 июня 2026; цены и бенчмарки — с датами в тексте.)

Задача и бюджет

Эта рабочая станция — под профессиональный локальный ИИ: инференс и дообучение моделей 70B-класса в высокой точности, продакшн-сервинг, многодневные тренировки с ECC-надёжностью, плюс тяжёлая профграфика и рендер. Ключевая идея — одна большая карта вместо связки из нескольких: непрерывные 96 ГБ проще в настройке и эксплуатации, чем 3× RTX 5090 или 2× RTX 3090 с их шиной, питанием и шардингом.

Бюджет высокий и определяется картой. Сама PRO 6000 — от $8 500 (а в дефиците до ~$13 250), остальное (CPU, плата, память, БП, корпус) добавляет ~$1 500–2 500. Полная станция выходит от ~$10 000, а с уличной ценой карты — и до ~$15 000. Это инструмент для тех, кому время, надёжность и отсутствие возни с мультикартой важнее денег. Типичные покупатели — продуктовые ML-команды, исследовательские лаборатории, студии генеративного видео и графики, а также соло-разработчики, которым нужен полный приватный стек под 70B без зависимости от облака.

Трезвая оговорка: если 70B-модели нужны вам лишь иногда, ту же карту дешевле арендовать в облаке (об этом ниже), чем покупать.

Конфигурация (BOM)

Сбалансированная станция под одну PRO 6000. Карта двухслотовая и питается одним 16-pin разъёмом, поэтому требований к корпусу меньше, чем у трёхслотовой 5090, — но запас по питанию нужен.

КомпонентМодельЦенаЗачем именно это
ВидеокартаRTX PRO 6000 96 ГБ (Workstation/Max-Q)$8 500–13 25096 ГБ ECC — ядро станции
ПроцессорRyzen 9 9950X / Threadripper~$550–1 200вся работа на GPU, CPU — обвязка
Мат. платаX870E / TRX50 (PCIe 5.0)~$350–600PCIe 5.0 ×16, линии под апгрейд
Память96–128 ГБ DDR5~$300–450под систему и загрузку моделей
Блок питания1000–1200 Вт (или 850 для Max-Q)~$200600 Вт карты + запас
Корпус + NVMeс продувкой + 4 ТБ NVMe~$400быстрый SSD под веса 70B+
Итогоот ~$10 000 (ориентир, июнь 2026)

Замечание: процессор намеренно можно взять не топовый (например, Ryzen 9 9900X) — вся нагрузка ложится на GPU, а более горячий CPU только добавит тепла. Быстрый NVMe важен: модель на 70 ГБ должна успевать подгружаться с диска в память.

Что реально потянет

Главная ценность 96 ГБ — большие модели в высокой точности на одной карте. Скорость (decode) при этом достойная: пропускная способность 1 792 ГБ/с — на уровне 5090.

МодельТочностьВлезает в 96 ГБСкорость, ток/с
Llama 8B / Mistral 7BFP16да, с огромным запасом270–326
Llama 3.3 70BFP8 (~70 ГБ)да~19
Qwen 27BQ8 (~27 ГБ)да, с большим запасомвысокая
DeepSeek R1 671B4-битнет (нужен Mac/датацентр)

Ключевой замер — Llama 3.3 70B в FP8 (это ~70 ГБ): на одной PRO 6000 модель целиком в видеопамяти (занято ~73 из 96 ГБ) и выдаёт ~19 токенов/с — быстрее, чем читает человек (по hands-on тесту Alex Ziskind, июль 2025). Важная деталь: это высокая точность FP8, а не агрессивный 4-бит, на который приходится идти на картах поменьше. На компактных моделях карта просто летит — в тестах StorageReview она обгоняет 5090, 4090 и прошлую 6000 Ada (Phi ~326 ток/с, Mistral ~272).

Почему важна именно высокая точность. На картах с 24–32 ГБ модель на 70B приходится сжимать до агрессивного 4-бит и резать контекст — это бьёт по качеству ответов на сложных задачах вроде кода и рассуждений. На 96 ГБ та же 70B живёт в FP8 с большим контекстным окном: ответы заметно качественнее, а длинные документы можно подавать целиком. Запас памяти также позволяет держать несколько моделей загруженными одновременно — например, быстрый помощник и крупный генералист — без постоянной перезагрузки.

Потолок тоже честный: frontier-модели вроде DeepSeek R1 671B одна карта не грузит — для них по-прежнему нужен Mac Studio с 512 ГБ или датацентровый GPU. 96 ГБ — это «70B с запасом», а не «всё на свете».

Видеопамять на одной карте: RTX PRO 6000 против потребительских, ГБ

Сколько стоит

С ценой PRO 6000 отдельная история. Рекомендованная — около $8 500 (StorageReview), версия Max-Q бывает за $7 999 в рознице (Microcenter). Но спрос высокий, а предложение ограничено, и в июне 2026 карту выставляют уже по ~$13 250 — один из самых дорогих GPU на рынке (вирусный тейк в X, 13 июня 2026). Перед покупкой проверяйте актуальный прайс: разброс огромный.

Отсюда — важная альтернатива. Если карта нужна не постоянно, её дешевле арендовать в облаке: RTX PRO 6000 на RunPod — от ~$1,69/ч, на Northflank — $3,00/ч (с CPU/RAM/диском). При редких задачах аренда окупается годами против покупки за $8 500+; покупка оправдана только при постоянной загрузке и требованиях к приватности. Грубый ориентир: при цене $8 500 и аренде ~$2/ч карта «отбивается» примерно за 4 250 часов работы — разумно для постоянно загруженной станции и невыгодно для эпизодических прогонов.

RTX PRO 6000 против альтернатив

Где платить за одну большую карту, а где взять что-то другое (данные на июнь 2026).

РешениеVRAM / ПСECCЦена (карты)Когда
RTX PRO 600096 ГБ / 1 792 ГБ/сда$8 500–13 25070B на одной карте, продакшн
RTX 509032 ГБ / 1 792 ГБ/снет$2 500–3 200модели ≤30B, максимум скорости
2× RTX 3090 (б/у)48 ГБ (2×24) / 936 ГБ/с на картунет$1 400–2 00070B бюджетно через NVLink
Mac Studio M3 Ultraдо 512 ГБ / 819 ГБ/сот $3 999модели 200B–671B

Главный довод PRO 6000 — одна карта вместо мультикарты. Чтобы догнать её 96 ГБ потребительскими картами, нужно 3× RTX 5090 (а это два блока питания на 1000 Вт+, плата с тремя слотами PCIe 5.0 ×16 и дорогой Threadripper) — против сборки на одной RTX 5090 это совсем другой уровень сложности. Бюджетная альтернатива — пара б/у RTX 3090: 48 ГБ через NVLink за ~$1 800, но это меньше памяти, возня с б/у и шумный риг. PRO 6000 экономит не деньги, а сложность и время: «один непрерывный пул на 96 ГБ» вместо склейки карт.

Против Mac Studio M3 Ultra расклад зеркальный: на 70B PRO 6000 примерно вдвое быстрее (19 против 9 ток/с) и даёт CUDA/FP8, зато Mac с его 512 ГБ грузит DeepSeek R1 671B, который 96-ГБ карта не вместит. Снова та же развилка «скорость против ёмкости», только на верхнем уровне.

Есть и неочевидная экономия. Мультикарта — это не только деньги: это подбор платы с нужными линиями PCIe, мощный или двойной блок питания, корпус под три-четыре карты, шум, тепло и время на настройку tensor parallelism. PRO 6000 в двухслотовом исполнении и с одним 16-pin ставится в обычную рабочую станцию без особых требований к питанию и продувке. Для студии или команды, где простой стоит дороже железа, «одна карта, которая просто работает» — весомый аргумент.

ECC, pro-драйверы и редакции

За что именно вы доплачиваете против обычной 5090 — три профессиональные вещи.

  • ECC-память. Исправляет однобитовые ошибки на лету. В играх случайная ошибка памяти — это глитч; в многодневной тренировке — молча испорченные веса и потерянный чекпойнт без единого сообщения об ошибке. Для продакшн-тюнинга ECC — не маркетинг, а страховка.
  • Профессиональные драйверы. Pro/Studio-драйверы выходят на медленных стабильных циклах, валидированы под ИИ и не ставятся авто-апдейтом. Геймерский драйвер, сломавший CUDA посреди проекта, — реальный риск, которого тут нет.
  • Полноценное дообучение. 96 ГБ + ECC позволяют LoRA/QLoRA и тяжёлый тюнинг моделей 70B-класса прямо на станции — то, чего не сделать на 32-ГБ 5090 или 48-ГБ паре 3090. Для исследователя или команды это эксперименты «у себя», без облачных очередей и счетов.
  • Две редакции. Полная Workstation Edition — 600 Вт (turbine-кулер, без RGB, двухслотовая). Версия Max-Q — 300 Вт, тише (один вентилятор) и холоднее, по близкой цене: отличный выбор для тесных и SFF-корпусов, где 600 Вт некуда девать.

Сборка и настройка

Несколько практических нюансов под одну PRO 6000:

  • Питание и коннектор. Карта питается одним 16-pin (12V-2×6) — берите БП ATX 3.1 с нативным кабелем, без переходников из четырёх 8-pin. Для полной 600-Вт версии — 1000–1200 Вт, для Max-Q (300 Вт) хватит 850 Вт.
  • Охлаждение. Workstation Edition — турбинный (blower) кулер, выбрасывающий воздух наружу: ставится в обычный корпус без особых требований, но под нагрузкой шумит. Max-Q тише и холоднее. В любом случае обеспечьте сквозную продувку.
  • Драйверы. Ставьте профессиональный Studio/Enterprise-драйвер, а не GeForce Game Ready — он валидирован под ИИ и не обновляется сам, ломая CUDA посреди проекта.
  • Софт. Модели запускаются привычно: Ollama и LM Studio для простоты, vLLM/SGLang с FP8 — для продакшн-сервинга. Пошаговый разбор инференса (Ollama, кванты, бэкенды) — в разделе локальные нейросети.

Апгрейд-путь

Куда расти, если 96 ГБ перестанет хватать:

  • Вторая PRO 6000. Две карты дают 192 ГБ совокупной видеопамяти под модели 140B+. Важная оговорка: NVLink здесь нет (как и у всех потребительских/воркстейшн Blackwell) — карты общаются по PCIe Gen5 ×16, это не «единый пул как один чип», но для инференса и LoRA/QLoRA-тюнинга достаточно.
  • Облако под пики. Разовые тяжёлые прогоны логичнее не докупать второй картой, а арендовать (RunPod от ~$1,69/ч).
  • Датацентр. Если нужен именно NVLink (полный тюнинг 70B на нескольких картах, тензор-параллелизм в проде) — это уже SXM-карты (H100/H200/B200) в EPYC-сервере, другой класс бюджета.

Риски и слабые места

Честный список (с датами):

  • Экстремальная цена. MSRP ~$8 500, но из-за дефицита розница доходит до ~$13 250 (X, июнь 2026) — карта дороже, чем целая сборка на 2× 3090 или 5090.
  • Потолок 96 ГБ. Frontier-модели (DeepSeek R1 671B и подобные) одна карта не грузит — для них нужен Mac Studio (512 ГБ) или датацентр (Ziskind, 2025).
  • Нет NVLink. Две карты — это PCIe Gen5, а не единый пул на 192 ГБ «как один чип»; для NVLink-нагрузок путь — датацентровые SXM (VRLA Tech, 2026).
  • 600 Вт и тепло. Полная версия требует БП 1000 Вт+ и продувки; для тихой/компактной станции берите Max-Q на 300 Вт (StorageReview/Ziskind, 2026).
  • Окупаемость. $8 500+ железа против аренды от $1,69/ч — при редкой нагрузке покупка не оправдывается (Northflank, 2026).

Справедливости ради — плюсы весомы: единственный простой способ держать 70B в высокой точности на одной карте, ECC и pro-драйверы для продакшна, ~2× скорость M3 Ultra на 70B, и при этом топовая карта для рендера и профграфики.

Кому подходит, а кому нет

  • Берите RTX PRO 6000, если вам нужны модели 70B-класса в высокой точности на одной карте, важны ECC под долгие тренировки и стабильные драйверы, а сложность мультикарты вы хотите обойти — и готовы к цене от $8 500.
  • Соберите 2× RTX 3090, если нужны те же ~48–96 ГБ, но бюджетно, и вы готовы к б/у и возне с мультикартой.
  • Возьмите RTX 5090, если ваши модели влезают в 32 ГБ — это в разы дешевле.
  • Идите в Mac Studio, если нужны frontier-модели крупнее 96 ГБ (200B–671B).
  • Арендуйте в облаке, если тяжёлые задачи редкие — $8 500 железа не окупятся.

FAQ

Запустит ли RTX PRO 6000 модель Llama 70B? Да, и в высокой точности. Llama 3.3 70B в FP8 весит ~70 ГБ и целиком помещается в 96 ГБ карты, выдавая ~19 токенов/с — быстрее, чем читает человек. Это ключевое отличие от RTX 5090 (32 ГБ), которая 70B не вмещает вовсе.

Сколько стоит RTX PRO 6000 Blackwell? Рекомендованная цена — около $8 500, версия Max-Q бывает за $7 999. Но из-за дефицита в июне 2026 розница доходит до ~$13 250. Полная рабочая станция выходит от ~$10 000. Если карта нужна нечасто, дешевле арендовать в облаке (RunPod от ~$1,69/ч).

RTX PRO 6000 или две RTX 3090? PRO 6000 — это непрерывные 96 ГБ ECC на одной карте без шардинга и возни с мультикартой, плюс pro-драйверы. 2× 3090 дают 48 ГБ через NVLink-мост в разы дешевле (~$1 800), но это б/у-карты, шум и сложная сборка. PRO 6000 берут за простоту, надёжность и ёмкость, а не за экономию.

Чем PRO 6000 отличается от RTX 5090, кроме памяти? Тот же чип GB202 и 1 792 ГБ/с, но у PRO 6000 96 ГБ против 32, есть ECC-память, профессиональные драйверы (без авто-апдейтов, ломающих CUDA), двухслотовый форм-фактор и редакция Max-Q на 300 Вт. 5090 быстрее окупается для моделей ≤30B; PRO 6000 — для 70B+ и продакшна.

Поддерживает ли RTX PRO 6000 NVLink? Нет. Как и все потребительские и воркстейшн-карты Blackwell, PRO 6000 обходится без NVLink — две карты общаются по PCIe Gen5 ×16 и дают 192 ГБ совокупной памяти. NVLink в 2026 остался только у датацентровых SXM-карт (H100/H200/B200).

Поделиться
Связаться:
Крипто- и data-аналитик, инженер-программист (факультет компьютерных наук ХНУРЭ). В IT с 2008 года: администрировал корпоративный мониторинг в «Vodafone Украина», семь лет разрабатывал и продвигал веб-проекты, пять лет руководил маркетингом на метриках — конверсия, CTR, ROI, LTV.Криптовалютными рынками занимаюсь с 2021 года: ончейн-метрики, токеномика, макроэкономические индикаторы. Разработал собственную data-driven модель анализа рынка на 30+ метрик. Стек — Python (pandas, NumPy, SciPy, matplotlib), математическая статистика и EDA; сбор и сверку данных автоматизирую AI-агентами.Принцип — «Don't trust, verify»: каждая цифра проверена по первоисточнику, ключевые — минимум по двум независимым; прогнозы — только сценарии с условиями. Тезис без данных не публикуется.