Збірка на 2× RTX 3090: бюджетні 48 ГБ під LLM

Коротко (TL;DR)

Дві б/в RTX 3090 — це бюджетний шлях до ємності в локальному ШІ. Кожна карта несе 24 ГБ, а разом через NVLink вони дають 48 ГБ єдиним пулом — більше, ніж у RTX 5090 (32 ГБ), за третину ціни збірки. І цей пул реально вантажить моделі на 70 млрд параметрів, які одна 5090 не запускає в принципі.

Коротко (TL;DR)
Завдання і бюджет
Конфігурація (BOM)
Чому саме дві RTX 3090
Що реально потягне
2× RTX 3090 проти альтернатив
Збірка і налаштування
Апгрейд-шлях
Ризики і слабкі місця
Кому підходить, а кому ні
FAQ

Секретна зброя 3090 — NVLink. Це єдина з трійки 3090/4090/5090 споживча карта зі справжнім мостом між GPU; у 4090 і 5090 його немає. NVLink не просто складає пам’ять — він прискорює інференс на парі карт приблизно на 50% (за замірами на vLLM). За ціною за гігабайт відеопам’яті 3090 поза конкуренцією: ~$27/ГБ проти ~$70/ГБ у 5090.

Але чесно про мінуси. Карта стара (вийшла у 2020-му, виробництво кончилося у 2022), і через дефіцит б/в-ціна підросла: сьогодні це ~$700–1 000 за карту (на eBay у середньому ~$1 010, червень 2026), хоча на дні ринку пару років тому доходило до ~$600. Уся збірка на дві карти — близько $2 500–3 400. Плюс граблі б/в: майнінгове минуле, живлення на 700 Вт, жар і нюанс із лініями PCIe. Нижче — повний BOM з цінами, що реально тягне пара карт, чесна швидкість, розбір ризиків і кому така збірка підходить, а кому ні.

(Дані актуальні на 15 червня 2026; ціни та бенчмарки — з датами в тексті.)

Завдання і бюджет

Ця збірка — для тих, кому потрібна максимальна ємність VRAM за мінімальні гроші: запуск моделей 70B-класу локально, експерименти з великими моделями і MoE, донавчання середніх моделей, плюс генерація картинок. Не мета — рекордна швидкість токенів (її дає 5090) і безшумність (її дають «коробки»).

Бюджет гнучкий і залежить від ринку б/в. Дві RTX 3090 — це ~$1 400–2 000 за карти, плюс платформа з достатніми лініями PCIe, потужний БЖ і корпус із продувкою — ще ~$1 000–1 400. Підсумок — близько $2 500–3 400 (на червень 2026). Це помітно дешевше за збірку на RTX 5090 (~$4 500 з урахуванням платформи), але натомість ви отримуєте більше пам’яті, а не більше швидкості.

Головне правило тут — VRAM вирішує, що ви запустите. Дві 3090 дають 48 ГБ; це і є сенс збірки.

Варто тверезо зважити й альтернативу — оренду. Якщо 70B-моделі потрібні вам нечасто, хмарний GPU виходить дешевше, ніж гарячий риг на дві карти з його електрикою і поратнею. Збірка на 2× 3090 виправдана, коли моделі великі, ганяєте ви їх регулярно і важлива приватність даних — тоді 48 ГБ «у себе» окупаються. Якщо ж це разова цікавість, почніть з однієї карти або оренди, а другу додасте пізніше.

Конфігурація (BOM)

Збалансована конфігурація під пару 3090. Ключовий нюанс — платформа має дати обом картам достатні лінії PCIe (інакше мультикарта втрачає сенс). Ціни — орієнтир на червень 2026.

Компонент	Модель	Ціна	Навіщо саме це
Відеокарти	2× RTX 3090 24 ГБ (б/в)	$1 400–2 000	48 ГБ через NVLink — ядро збірки
Міст NVLink	NVLink-міст для 3090	~$80	дає +50% до інференсу на парі
Процесор	Ryzen 9 9950X / Threadripper	~$550–900	важливі лінії PCIe (x8/x8 мінімум)
Мат. плата	X670E / TRX50 (x8/x8)	~$350–500	розвести обидві карти по PCIe Gen4 x8
Пам’ять	64–128 ГБ DDR5	~$250–400	під систему й offload
Блок живлення	1200–1600 Вт	~$250	700 Вт двох карт + запас
Корпус + NVMe	з продувкою + 2 ТБ NVMe	~$350	дві гарячі карти потребують airflow
Разом		~$2 500–3 400

Зауваження: не беріть дешеву материнку з одним повношвидкісним слотом — друга карта на PCIe x4 заріже продуктивність (про це в ризиках). І обов’язково потужний БЖ: версії 3090 з трьома 8-pin потребують 1200 Вт і вище.

Як не нарватися на вбиту карту. 3090 на вторинці часто з майнінговим минулим, тому перед купівлею: попросіть фото з показниками температур під навантаженням; при отриманні прожену стрес-тест (FurMark або півгодини інференсу) і перевірте пам’ять на помилки; стежте за температурою пам’яті — GDDR6X у 3090 гріється, і значення вище 100–104 °C під навантаженням привід насторожитися; за можливості одразу замініть термопрокладки пам’яті й термопасту — це типова болячка відпрацьованих карт. Карта від геймера краще, ніж із майнінг-ферми, а продавець із поверненням убереже від прихованої деградації пам’яті, яку не видно на око.

Чому саме дві RTX 3090

Три доводи, що роблять цю збірку осмисленою у 2026 році.

NVLink — те, чого більше немає. RTX 3090 — єдина з актуальної трійки споживча карта з NVLink. Міст з’єднує дві карти в пул на 48 ГБ і, на відміну від обміну по PCIe, реально прискорює інференс — на парі 3090 приріст близько 50% (замір на vLLM, Himesh, 2025). Це спростовує поширений міф «інференсу міжкарткова шина не важлива». У 4090 і 5090 NVLink прибрали — там дві карти спілкуються лише по PCIe.

48 ГБ вантажать те, що не лізе в одну карту. Пара 3090 спокійно тримає Llama 70B у 4-біт (~40 ГБ) — а одна RTX 5090 (32 ГБ) її не запускає взагалі, і навіть одна 3090 тягне 70B лише «впритул», в агресивному 4-біт і з мізерним контекстом (GigaGPU, 2026). Для великих моделей ємність важливіша за швидкість — і тут пара 3090 виграє у новішої, але «маленької» 5090.

Найкращий VRAM-за-долар. За ціною за гігабайт відеопам’яті 3090 б’є всіх: близько $27/ГБ проти $42 у б/в 4090 і $70 у 5090 (HostRunway, 2026). Якщо ваша мета — максимум пам’яті за мінімум грошей, дешевше за пару 3090 нічого немає.

Що реально потягне

Швидкість 3090 (Ampere, 936 ГБ/с) скромніша за нові карти, але на потрібних моделях її достатньо (одна карта; пара з NVLink додає ~50% на великих моделях).

Модель	Квант	Влазить	Швидкість, ток/с (1× крім 70B)
Llama 13B	EXL2	так, легко	~50
Mistral 22B	AWQ	так	~30
Qwen 30B (MoE)	4-біт	так	до ~168*
Llama 70B	4-біт	тільки на 2× (48 ГБ)	~15–20 (пара)

*Одна 3090 з MoE-моделлю особливо добра для агентного кодингу (за заміром ure.us, 2026). Повний розбір софту (vLLM, кванти, бекенди) — у розділі локальні нейромережі.

Головний сценарій — саме 70B на парі карт: 48 ГБ дають комфортний запас під ваги і контекст, а NVLink тримає швидкість на рівні ~15–20 ток/с. Приємний бонус — генеративна графіка: 3090 упевнено тягне SDXL на повній роздільності і Flux.

Пара слів про MoE та offload. Моделі виду «суміш експертів» (MoE) активують лише частину ваг на кожен токен, тому йдуть швидше за щільні того самого розміру — одна 3090 з відповідною MoE-моделлю закриває агентний кодинг бадьоріше, ніж очікуєш від карти 2020 року. А якщо модель ледь не влазить у 48 ГБ, llama.cpp уміє вивантажувати частину шарів у системну RAM: повільніше, але робоче — саме тому в BOM закладено 64–128 ГБ оперативки. І пам’ятайте про контекст: на 70B тримайте вікно реалістичним (8–16k токенів), інакше KV-кеш швидко з’їсть запас пам’яті.

2× RTX 3090 проти альтернатив

Дзеркальне порівняння зі збіркою на 5090 та одиночними картами (дані на червень 2026).

Рішення	VRAM / ПЗ	Ціна (карти)	$ за ГБ	NVLink
2× RTX 3090 (б/в)	48 ГБ / 936 ГБ/с	$1 400–2 000	~$27	так
RTX 5090	32 ГБ / 1 792 ГБ/с	$2 500–3 200*	~$70	ні
RTX 4090 (б/в)	24 ГБ / ~1 008 ГБ/с	$900–1 100	~$42	ні
Mac Studio M3 Ultra	до 512 ГБ / 819 ГБ/с	від $3 999	—	—

Ціна за гігабайт відеопам'яті: що нижче, то вигідніше, $/ГБ

* Ціна RTX 5090 — вторинний ринок (MSRP $1 999, але за ним карта майже не продається).

Картина дзеркальна нашій збірці на RTX 5090: там — швидкість і жорстка стеля 32 ГБ, тут — ємність 48 ГБ за третину ціни, але скромніші токени за секунду. 5090 швидше генерує і вміє FP8, зате 2× 3090 запускають 70B, яку вона не вміщає. Якщо ж потрібні зовсім великі моделі (200B+), це вже територія unified-memory — наш огляд Mac Studio M3 Ultra. Короткий підсумок: 2× 3090 — про максимум пам’яті за гроші; 5090 — про швидкість; Mac — про найбільші моделі.

А чому не дві 4090? Теж 48 ГБ, але дорожче (б/в 4090 ~$900–1 100 проти ~$700–1 000 у 3090) і без NVLink — карти спілкуються лише по PCIe, втрачаючи ті самі +50% від моста. Для чистої ємності пара 3090 вигідніша і за грошима, і за швидкістю зв’язки; 4090 має сенс, лише якщо важливіша швидкість одиночної карти і новіша архітектура.

Збірка і налаштування

Практичні нюанси, без яких пара 3090 не розкриється.

Лінії PCIe. Обидві карти мають отримати мінімум PCIe Gen4 x8. Дешеві плати розводять другий слот у x4 — це ріже продуктивність; для серйозної мультикарти краще Threadripper/HEDT із повноцінними лініями.
NVLink-міст. Купіть міст під 3090 (форм-фактор 3-slot або 4-slot під ваш зазор) — без нього ви втрачаєте ті самі +50% і єдиний пул.
Живлення. 350 Вт на карту, 700 Вт за пару — беріть БЖ на 1200–1600 Вт (версії з трьома 8-pin вимогливіші). Не економте: просадки живлення на двох картах ловити неприємно.
Андервольт. Пік ефективності 3090 — близько 220 Вт (Himesh, 2025); на практиці опустіть power limit до 250–300 Вт на карту — втратите трохи швидкості, але заощадите ~100 Вт і помітно знизите жар. Для пари це відчутно за теплом і рахунком за електрику.
Охолодження і розстановка. Дві карти впритул душать одна одну по повітрю. Беріть або турбінні (blower) версії, що викидають гаряче повітря назовні, або рознесіть карти райзером. У тісному корпусі верхня карта гріється сильніше — стежте за її температурами окремо і не ставте обидві впритул.
Софт. vLLM з tensor parallelism розкладає модель на обидві карти; llama.cpp і Ollama теж уміють мультикарту. NVLink особливо допомагає саме в tensor-parallel-режимі.

Апгрейд-шлях

Пам’ять карт не нарощується, але у збірки є простір для зростання:

Третя-четверта 3090. Додавши карти, ви піднімете сумарну VRAM до 72–96 ГБ під зовсім великі моделі. Важливе застереження: NVLink з’єднує лише пари, тому на 4× міжпарний обмін іде по PCIe і приріст від моста падає з +50% до ~10%. Знадобляться платформа з достатніми лініями (Threadripper/HEDT) і БЖ на 2000 Вт і вище.
Більше системної RAM. Розширення до 128–256 ГБ DDR5 дозволяє вивантажувати шари великих MoE-моделей в оперативку, коли вони ледь не влазять у 48 ГБ.
Перехід на швидкість. Якщо вперлися не в пам’ять, а в токени/с, логічний апгрейд — збірка на RTX 5090: менше VRAM, але кратно швидше на моделях, що влазять.

Ризики і слабкі місця

Чесний список (з датами):

Б/в-карти з майнінговим минулим. Багато 3090 на вторинці відпрацювали на майнінгу — перед купівлею стрес-тестуйте, перевіряйте пам’ять і за можливості міняйте термопрокладки (попередження спільноти, 2026).
Ціна підросла. Через дефіцит (виробництво кончилося у 2022, парк майнінг-карт вмирає) б/в 3090 коштують зараз ~$700–1 010 (на eBay у середньому ~$1 010) — помітно дорожче мінімуму ринку пару років тому (~$600); «бюджетна» збірка вже не така дешева (Electronics.Alibaba, березень 2026).
Граблі ліній PCIe. Реальний кейс: власник 4× 3090 випадково посадив карту в прихований слот PCIe 2.0 x4 — лагодження подвоїло продуктивність на Mistral 128B. Перевіряйте, що слоти працюють на заявленій швидкості (r/LocalLLaMA, червень 2026).
Живлення і жар. 700 Вт за пару, БЖ 1200–1600 Вт, шум і серйозний нагрів — це не тиха настільна «коробка», а повноцінний гарячий риг.
NVLink тільки парами. Міст з’єднує лише дві карти; у збірці на 4× 3090 між парами обмін знову йде по PCIe, і буст падає до ~10% — масштаб далі двох карт ускладнюється (Himesh, 2025).

Заради справедливості — плюси роблять збірку найкращим бюджетним вибором: 48 ГБ через NVLink вантажать 70B, найкращий у класі $/ГБ (~$27), реальний буст +50% від моста, і бонусом — відмінна генерація картинок.

Кому підходить, а кому ні

Зберіть 2× RTX 3090, якщо вам потрібні 70B-моделі і максимум VRAM за гроші, ви готові до б/в-карт, складної збірки (лінії PCIe, потужний БЖ) і шуму/жару, а рекордна швидкість токенів не в пріоритеті.
Візьміть одну 3090 (~$700–1 000), якщо вистачає 24 ГБ під моделі до ~30B — це все ще найкращий бюджетний вхід.
Зберіть ПК на RTX 5090, якщо ваші моделі влазять у 32 ГБ і потрібна максимальна швидкість і FP8, а не ємність.
Ідіть в unified-memory (Mac Studio / Strix Halo), якщо потрібні моделі більші за 48 ГБ (200B+) або важливі тиша і компактність.

FAQ

Навіщо дві RTX 3090, а не одна нова карта? Заради ємності за гроші. Дві б/в 3090 дають 48 ГБ через NVLink за ~$1 400–2 000 — більше пам’яті, ніж у RTX 5090 (32 ГБ) за ~$2 500–3 200, і втричі дешевше за ціною за гігабайт ($27 проти $70). Цього вистачає на 70B-моделі, які одна 5090 не запускає.

Чи запустять дві RTX 3090 модель Llama 70B? Так. Пара 3090 (48 ГБ) комфортно тримає Llama 70B у 4-біт (~40 ГБ) із запасом під контекст, видаючи ~15–20 ток/с з NVLink. Одна 3090 (24 ГБ) тягне 70B лише «впритул» в агресивному кванті і з крихітним контекстом — нормальний шлях для 70B саме дві карти.

Що дає NVLink на двох 3090 і чи потрібен він? NVLink — справжній міст між картами (якого немає у 4090 і 5090). Він об’єднує пам’ять у пул на 48 ГБ і прискорює інференс у tensor-parallel-режимі приблизно на 50% (замір на vLLM). Для пари 3090 міст однозначно вартий своїх ~$80.

Скільки коштує зібрати систему на двох 3090? Близько $2 500–3 400 на червень 2026: ~$1 400–2 000 за пару б/в-карт плюс платформа з лініями PCIe, БЖ на 1200–1600 Вт, пам’ять і корпус із продувкою. Це дешевше за збірку на 5090 (~$4 500 з платформою), але дає більше пам’яті, а не більше швидкості.

Який блок живлення й охолодження потрібні для пари 3090? 350 Вт на карту, 700 Вт за пару — беріть БЖ на 1200–1600 Вт (особливо для версій з трьома 8-pin). Обов’язкова добра продувка корпуса: дві карти сильно гріються. Андервольт до 250 Вт заощаджує ~100 Вт на карту з мінімальною втратою швидкості.