NVIDIA і AWS запустили G7-інстанси з Blackwell: 4,6x інференс, 10x векторний пошук

Оновлення: 2026/06/26

2 хв. читання

25 червня 2026 року NVIDIA і Amazon Web Services оголосили про нові інстанси Amazon EC2 G7 на базі GPU NVIDIA RTX PRO 4500 Blackwell Server Edition. Продуктивність AI-інференсу зросла у 4,6 рази порівняно з G6-інстансами. Одночасно OpenSearch Serverless отримав GPU-прискорений векторний пошук на базі бібліотеки cuVS.

Що сталося
Що це означає

Що сталося

EC2 G7-інстанси: – До 8 GPU NVIDIA RTX PRO 4500 (Blackwell) – 256 ГБ сумарної GPU-пам’яті – 700 Гбіт/с EFA-мережевого інтерфейсу – До 7,6 ТБ NVMe SSD – Порівняно з G6: 4,6x в AI-інференсі, 2,1x у графічних задачах

Це перші Blackwell-інстанси AWS, орієнтовані на інференс і візуальні задачі — на відміну від GB300-інстансів для навчання.

OpenSearch Serverless + NVIDIA cuVS: – GPU-прискорена індексація векторів тепер увімкнена за замовчуванням для всіх векторних колекцій – Швидкість індексації: у 10 разів швидше, вартість — у 4 рази нижче порівняно з CPU-реалізацією – Бази даних на мільярди векторів розгортаються менш ніж за годину

AWS також отримала статус NVIDIA Exemplar Cloud для навчальних навантажень GB300 — підтвердження відповідності продуктивнісним бенчмаркам NVIDIA.

Що це означає

G7-інстанси — практично важливе оновлення для команд, які запускають інференс на AWS: 4,6x при порівнянній ціні змінює економіку. Для задач RAG (пошук за документами, агентські системи) прискорення векторного пошуку у 10 разів знижує latency і вартість операції.

Ширший контекст: архітектура Blackwell від NVIDIA поступово поширюється на всі рівні хмари — від навчання (GB200/B200 для гіперскейлерів) до інференсу і графіки (RTX PRO 4500 для G7). Це означає, що розробники, які будують AI-застосунки на AWS, отримують доступ до тієї самої архітектури, що й у датацентрах провідних AI-лабораторій.

Для локальних AI-розробників: показники Blackwell у хмарі — непрямий орієнтир ефективності споживчих RTX 5090/Pro GPU при локальному інференсі.

Mystery Box до 500 USDC

BINANCE • до 26.06

Mystery Box до 500 USDC

Запрошуй друзів на Binance — збирай бокси

Приєднатися

ТЕГИ:datacenter for-ai for-ai-llm nvidia

ДЖЕРЕЛА:NVIDIA / HPCwire AWS Blog

Поділитися

ByVolodymyr Polkovnichenko

Зв'язатися:

Крипто- та data-аналітик, інженер-програміст (факультет комп'ютерних наук ХНУРЕ). В IT з 2008 року: адміністрував корпоративний моніторинг у «Vodafone Україна», сім років розробляв і просував веб-проєкти, п'ять років керував маркетингом на метриках — конверсія, CTR, ROI, LTV.Криптовалютними ринками займаюся з 2021 року: ончейн-метрики, токеноміка, макроекономічні індикатори. Розробив власну data-driven модель аналізу ринку на 30+ метрик. Стек — Python (pandas, NumPy, SciPy, matplotlib), математична статистика та EDA; збір і звірку даних автоматизую AI-агентами.Принцип — «Don't trust, verify»: кожна цифра перевірена за першоджерелом, ключові — щонайменше за двома незалежними; прогнози — лише сценарії з умовами. Теза без даних не публікується.