25 червня 2026 року NVIDIA і Amazon Web Services оголосили про нові інстанси Amazon EC2 G7 на базі GPU NVIDIA RTX PRO 4500 Blackwell Server Edition. Продуктивність AI-інференсу зросла у 4,6 рази порівняно з G6-інстансами. Одночасно OpenSearch Serverless отримав GPU-прискорений векторний пошук на базі бібліотеки cuVS.
Що сталося
EC2 G7-інстанси: – До 8 GPU NVIDIA RTX PRO 4500 (Blackwell) – 256 ГБ сумарної GPU-пам’яті – 700 Гбіт/с EFA-мережевого інтерфейсу – До 7,6 ТБ NVMe SSD – Порівняно з G6: 4,6x в AI-інференсі, 2,1x у графічних задачах
Це перші Blackwell-інстанси AWS, орієнтовані на інференс і візуальні задачі — на відміну від GB300-інстансів для навчання.
OpenSearch Serverless + NVIDIA cuVS: – GPU-прискорена індексація векторів тепер увімкнена за замовчуванням для всіх векторних колекцій – Швидкість індексації: у 10 разів швидше, вартість — у 4 рази нижче порівняно з CPU-реалізацією – Бази даних на мільярди векторів розгортаються менш ніж за годину
AWS також отримала статус NVIDIA Exemplar Cloud для навчальних навантажень GB300 — підтвердження відповідності продуктивнісним бенчмаркам NVIDIA.
Що це означає
G7-інстанси — практично важливе оновлення для команд, які запускають інференс на AWS: 4,6x при порівнянній ціні змінює економіку. Для задач RAG (пошук за документами, агентські системи) прискорення векторного пошуку у 10 разів знижує latency і вартість операції.
Ширший контекст: архітектура Blackwell від NVIDIA поступово поширюється на всі рівні хмари — від навчання (GB200/B200 для гіперскейлерів) до інференсу і графіки (RTX PRO 4500 для G7). Це означає, що розробники, які будують AI-застосунки на AWS, отримують доступ до тієї самої архітектури, що й у датацентрах провідних AI-лабораторій.
Для локальних AI-розробників: показники Blackwell у хмарі — непрямий орієнтир ефективності споживчих RTX 5090/Pro GPU при локальному інференсі.
