25 июня 2026 года NVIDIA и Amazon Web Services объявили о новых инстансах Amazon EC2 G7, основанных на GPU NVIDIA RTX PRO 4500 Blackwell Server Edition. Производительность в AI-инференсе выросла в 4,6 раза по сравнению с G6-инстансами. Одновременно OpenSearch Serverless получил GPU-ускоренный векторный поиск на базе библиотеки cuVS.
Что произошло
EC2 G7-инстансы: — До 8 GPU NVIDIA RTX PRO 4500 (Blackwell) — 256 ГБ суммарной GPU-памяти — 700 Гбит/с EFA-сетевого интерфейса — До 7,6 ТБ NVMe SSD — По сравнению с G6: 4,6x в AI-инференсе, 2,1x в графических задачах
Это первые Blackwell-инстансы AWS, ориентированные на инференс и визуальные задачи — в отличие от GB300-инстансов для обучения.
OpenSearch Serverless + NVIDIA cuVS: — GPU-ускоренная индексация векторов теперь включена по умолчанию для всех векторных коллекций — Скорость индексации: в 10 раз быстрее, стоимость — в 4 раза ниже по сравнению с CPU-реализацией — Базы данных на миллиарды векторов разворачиваются менее чем за час
AWS также получила статус NVIDIA Exemplar Cloud для обучающих нагрузок GB300 — подтверждение соответствия производительностным бенчмаркам NVIDIA.
Что это значит
G7-инстансы — практически важное обновление для команд, которые запускают инференс на AWS: 4,6x при сопоставимой цене меняет экономику. Для задач RAG (поиск по документам, агентские системы) ускорение векторного поиска в 10 раз снижает latency и стоимость операции.
Более широкий контекст: Blackwell-архитектура NVIDIA постепенно распространяется на все уровни облака — от обучения (GB200/B200 для гиперскейлеров) до инференса и графики (RTX PRO 4500 для G7). Это означает, что разработчики, строящие AI-приложения на AWS, получают доступ к той же архитектуре, что и в дата-центрах крупнейших AI-лабораторий.
Для локальных AI-разработчиков: показатели Blackwell в облаке — косвенный ориентир эффективности потребительских RTX 5090/Pro GPU при локальном инференсе.
