NVIDIA и AWS запустили G7-инстансы с Blackwell: 4,6x инференс, 10x векторный поиск

Обновление: 2026/06/26

2 мин. чтения

Первый в мире фьючерс на счёт матча. Авто-расчёт по финалу.

25 июня 2026 года NVIDIA и Amazon Web Services объявили о новых инстансах Amazon EC2 G7, основанных на GPU NVIDIA RTX PRO 4500 Blackwell Server Edition. Производительность в AI-инференсе выросла в 4,6 раза по сравнению с G6-инстансами. Одновременно OpenSearch Serverless получил GPU-ускоренный векторный поиск на базе библиотеки cuVS.

Что произошло
Что это значит

Что произошло

EC2 G7-инстансы: — До 8 GPU NVIDIA RTX PRO 4500 (Blackwell) — 256 ГБ суммарной GPU-памяти — 700 Гбит/с EFA-сетевого интерфейса — До 7,6 ТБ NVMe SSD — По сравнению с G6: 4,6x в AI-инференсе, 2,1x в графических задачах

Это первые Blackwell-инстансы AWS, ориентированные на инференс и визуальные задачи — в отличие от GB300-инстансов для обучения.

OpenSearch Serverless + NVIDIA cuVS: — GPU-ускоренная индексация векторов теперь включена по умолчанию для всех векторных коллекций — Скорость индексации: в 10 раз быстрее, стоимость — в 4 раза ниже по сравнению с CPU-реализацией — Базы данных на миллиарды векторов разворачиваются менее чем за час

AWS также получила статус NVIDIA Exemplar Cloud для обучающих нагрузок GB300 — подтверждение соответствия производительностным бенчмаркам NVIDIA.

Что это значит

G7-инстансы — практически важное обновление для команд, которые запускают инференс на AWS: 4,6x при сопоставимой цене меняет экономику. Для задач RAG (поиск по документам, агентские системы) ускорение векторного поиска в 10 раз снижает latency и стоимость операции.

Более широкий контекст: Blackwell-архитектура NVIDIA постепенно распространяется на все уровни облака — от обучения (GB200/B200 для гиперскейлеров) до инференса и графики (RTX PRO 4500 для G7). Это означает, что разработчики, строящие AI-приложения на AWS, получают доступ к той же архитектуре, что и в дата-центрах крупнейших AI-лабораторий.

Для локальных AI-разработчиков: показатели Blackwell в облаке — косвенный ориентир эффективности потребительских RTX 5090/Pro GPU при локальном инференсе.

до 555%

Bybit · Savings

до 555%

годовых на Savings + награды новичкам

Начни сейчас

ТЕГИ:datacenter for-ai for-ai-llm nvidia

ИСТОЧНИКИ:NVIDIA / HPCwire AWS Blog

ByVolodymyr Polkovnichenko

Связаться:

Крипто- и data-аналитик, инженер-программист (факультет компьютерных наук ХНУРЭ). В IT с 2008 года: администрировал корпоративный мониторинг в «Vodafone Украина», семь лет разрабатывал и продвигал веб-проекты, пять лет руководил маркетингом на метриках — конверсия, CTR, ROI, LTV.Криптовалютными рынками занимаюсь с 2021 года: ончейн-метрики, токеномика, макроэкономические индикаторы. Разработал собственную data-driven модель анализа рынка на 30+ метрик. Стек — Python (pandas, NumPy, SciPy, matplotlib), математическая статистика и EDA; сбор и сверку данных автоматизирую AI-агентами.Принцип — «Don't trust, verify»: каждая цифра проверена по первоисточнику, ключевые — минимум по двум независимым; прогнозы — только сценарии с условиями. Тезис без данных не публикуется.