DDN готує сховище під Nvidia Rubin: KV-кеш прискорює інференс у 55 разів

Оновлення: 2026/06/25

2 хв. читання

Приз-фонд $40K+

BINANCE

Приз-фонд $40K+

Перший до $175M обсягу — +7000 USDC

ТОРГУВАТИ

Що сталося

24 червня 2026 року на конференції ISC 2026 компанія DDN представила нове сховище для ШІ-навантажень — масив AI400X3M — і розподілене прискорення KV-кешу на базі Nvidia Dynamo. Обидва рішення націлені на попит, який створить платформа Nvidia Vera Rubin, що готується до виходу.

Що сталося
Деталі
Що це означає
Контекст

Деталі

Масив AI400X3M. До 190 ГБ/с на читання і до 110 ГБ/с на послідовний запис; стійка таких шасі видає до 160 млн IOPS. Приріст читання — до 35% до попереднього покоління.
Прискорення KV-кешу. Після технологічного прев’ю на Nvidia GTC 2026 DDN офіційно запустила розподілену архітектуру KV-кешу з інтеграцією Nvidia Dynamo — вона працює і в об’єктному сховищі Infinia, і у файловій системі EXAScaler. Заявлено до 55× швидшого завантаження KV-кешу для масштабного інференсу.
Що це дає на платформі Rubin. За даними DDN, зв’язка забезпечує до 99% утилізації GPU у великих ШІ-середовищах і зниження часу до першого токена (TTFT) на 20–40% для інференсу з довгим контекстом.

Що це означає

Тема вузька, але важлива для всіх, хто запускає великі мовні моделі в продакшені — від хмарних провайдерів до корпоративних ШІ-команд. Суть у тому, що вузьким місцем інференсу дедалі частіше стає не сам GPU, а швидкість, з якою до нього подається контекст: KV-кеш (проміжний «стан» моделі за вже обробленими токенами) за довгих запитів доводиться постійно перечитувати. Прискорення його завантаження до 55× і зниження TTFT на 20–40% означає конкретну економіку: дорогі прискорювачі простоюють менше (заявлено до 99% утилізації), а відгук моделі на довгому контексті швидший. Для ринку це ще один сигнал, що під хвилю Rubin переоснащують не лише обчислення, а й сховище. Горизонт — найближчі квартали, у міру виходу платформи Vera Rubin. Цифри продуктивності — дані вендора, їх варто перевіряти на реальних навантаженнях.

Контекст

Це частина ширшого тренду: інфраструктура під ШІ дорожчає й ускладнюється по всьому ланцюгу — ми вже писали про зростання вартості ШІ-дата-центрів.

Mystery Box до 500 USDC

BINANCE • до 26.06

Mystery Box до 500 USDC

Запрошуй друзів на Binance — збирай бокси

Приєднатися

ТЕГИ:datacenter for-ai-llm nvidia

ДЖЕРЕЛА:StorageReview Blocks & Files

Поділитися

ByVolodymyr Polkovnichenko

Зв'язатися:

Крипто- та data-аналітик, інженер-програміст (факультет комп'ютерних наук ХНУРЕ). В IT з 2008 року: адміністрував корпоративний моніторинг у «Vodafone Україна», сім років розробляв і просував веб-проєкти, п'ять років керував маркетингом на метриках — конверсія, CTR, ROI, LTV.Криптовалютними ринками займаюся з 2021 року: ончейн-метрики, токеноміка, макроекономічні індикатори. Розробив власну data-driven модель аналізу ринку на 30+ метрик. Стек — Python (pandas, NumPy, SciPy, matplotlib), математична статистика та EDA; збір і звірку даних автоматизую AI-агентами.Принцип — «Don't trust, verify»: кожна цифра перевірена за першоджерелом, ключові — щонайменше за двома незалежними; прогнози — лише сценарії з умовами. Теза без даних не публікується.