Qualcomm приближает вычисления к памяти: ставка HBC против HBM

2 мин. чтения
$30,100 + $5,030
Bybit
$30,100 + $5,030
100 USDT в подарок
Получить →

Что произошло

Qualcomm представила архитектуру памяти HBC (High-Bandwidth Compute) под брендом Dragonfly — ставку на то, чтобы считать данные прямо рядом с памятью и обойти «стену памяти» в ИИ-инференсе. Технологию показали на Investor Day компании 23 июня 2026 года; подробный разбор The Register вышел 30 июня.

Детали

Идея HBC — сблизить вычисления и память: слои DRAM (недорогой LPDDR, а не дорогой HBM) соединяются с логикой сквозными вертикальными соединениями TSV, и часть операций считается на базовом кристалле под стеком, чтобы не гонять данные к основному чипу. Заголовок The Register («закопать вычисления под DRAM») — упрощение: в итоговой реализации DRAM, наоборот, стекается над логикой, чтобы уйти от теплового потолка.

Выигрыш нацелен на фазу decode в работе больших языковых моделей (генерация по одному токену упирается в пропускную способность памяти, а не в вычисления). Роадмап: AI200 без HBC — конец 2026 года (LPDDR, 768 ГБ на карту); AI250 на HBC первого поколения — начало 2027 года (заявлено ~18× пропускной способности AI200); AI300 — 2028 год. Маркетинговые цифры Qualcomm: около 6× пропускной способности на ватт против HBM и более 200× ёмкости против SRAM на кристалле.

Что это значит

Новость касается тех, кто следит за железом под локальный ИИ и инференс больших моделей. Смысл сдвига: индустрия ищет, как удешевить и охладить инференс, уходя от дорожающего HBM к схеме «считаем у памяти». Но у Qualcomm это пока роадмап на 2027–2028 годы, а не отгружаемый чип: пиковые FLOPS не раскрыты, а заявленные множители пропускной способности The Register называет спорными — например, «эффективные» 414 ТБ/с на одном LPDDR5x потребовали бы физически нереальной шины. Горизонт — годы: первые HBC-чипы обещаны на 2027-й, и туда же, по слухам, идут NVIDIA, AMD и стартап d-Matrix, так что реальную расстановку покажут бенчмарки, а не презентации.

Контекст

Ранее Qualcomm представила датацентр-ускорители линейки Dragonfly — мы разбирали ту новость. HBC — следующий шаг той же ставки: сделать инференс дешевле и энергоэффективнее, чем на дорогом HBM.

$30,100 + $5,030
Bybit
$30,100 + $5,030
100 USDT в подарок
Получить →
Поделиться
Связаться:
Крипто- и data-аналитик, инженер-программист (факультет компьютерных наук ХНУРЭ). В IT с 2008 года: администрировал корпоративный мониторинг в «Vodafone Украина», семь лет разрабатывал и продвигал веб-проекты, пять лет руководил маркетингом на метриках — конверсия, CTR, ROI, LTV.Криптовалютными рынками занимаюсь с 2021 года: ончейн-метрики, токеномика, макроэкономические индикаторы. Разработал собственную data-driven модель анализа рынка на 30+ метрик. Стек — Python (pandas, NumPy, SciPy, matplotlib), математическая статистика и EDA; сбор и сверку данных автоматизирую AI-агентами.Принцип — «Don't trust, verify»: каждая цифра проверена по первоисточнику, ключевые — минимум по двум независимым; прогнозы — только сценарии с условиями. Тезис без данных не публикуется.