Что произошло
Qualcomm представила архитектуру памяти HBC (High-Bandwidth Compute) под брендом Dragonfly — ставку на то, чтобы считать данные прямо рядом с памятью и обойти «стену памяти» в ИИ-инференсе. Технологию показали на Investor Day компании 23 июня 2026 года; подробный разбор The Register вышел 30 июня.
Детали
Идея HBC — сблизить вычисления и память: слои DRAM (недорогой LPDDR, а не дорогой HBM) соединяются с логикой сквозными вертикальными соединениями TSV, и часть операций считается на базовом кристалле под стеком, чтобы не гонять данные к основному чипу. Заголовок The Register («закопать вычисления под DRAM») — упрощение: в итоговой реализации DRAM, наоборот, стекается над логикой, чтобы уйти от теплового потолка.
Выигрыш нацелен на фазу decode в работе больших языковых моделей (генерация по одному токену упирается в пропускную способность памяти, а не в вычисления). Роадмап: AI200 без HBC — конец 2026 года (LPDDR, 768 ГБ на карту); AI250 на HBC первого поколения — начало 2027 года (заявлено ~18× пропускной способности AI200); AI300 — 2028 год. Маркетинговые цифры Qualcomm: около 6× пропускной способности на ватт против HBM и более 200× ёмкости против SRAM на кристалле.
Что это значит
Новость касается тех, кто следит за железом под локальный ИИ и инференс больших моделей. Смысл сдвига: индустрия ищет, как удешевить и охладить инференс, уходя от дорожающего HBM к схеме «считаем у памяти». Но у Qualcomm это пока роадмап на 2027–2028 годы, а не отгружаемый чип: пиковые FLOPS не раскрыты, а заявленные множители пропускной способности The Register называет спорными — например, «эффективные» 414 ТБ/с на одном LPDDR5x потребовали бы физически нереальной шины. Горизонт — годы: первые HBC-чипы обещаны на 2027-й, и туда же, по слухам, идут NVIDIA, AMD и стартап d-Matrix, так что реальную расстановку покажут бенчмарки, а не презентации.
Контекст
Ранее Qualcomm представила датацентр-ускорители линейки Dragonfly — мы разбирали ту новость. HBC — следующий шаг той же ставки: сделать инференс дешевле и энергоэффективнее, чем на дорогом HBM.
