Що сталося
Qualcomm представила архітектуру пам’яті HBC (High-Bandwidth Compute) під брендом Dragonfly — ставку на те, щоб рахувати дані просто поряд із пам’яттю й обійти «стіну пам’яті» в ШІ-інференсі. Технологію показали на Investor Day компанії 23 червня 2026 року; докладний розбір The Register вийшов 30 червня.
Деталі
Ідея HBC — зблизити обчислення й пам’ять: шари DRAM (недорогий LPDDR, а не дорогий HBM) з’єднуються з логікою наскрізними вертикальними з’єднаннями TSV, і частина операцій рахується на базовому кристалі під стеком, щоб не ганяти дані до основного чипа. Заголовок The Register («закопати обчислення під DRAM») — спрощення: у підсумковій реалізації DRAM, навпаки, стекується над логікою, щоб піти від теплового стелі.
Виграш націлений на фазу decode у роботі великих мовних моделей (генерація по одному токену впирається в пропускну здатність пам’яті, а не в обчислення). Роадмап: AI200 без HBC — кінець 2026 року (LPDDR, 768 ГБ на карту); AI250 на HBC першого покоління — початок 2027 року (заявлено ~18× пропускної здатності AI200); AI300 — 2028 рік. Маркетингові цифри Qualcomm: близько 6× пропускної здатності на ват проти HBM і понад 200× ємності проти SRAM на кристалі.
Що це означає
Новина стосується тих, хто стежить за залізом під локальний ШІ та інференс великих моделей. Суть зсуву: індустрія шукає, як здешевити й охолодити інференс, ідучи від HBM, що дорожчає, до схеми «рахуємо біля пам’яті». Але в Qualcomm це поки роадмап на 2027–2028 роки, а не чип, що відвантажується: пікові FLOPS не розкрито, а заявлені множники пропускної здатності The Register називає спірними — наприклад, «ефективні» 414 ТБ/с на одному LPDDR5x потребували б фізично нереальної шини. Горизонт — роки: перші HBC-чипи обіцяні на 2027-й, і туди ж, за чутками, ідуть NVIDIA, AMD і стартап d-Matrix, тож реальну розстановку покажуть бенчмарки, а не презентації.
Контекст
Раніше Qualcomm представила датацентрові прискорювачі лінійки Dragonfly — ми розбирали ту новину. HBC — наступний крок тієї самої ставки: зробити інференс дешевшим і енергоефективнішим, ніж на дорогому HBM.
