X

Samsung начнёт поставки Nvidia 10 000 12-слойных чипов HBM3E для ИИ-ускорителей

Samsung договорилась отгрузить Nvidia первую партию из 10 000 стека-чипов памяти HBM3E в 12-слойной конфигурации. Соглашение стало возможным после того, как корейский производитель в апреле успешно прошёл квалификационные тесты Nvidia, ранее дважды завершавшиеся неудачей. Для Samsung это первый крупный контракт на поставку высокоскоростной памяти в решения крупнейшего поставщика ИИ-ускорителей.

По сведениям AlphaBiz, речь идёт о HBM3E-12H объёмом 36 ГБ с пропускной способностью 1280 ГБ/с. Чипы используют тонкопластинчатый (TSV) 3D-стек, обеспечивая более высокие частоты и энергоэффективность по сравнению с HBM3. Несмотря на достигнутую сертификацию, объёмы пока останутся ограниченными: Nvidia по-прежнему опирается на SK Hynix и Micron, но появление третьего поставщика снизит риски дефицита в условиях стремительного роста рынка.

Спрос на HBM стимулирует продолжающийся бум генеративного ИИ: новые кластеры данных строятся вокруг графических процессоров Nvidia H100, H200 и анонсированного B100, для которых пропускная способность памяти критична. Производителей HBM всего трое, поэтому любое расширение предложения влияет на цены и сроки поставок. Аналитики ожидают, что контракт с Samsung поддержит котировки компании и одновременно усилит давление на конкурентов, особенно на Micron, испытывающую трудности с переходом к HBM4.

По данным индустрии, Samsung уже отправила Nvidia инженерные образцы HBM4 со скоростью 11 Гбит/с на контакт, опередив планку в 10 Гбит/с, заданную заказчиком. Если сертификация пройдёт быстро, компания сможет увеличить долю рынка, используя свободные площади в чистых комнатах для быстрого наращивания выпуска.

HBM3E позиционируется как промежуточное поколение до HBM4. Оно поддерживает до 16 стаков и до 64 ГБ на устройство, обеспечивая свыше 1,2 ТБ/с отдачи при компактном корпусе. Такие характеристики делают новые чипы оптимальными для ИИ-обучения, ускорения LLM и высокопроизводительных вычислений, где каждое наносекундное уменьшение задержек конвертируется в существенную экономию вычислительного времени.