Nvidia на CES 2026 представила суперкомпьютер Vera Rubin NVL72 для дата-центров ИИ

На CES 2026 компания Nvidia официально представила новое поколение архитектуры для центров обработки данных на базе искусственного интеллекта — Rubin, преемницу Blackwell. Флагманским продуктом линейки стал суперкомпьютер Vera Rubin NVL72, который, по заявлению компании, должен радикально снизить стоимость инференса и ускорить обучение больших моделей ИИ.

Nvidia на CES 2026 представила суперкомпьютер Vera Rubin NVL72 для дата-центров ИИ

Архитектура Rubin строится вокруг шести типов чипов: GPU Rubin, CPU Vera, шины NVLink 6, сетевых адаптеров ConnectX-9, процессоров DPU BlueField-4 и Ethernet-коммутаторов Spectrum-X на базе чипа Spectrum-6. В составе стойки NVL72 используется суперчип Vera Rubin, объединяющий один центральный процессор Vera и два графических процессора Rubin. Одна такая стойка обеспечивает суммарную производительность до 3,6 EFLOPS и включает 54 ТБ оперативной памяти LPDDR5x и 20,7 ТБ памяти HBM4.

GPU Rubin — специализированный двухкристальный ускоритель ИИ с 336 млрд транзисторов. Он развивает 50 PFLOPS на инференсе и 35 PFLOPS при обучении в формате NVFP4, что в 5 и 3,5 раза соответственно превосходит Blackwell GB200. Каждый GPU оснащён восемью стеками памяти HBM4 общим объёмом 288 ГБ и пропускной способностью до 22 ТБ/с. Для межсоединений используется NVLink 6 с пропускной способностью до 3,6 ТБ/с на один GPU; в каждой стойке NVL72 установлено девять коммутаторов NVLink 6 с суммарной пропускной способностью 260 ТБ/с.

CPU Vera основан на кастомной архитектуре Arm под кодовым названием Olympus и включает 88 ядер с поддержкой 176 потоков благодаря технологии Spatial Multi-Threading. По данным Nvidia, Vera вдвое превосходит CPU Grace в обработке данных и компрессии. Для масштабирования стоек в крупные кластеры компания предлагает Ethernet-решение Spectrum-X с поддержкой скоростей до 102,4 Тбит/с, а также новую платформу хранения Inference Context Memory на базе DPU BlueField-4, оптимизированную под работу с кэшем ключ-значение для больших ИИ-моделей.

Nvidia утверждает, что переход на Rubin позволит в 4 раза сократить количество GPU, необходимых для обучения моделей со смесью экспертов (MoE), а стоимость обработки одного токена при инференсе может снизиться до 10 раз по сравнению с системами на базе Blackwell GB200. Производитель сообщил, что все шесть ключевых чипов уже получены от партнёров, серийное производство Rubin стартует в первом квартале 2026 года, а массовый выпуск систем Vera Rubin NVL72 и первые поставки клиентам ожидаются во второй половине и к концу 2026 года.

Тоже интересно