На конференции GTC 2026 компания NVIDIA официально представила серверный процессор Vera с 88 специализированными ядрами Olympus и платформу Vera Rubin. Новый CPU разрабатывался специально под нагрузки агентного ИИ, обучения с подкреплением и логического вывода и должен стать основой для модульных стоек дата-центров следующего поколения. По словам Дженсена Хуанга, Vera обеспечивает вдвое лучшую производительность на ватт по сравнению с любыми существующими процессорами и станет для NVIDIA основой нового многомиллиардного направления бизнеса.
Vera построена на архитектуре Arm v9.2-A и использует разработанные NVIDIA ядра Olympus с приростом IPC до 50% относительно Grace. Одной из ключевых особенностей стала технология пространственной многопоточности (Spatial Multi-Threading), при которой потоки получают физически разделённые исполнительные блоки, кеши и регистровые файлы. Это позволяет двум потокам реально выполняться параллельно, повышает пропускную способность и предсказуемость производительности в средах с большим числом изолированных окружений.
Все 88 ядер объединены в единый вычислительный домен без NUMA-разделения, что уменьшает задержки доступа к памяти и упрощает программирование. Процессор использует до 1,5 Тбайт LPDDR5X в модулях SOCAMM с суммарной пропускной способностью до 1,2 Тбайт/с, более чем вдвое выше Grace. Средняя пропускная способность на ядро достигает 13,6 Гбайт/с, а при неравномерной нагрузке отдельное ядро может получать до 80 Гбайт/с. Архитектура дополняется десятиканальным декодером инструкций, нейросетевым предсказателем ветвлений, специализированным префетчером для графовых БД и буфером инструкций, оптимизированным под PyTorch. Поддерживается Confidential Computing для создания защищённых доменов CPU и GPU.
Для связи с графическими ускорителями и между кристаллами используется интерфейс NVLink-C2C с когерентной пропускной способностью до 1,8 Тбайт/с — примерно в семь раз выше PCIe 6.0. Vera поддерживает двухсокетные конфигурации и современные стандарты дата-центров, включая PCIe 6.0 и CXL 3.1. В сочетании с GPU Rubin в составе Vera Rubin платформа обещает в четыре раза меньшее число GPU для обучения моделей на основе смеси экспертов по сравнению с Blackwell и до десятикратного роста производительности логического вывода на ватт при снижении стоимости токена.
NVIDIA представила и готовые стойки Vera CPU Rack: до 256 процессоров Vera с жидкостным охлаждением, 74 сетевых процессора BlueField-4 DPU и адаптеры ConnectX SuperNIC. Такая стойка обеспечивает до 400 Тбайт LPDDR5 и около 300 Тбайт/с суммарной пропускной способности памяти, поддерживая до 22 500 изолированных вычислительных сред и свыше 45 тыс. потоков. По сравнению с Grace прирост производительности в типовых задачах — от 1,8 до 2,2 раза. Расширенная платформа Vera Rubin объединяет стойки NVL72 с 72 GPU Rubin и 36 CPU Vera, системы хранения BlueField-4 STX, Ethernet-коммутаторы Spectrum-6 SPX и стойки LPX для логического вывода.
Vera станет первым серверным процессором NVIDIA, который компания будет массово продавать сторонним заказчикам, хотя доступен он будет в единственной конфигурации. Новая платформа уже поддерживается крупными облачными провайдерами и ИИ-лабораториями, включая Amazon Web Services, Google Cloud, Microsoft Azure, Oracle Cloud Infrastructure, Alibaba, ByteDance, CoreWeave, Lambda, Nebius, OpenAI и Anthropic. Среди партнёров по серверному железу заявлены Dell, HPE, Lenovo, Supermicro, ASUS, Foxconn, GIGABYTE, QCT, Wistron и Wiwynn. Процессоры Vera запущены в массовое производство, а поставки гиперскейлерам и OEM-партнёрам ожидаются во второй половине 2026 года.