Phoronix впервые протестировал 88-ядерный Nvidia Vera: Arm-сервер вышел на уровень EPYC и Xeon
Портал Phoronix опубликовал первые результаты тестирования серверного процессора Nvidia Vera, и они ставят его в один ряд с флагманскими x86‑чипами AMD EPYC и Intel Xeon. В ряде сценариев, характерных для центров обработки данных и ИИ‑нагрузок, новый Arm‑процессор не только держится на минимальной дистанции от конкурентов, но и выходит вперёд.

Nvidia Vera — это 88-ядерный CPU на архитектуре Armv9.2 ISA с поддержкой 176 потоков. Вместо лицензирования готовых ядер Arm компания использовала собственное кастомное ядро Olympus, что делает платформу более сопоставимой по подходу с решениями Apple, но уже в серверном сегменте. Vera поддерживает точность FP8 и рассчитан на совместную работу с ИИ‑ускорителями Vera Rubin, а также на независенное использование в ЦОД, облаках и ИИ‑лабораториях.
Тесты Phoronix, проведённые в штаб‑квартире Nvidia в Санта‑Кларе, включали компиляцию кода, проверки пропускной способности памяти, кодирование видео AV1, нагрузки на Python и Java (OpenJDK), сжатие данных, LuaJIT и часть баз данных. В геометрическом среднем Vera занял первое место среди протестированных систем, опередив лучшие AMD EPYC примерно на 11% и односокетные Intel Xeon почти на 55%. Особенно сильные результаты были показаны в LuaJIT FFT, ClickHouse и Renaissance JVM.
Однопоточная производительность стала одной из главных неожиданностей. В сборке ядра Linux Vera возглавила таблицу серверных процессоров, а при компиляции Gem5 по показателю «на ядро» уступила лишь AMD EPYC 9575F. Такое сближение с x86 по эффективности на поток Ларабель из Phoronix ранее не наблюдал ни у одного другого ARM64‑решения. При этом Vera показывает более чем полуторакратный прирост производительности по сравнению с прошлым CPU Nvidia Grace на Arm Neoverse V2.
Энергопакет Vera заявлен на уровне 450 Вт, плюс около 50 Вт потребляет высокоскоростная память SOCAMM2. Для сравнения, конкурентные EPYC и Xeon рассчитаны на 500 Вт без учёта памяти. Однако Nvidia ограничила проведение полноценных тестов энергопотребления, поэтому делать выводы по энергоэффективности пока рано. Важным козырем выглядит и зрелость программной поддержки: бенчмарки выполнялись на основной ветке ядра Linux без экзотических патчей и «костылей», что критично для быстрого развёртывания в ЦОД.
Архитектурно Vera ориентирован на обслуживание сложных ИИ‑нагрузок и агентных систем. Процессор поддерживает до 1,5 Тбайт LPDDR5X с пропускной способностью до 1,2 Тбайт/с и использует межъядерную шину Scalable Coherency Fabric второго поколения с пропускной способностью до 3,4 Тбайт/с, что помогает снижать задержки по сравнению с чиплетными решениями. На фоне бурного роста рынка ИИ‑процессоров аналитики уже оценивают потенциальные продажи Vera и Grace в десятки миллиардов долларов, что может вывести Nvidia в число крупнейших поставщиков серверных CPU в ближайшие годы.
