AMD RDNA 5 расширит dual-issue: шейдеры станут чаще выполнять две команды за такт

Архитектура AMD RDNA 5 получит существенно переработанную систему параллельного выполнения команд, что позволит графическим процессорам чаще исполнять по две инструкции за такт и заметно повысит производительность шейдеров в ряде задач. На это указывает новый патч для компилятора LLVM, где обнаружены изменения, относящиеся к gfx13, производному от gfx130, то есть к RDNA 5.

AMD RDNA 5 расширит dual-issue: шейдеры станут чаще выполнять две команды за такт

Во внедрённом коде LLVM фигурирует новый формат векторных инструкций под названием VOPD3, рассчитанный на более эффективное использование двойного VALU (Vector Arithmetic Logic Unit). В отличие от существующей в RDNA 3/4 схемы VOPD, ориентированной в основном на двухоперандные команды, VOPD3 расширяет поддержку до трёхоперандных инструкций, включая ключевую для вычислительной нагрузки FMA (fused multiply-add). В патче явно добавлена инструкция V_FMA_F32, что указывает на появление соответствующих возможностей в RDNA 5.

Функция dual-issue execution присутствует в Radeon со времён RDNA 3, однако жёсткие правила спаривания инструкций не позволяли компиляторам регулярно задействовать её потенциал, ограничивая реальную пропускную способность FP32. Поддержка VOPD3 и сложных трёхоперандных команд должна снизить число ситуаций, когда парное выполнение невозможно, и тем самым повысить загрузку шейдерных блоков без увеличения площади кристалла и грубого роста IPC.

Увеличение частоты срабатывания dual-issue особенно важно для игровых движков и нейросетевых технологий, где активно используются FMA-операции: рендеринг, апскейлинг, генерация кадров и прочие элементы нейронного рендеринга способны получить ощутимый прирост в пересчёте на один вычислительный блок. При этом рост будет не универсальным для всех сценариев, а наиболее заметным в FP32-нагрузках, хорошо поддающихся векторизации и оптимизации компилятором.

RDNA 5 пока находится в разработке, сроки выхода серийных видеокарт не раскрываются, а потребительский акцент, вероятно, сместится к увеличению числа вычислительных блоков и росту частот. Тем не менее именно такие архитектурные доработки, как расширенная поддержка параллельного выполнения команд и новая схема VOPD3, станут основой для стабильного достижения заявленной производительности и конкурентной борьбы AMD с Nvidia на рынке дискретной графики.

Тоже интересно