Архитектура AMD RDNA 5 получит существенно переработанную систему параллельного выполнения команд, что позволит графическим процессорам чаще исполнять по две инструкции за такт и заметно повысит производительность шейдеров в ряде задач. На это указывает новый патч для компилятора LLVM, где обнаружены изменения, относящиеся к gfx13, производному от gfx130, то есть к RDNA 5.
Во внедрённом коде LLVM фигурирует новый формат векторных инструкций под названием VOPD3, рассчитанный на более эффективное использование двойного VALU (Vector Arithmetic Logic Unit). В отличие от существующей в RDNA 3/4 схемы VOPD, ориентированной в основном на двухоперандные команды, VOPD3 расширяет поддержку до трёхоперандных инструкций, включая ключевую для вычислительной нагрузки FMA (fused multiply-add). В патче явно добавлена инструкция V_FMA_F32, что указывает на появление соответствующих возможностей в RDNA 5.
Функция dual-issue execution присутствует в Radeon со времён RDNA 3, однако жёсткие правила спаривания инструкций не позволяли компиляторам регулярно задействовать её потенциал, ограничивая реальную пропускную способность FP32. Поддержка VOPD3 и сложных трёхоперандных команд должна снизить число ситуаций, когда парное выполнение невозможно, и тем самым повысить загрузку шейдерных блоков без увеличения площади кристалла и грубого роста IPC.
Увеличение частоты срабатывания dual-issue особенно важно для игровых движков и нейросетевых технологий, где активно используются FMA-операции: рендеринг, апскейлинг, генерация кадров и прочие элементы нейронного рендеринга способны получить ощутимый прирост в пересчёте на один вычислительный блок. При этом рост будет не универсальным для всех сценариев, а наиболее заметным в FP32-нагрузках, хорошо поддающихся векторизации и оптимизации компилятором.
RDNA 5 пока находится в разработке, сроки выхода серийных видеокарт не раскрываются, а потребительский акцент, вероятно, сместится к увеличению числа вычислительных блоков и росту частот. Тем не менее именно такие архитектурные доработки, как расширенная поддержка параллельного выполнения команд и новая схема VOPD3, станут основой для стабильного достижения заявленной производительности и конкурентной борьбы AMD с Nvidia на рынке дискретной графики.