AMD RDNA 5 расширит dual-issue: шейдеры станут чаще выполнять две команды за такт

Архитектура AMD RDNA 5 получит существенно переработанную систему параллельного выполнения команд, что позволит графическим процессорам чаще исполнять по две инструкции за такт и заметно повысит производительность шейдеров в ряде задач. На это указывает новый патч для компилятора LLVM, где обнаружены изменения, относящиеся к gfx13, производному от gfx130, то есть к RDNA 5.

Во внедрённом коде LLVM фигурирует новый формат векторных инструкций под названием VOPD3, рассчитанный на более эффективное использование двойного VALU (Vector Arithmetic Logic Unit). В отличие от существующей в RDNA 3/4 схемы VOPD, ориентированной в основном на двухоперандные команды, VOPD3 расширяет поддержку до трёхоперандных инструкций, включая ключевую для вычислительной нагрузки FMA (fused multiply-add). В патче явно добавлена инструкция V_FMA_F32, что указывает на появление соответствующих возможностей в RDNA 5.

Функция dual-issue execution присутствует в Radeon со времён RDNA 3, однако жёсткие правила спаривания инструкций не позволяли компиляторам регулярно задействовать её потенциал, ограничивая реальную пропускную способность FP32. Поддержка VOPD3 и сложных трёхоперандных команд должна снизить число ситуаций, когда парное выполнение невозможно, и тем самым повысить загрузку шейдерных блоков без увеличения площади кристалла и грубого роста IPC.

Увеличение частоты срабатывания dual-issue особенно важно для игровых движков и нейросетевых технологий, где активно используются FMA-операции: рендеринг, апскейлинг, генерация кадров и прочие элементы нейронного рендеринга способны получить ощутимый прирост в пересчёте на один вычислительный блок. При этом рост будет не универсальным для всех сценариев, а наиболее заметным в FP32-нагрузках, хорошо поддающихся векторизации и оптимизации компилятором.

RDNA 5 пока находится в разработке, сроки выхода серийных видеокарт не раскрываются, а потребительский акцент, вероятно, сместится к увеличению числа вычислительных блоков и росту частот. Тем не менее именно такие архитектурные доработки, как расширенная поддержка параллельного выполнения команд и новая схема VOPD3, станут основой для стабильного достижения заявленной производительности и конкурентной борьбы AMD с Nvidia на рынке дискретной графики.

Первый складной iPhone приблизился к релизу: инсайдеры раскрыли сроки и почти «плоский» сгиб »

« Как превратить старый Kindle в идеальный e Ink‑дисплей для умного дома

The Elec: базовый Samsung Galaxy S26 сохранит камеры Galaxy S25 из-за давления iPhone 17