Драйвер AMD Adrenalin 25.8.1 открывает запуск локальных LLM до 128 млрд параметров и расширяет контекст до 256 тыс. токенов

AMD выпустила версию драйвера Adrenalin Edition 25.8.1, которая значительно повышает ИИ-возможности потребительских процессоров компании. Обновление официально поддерживает крупные языковые модели объёмом до 128 млрд параметров и увеличивает окно контекста до 256000 токенов — в 60 раз больше привычных 4096. Это позволяет запускать на домашнем ПК такие решения, как Llama 4 Scout, обрабатывать длинные диалоги и крупные массивы кода без риска потери контекста.

Драйвер AMD Adrenalin 25.8.1 открывает запуск локальных LLM до 128 млрд параметров и расширяет контекст до 256 тыс. токенов

Ключевым компонентом остаётся встроенный в APU движок XDNA. В актуальных чипах Strix Point и Strix Halo он уже обеспечивал солидную скорость инференса, но именно свежий драйвер раскрывает потенциал «железа». Благодаря технологии Variable Graphics Memory integrated GPU теперь может динамически получать до 96 ГБ системной памяти и использовать её как видеопамять, что критично при работе с моделями сверхвысокой ёмкости.

Увеличение контекстного окна напрямую влияет на сценарии применения ПК. Раньше специалисты ограничивались небольшими кусками текста или кода; теперь возможно анализировать целые проекты, юридические документы или непроцессированные транскрипты встреч. При этом обработка идёт локально, то есть без передачи данных в облако и связанных с этим задержек или рисков конфиденциальности.

Пока что главные носители новой функциональности — мобильные и десктопные системы на базе Strix Halo. Их выбор невелик, а цена устройств стартует примерно с 2000 долларов, потому массовое распространение решения ожидается лишь после выхода следующих поколений APU AMD. Тем не менее драйвер уже доступен для загрузки и демонстрирует направление, в котором компания собирается развивать платформу.

AMD активно расширяет своё присутствие на рынке ИИ, конкурируя с Intel и Nvidia не только в области дискретных GPU, но и через унифицированную экосистему процессор + NPU. Последнее обновление Adrenalin подтверждает стратегию: сделать запуск продвинутых моделей и больших контекстов доступным без специализированных серверов и облачных подписок.

Тоже интересно