X

Huawei усилила Ascend 950PR и программный стек CANN Next для конкуренции с NVIDIA в Китае

Huawei готовит к выходу новый ИИ-ускоритель Ascend 950PR, который должен стать более привлекательной альтернативой решениям Nvidia для китайских облачных провайдеров. Как сообщает Reuters, ключевое внимание крупных заказчиков привлекает не только вычислительная мощность новинки, но и серьёзно улучшенная совместимость с привычной для разработчиков экосистемой CUDA.

По данным агентства, многие китайские компании до сих пор предпочитают ускорители Nvidia именно из-за зрелой программной среды и стандартов разработки, сложившихся вокруг CUDA. Собственный стек Huawei под названием CANN долгое время не обеспечивал сопоставимого удобства и совместимости, что сдерживало массовый переход на архитектуру Ascend. В Huawei пытаются изменить ситуацию с выходом CANN Next, который, как утверждается, заметно приблизил модель программирования к тому, к чему привыкли разработчики на стороне Nvidia.

Новая версия платформы получила элементы и подходы, похожие на CUDA, однако Huawei не пытается полностью её заменить. Задача компании — дать возможность работать в максимально знакомой логике, а оптимизацию и маппинг вычислительных задач уже выполнять под собственную архитектуру Ascend. Такой подход, по информации Reuters, сделал Ascend 950PR значительно более интересным для крупных китайских заказчиков, которые не хотят полностью перерабатывать существующий код и инструменты.

Источники агентства утверждают, что ByteDance и Alibaba уже планируют размещать заказы на Ascend 950PR. Huawei, в свою очередь, рассчитывает выпустить около 750 тысяч чипов этой серии в течение года, чтобы закрыть растущий внутренний спрос на альтернативы Nvidia. Доступ к американским ускорителям для китайского рынка осложнён из‑за экспортных ограничений, поэтому локальным игрокам приходится либо арендовать мощности за рубежом, либо ускоренно искать и внедрять отечественные решения.

Согласно опубликованным техническим данным, Ascend 950PR обеспечивает производительность до 1 PFLOPS в формате FP8 и до 2 PFLOPS в FP4. Межчиповое соединение заявлено с пропускной способностью 2 ТБ/с, а собственная память HiBL 1.0 объёмом 128 ГБ предлагает до 1,6 ТБ/с. Наличие собственной высокоскоростной подсистемы памяти должно помочь Huawei лучше контролировать себестоимость и снижать риски, связанные с масштабированием поставок традиционной HBM-памяти.

На фоне дефицита и регуляторного давления вокруг GPU Nvidia, такие характеристики и программная совместимость делают Ascend 950PR одним из ключевых кандидатов на роль основного ИИ-ускорителя для китайских дата-центров. Успех решения во многом будет зависеть от того, насколько CANN Next действительно упростит перенос существующих ИИ‑моделей и инфраструктуры, ориентированных сегодня на CUDA.