Китайская компания DeepSeek на этой неделе намерена представить новую крупную языковую модель V4, о чём сообщает Financial Times со ссылкой на осведомлённые источники. Анонс планируют приурочить к парламентскому заседанию в Китае, которое стартует 4 марта. Это будет крупнейший релиз компании со времён вывода на рынок рассуждающей модели R1 в январе прошлого года.
Главным отличием DeepSeek V4 станет полноценная мультимодальность. Если предыдущие версии фокусировались на работе с текстом и программным кодом, то новая модель получит поддержку обработки и генерации изображений и видео. При этом анонс сопровождается минимумом официальных подробностей: представители DeepSeek, Huawei и Cambricon отказываются от комментариев до формального объявления.
Ключевая особенность V4 — глубокая оптимизация под китайские аппаратные решения. Инженеры DeepSeek тесно сотрудничали с Huawei и Cambricon, адаптируя архитектуру модели под местные ускорители. По данным источников, компания даже сознательно не оптимизировала V4 под ускорители Nvidia, что должно простимулировать спрос на отечественные чипы и сократить зависимость Китая от импортных компонентов, находящихся под санкционным давлением.
Ранее DeepSeek получила известность благодаря модели R1 и чат-боту, которые позиционировались как сопоставимые по качеству с западными аналогами, но значительно более дешёвые и быстрые в обучении. Компания, основанная в Ханчжоу в 2023 году предпринимателем Ляном Вэньфэном при поддержке фонда High-Flyer, уже выпустила универсальную модель DeepSeek-V3 и специализированную Janus Pro для работы с изображениями. Аннотация к DeepSeek V4 сначала выйдет в сокращённом формате, а полный технический отчёт ожидается примерно через месяц.