OpenAI впервые за пять лет открыла исходники двух новых ИИ-моделей
OpenAI объявила о выпуске сразу двух языковых моделей с открытым исходным кодом — это первое подобное решение компании со времён GPT-2 в 2019 году. Разработчик подчёркивает, что модели рассчитаны на автономную работу без подключения к облаку и могут свободно модифицироваться под конкретные задачи благодаря опубликованным весам и инструментариям.
По словам OpenAI, главное отличие новинок — адаптируемость: их можно запускать на локальных серверах, рабочих станциях и даже продвинутых ноутбуках, а также дообучать на собственных датасетах. Такой подход должен упростить создание корпоративных чат-ботов, кодовых ассистентов и офлайн-переводчиков, снижая зависимость от сторонних API и повышая конфиденциальность данных.
Выход открытых LLM компания связывает с запросом разработчиков на прозрачность и контролируемость моделей. За последние месяцы рынок насытился конкурентами с открытыми весами — от Meta Llama-2 до Mistral. На прошлой неделе Tencent представила четыре компактные модели Hunyuan объёмом 0,5–7 млрд параметров с гигантским контекстом 256K токенов и «гибридным мышлением», способным переключаться между быстрым и глубоким режимом рассуждений. На этом фоне решение OpenAI воспринимается как попытка сохранить влияние в быстрорастущем open-source-сообществе.
В комплект поставки входят модели, скрипты для инференса и инструкции по тонкой настройке. Код уже доступен на GitHub под свободной лицензией, допускающей коммерческое использование при соблюдении условий безопасности. Флагманские GPT-3.5 и GPT-4 по-прежнему остаются закрытыми, однако OpenAI заявляет, что будет «тщательно оценивать» дальнейшее открытие на основе реакции сообщества.
Аналитики отмечают, что открытие исходников может ускорить внедрение ИИ в образовательные, медицинские и промышленные проекты, где регуляторика требует локального хранения данных. При этом эксперты предупреждают о рисках злоупотреблений и подчёркивают необходимость встроенных систем фильтрации контента — механизмов, которые OpenAI интегрировала в новые модели по умолчанию.
Публикация моделей уже вызвала всплеск активности на профильных форумах: разработчики делятся результатами первых бенчмарков и экспериментируют с квантованием для запуска на потребительских видеокартах. Если тенденция сохранится, рынок LLM может получить ещё один мощный катализатор для перехода на открытые решения.