X

OpenAI объединяет команды ради аудио ИИ и готовит линейку разговорных устройств

OpenAI усиливает направление аудио ИИ и готовится к выходу на рынок аппаратных устройств с разговорным искусственным интеллектом. По данным The Information, за последние два месяца компания объединила несколько инженерных, продуктовых и исследовательских команд в единую структуру, чтобы модернизировать существующие аудиомодели и подготовить их к использованию в персональном устройстве, ориентированном на голосовое взаимодействие. Появление первого продукта ожидается примерно через год.

Новая аудиомодель OpenAI, запуск которой, по сведениям источников, намечен на начало 2026 года, должна сделать общение с ИИ заметно более естественным. Речь системы будет ближе к живому человеческому диалогу: модель научат делать уместные паузы, вести беседу в более свободном формате и даже продолжать говорить одновременно с пользователем — то, чего текущие решения, как правило, не умеют. Такой уровень интерактивности важен для устройств, которые позиционируются не как инструмент, а как постоянный ИИ-компаньон.

OpenAI якобы планирует целое семейство гаджетов на базе аудио ИИ. В числе рассматриваемых форм-факторов называются смарт-очки и умные колонки без экрана, которые будут использоваться прежде всего для разговорного взаимодействия — в роли помощника и собеседника. Это вписывается в более широкий тренд на conversational AI: в США умные колонки уже есть более чем у трети домовладений, Meta развивает голосовые функции в умных очках Ray-Ban, Google тестирует аудиообзор поисковой выдачи, а Tesla интегрирует чат-бота Grok в свои электромобили для голосового управления функциями машины.

При этом рынок носимых и персональных ИИ-гаджетов остается рискованным. Проект Humane с брошей AI Pin провалился, а кулон Friend AI с функциями виртуального собеседника вызвал волну критики из-за вопросов конфиденциальности и, по оценкам наблюдателей, вряд ли станет массовым продуктом. На этом фоне шаг OpenAI может стать тестом на то, насколько зрелыми стали аудиотехнологии и готов ли рынок к повседневному общению с ИИ в формате естественного диалога.

OpenAI, основанная в 2015 году в Сан-Франциско, уже известна массовому рынку прежде всего по моделям GPT и сервису ChatGPT, запустившему бум генеративного ИИ. Сейчас компания, формально являющаяся корпорацией с социальной ответственностью, декларирует цель сделать перспективные технологии, включая будущий AGI, максимально полезными для всего человечества. Переход к собственным аппаратным решениям с аудио ИИ укладывается в эту стратегию как попытка превратить ИИ из абстрактного сервиса в постоянно доступный, привычный интерфейс взаимодействия с цифровым миром.