Впечатлив нас своим генеративным искусственным интеллектом в письменной, а затем и в устной речи, OpenAI считает, что пришло время перейти на следующий уровень. Вчера вечером компания, стоящая за Chat GPT, объявила о начале внедрения для небольшого числа платящих пользователей «улучшенного голосового режима», под которым понимается еще более естественный голос, приближенный к человеческому!
Улучшенная версия голосового режима ChatGPT в первую очередь для платных пользователей
С 30 июля OpenAI начал внедрять свой расширенный голосовой режим для избранной группы платных пользователей ChatGPT, при этом компания не уточнила, предназначена ли эта новая функция только для англоязычных пользователей. Расширенный голосовой режим призван обеспечить еще более естественный и мгновенный обмен сообщениями с искусственным интеллектом. С самого начала OpenAI поставила перед собой цель сделать так, чтобы при использовании голосового режима ChatGPT пользователи чувствовали себя так, как будто они разговаривают с человеком.
We’re starting to roll out advanced Voice Mode to a small group of ChatGPT Plus users. Advanced Voice Mode offers more natural, real-time conversations, allows you to interrupt anytime, and senses and responds to your emotions. pic.twitter.com/64O94EhhXK
— OpenAI (@OpenAI) July 30, 2024
Эта улучшенная версия позволяет не только прерывать ответы, но и распознавать юмор, сарказм и другие разговорные нюансы. Одним из замечательных нововведений является то, что новой модели не нужно преобразовывать речь в текст, что значительно снижает задержки при обмене сообщениями с пользователем. В результате мы сразу же получаем более плавное и отзывчивое взаимодействие, что делает пользовательский опыт более приятным и реалистичным.
Еще в мае OpenAI представила этот продвинутый голосовой режим с помощью голоса ИИ по имени Скай. Однако этот голос был поразительно похож на голос актрисы Скарлетт Йоханссон, и это было сделано без ее разрешения. Несмотря на несколько предложений от генерального директора OpenAI Сэма Альтмана, Скарлетт Йоханссон отказалась от предложения предоставить свой голос ChatGPT.
Чтобы избежать дальнейших скандалов, OpenAI интегрировала в этот продвинутый голосовой режим четыре предопределенных голоса, особо следя за тем, чтобы не имитировать знаменитые голоса. Это предостережение призвано избежать любых споров и разногласий, подобных тем, что возникли при имитации голоса Скарлетт Йоханссон.
Почему такое «робкое» развертывание голосового GPT?
Первоначальное тестирование расширенного голосового режима необходимо для улучшения этой функции перед ее широкомасштабным развертыванием. Пользователи, получившие доступ к этому режиму, получат письмо с подробными инструкциями.
В зависимости от результатов и развития этого «бета-периода» OpenAI планирует постепенно добавлять новых пользователей. Осенью все подписчики Plus получат доступ к расширенному голосовому режиму.
Что касается бесплатных подписчиков, то они смогут воспользоваться этой функцией, но это будет в отдаленном будущем.