Компания OpenAI своим последним заявлением сделала значительный скачок в мире разговорного ИИ. ChatGPT-4, популярный чат-бот компании, теперь может «видеть, слышать и говорить», что знаменует собой существенное обновление его возможностей.
Эта разработка является частью более широких усилий лидеров в области ИИ, таких как OpenAI, Microsoft, Google и Anthropic, направленных на то, чтобы оставаться впереди в гонке вооружений ИИ.
Новые возможности обновленного ChatGPT-4
В своем революционном заявлении OpenAI сообщила, что ChatGPT получил возможность понимать устную речь, отвечать искусственным голосом и обрабатывать изображения.

Это революционное обновление представляет собой поворотный момент в эволюции чат-ботов и диалогов, управляемых искусственным интеллектом.
Наиболее заметные дополнения к репертуару ChatGPT включают:
Голосовые разговоры
Теперь пользователи могут вести голосовые беседы с ChatGPT через мобильное приложение. Эта функция позволяет сделать взаимодействие с чатботом более захватывающим и естественным.
OpenAI предлагает пользователям на выбор пять различных синтетических голосов, которыми может отвечать ChatGPT, что еще больше расширяет возможности общения.
Обработка изображений
Еще одним замечательным дополнением является новая способность ChatGPT обрабатывать изображения. Пользователи могут делиться с чатботом изображениями и даже выделять на них отдельные области для анализа или запроса.
Например, пользователи могут задавать вопросы типа «Что это за облака?», и ChatGPT будет давать информативные ответы, основываясь на содержании изображения.
Доступность и развертывание
Компания OpenAI заявила, что эти интересные изменения будут постепенно распространяться среди платных пользователей в течение следующих двух недель.
В то время как голосовые функции будут доступны только в приложениях для iOS и Android, возможности обработки изображений будут доступны на всех платформах, что сделает их более доступными для пользователей вне зависимости от их предпочтений.
Гонка вооружений в области ИИ
Эта разработка происходит на фоне жесткой конкурентной гонки вооружений в области ИИ между лидерами отрасли. OpenAI, Microsoft, Google и Anthropic постоянно внедряют инновации и новые функции, чтобы закрепить свои позиции в авангарде технологий разговорного ИИ.
Например, Google недавно объявила о ряде обновлений своего чат-бота Bard, а Microsoft интегрировала в Bing возможности визуального поиска. Острая конкуренция привела к значительным инвестициям в ИИ, ярким примером которых являются дополнительные 10 млрд. долл. инвестиций Microsoft в OpenAI в начале этого года.
Опасения и меры предосторожности
Однако внедрение синтетических голосов, генерируемых искусственным интеллектом, вызывает определенные опасения. Такие голоса способны обеспечить пользователям более естественное общение, но в то же время они несут в себе риск создания более убедительных подделок. Участники киберугроз и исследователи уже начали изучать возможности использования «глубоких подделок» для проникновения в системы кибербезопасности.
OpenAI активно реагирует на эти опасения. Компания заявила, что синтетические голоса, используемые в ChatGPT, были «созданы с помощью актеров озвучивания, с которыми мы непосредственно работали», что гарантирует, что голоса не были получены от незнакомцев.
В условиях предоставления услуг OpenAI подчеркивается, что потребители владеют своими данными «в той мере, в какой это разрешено действующим законодательством».
Кроме того, OpenAI уточнила, что аудиозаписи не сохраняются и не используются для улучшения моделей.
https://gpt-chatbot.ru/chat-gpt-opisanie-modeli-ee-vozmozhnostej