GPT-4o — это последняя и самая лучшая большая языковая модель (LLM) ИИ, выпущенная OpenAI, и она несет в себе множество новых функций как для бесплатных, так и для платных пользователей.
Это мультимодальный ИИ, который улучшает ChatGPT, обеспечивая более быстрые ответы, более глубокое понимание и ряд новых возможностей, которые будут появляться в ближайшие недели.
Учитывая растущую конкуренцию со стороны Llama 3 от Meta и Gemini от Google, последняя версия OpenAI стремится быть впереди всех. Вот почему это так интересно.

Доступность и цена
Если вы давно пользуетесь бесплатной версией ChatGPT и с завистью наблюдаете за функциями, которыми пользуются пользователи ChatGPT Plus, то у вас есть отличные новости! Теперь и вы можете играть с распознаванием изображений, загружать файлы, находить пользовательские GPT в GPT Store, использовать память для сохранения разговора в чате, чтобы не повторяться, анализировать данные и выполнять сложные вычисления.
И все это наряду с более высоким интеллектом стандартной модели GPT-4, аналогом которой является GPT-4o, даже если она была обучена с нуля как мультимодальный ИИ. Причина, по которой это стало возможным, заключается в том, что GPT-4o гораздо дешевле в вычислениях, а значит, требует меньше жетонов, что делает его более жизнеспособным для широкой базы пользователей.
Однако у бесплатных пользователей будет ограниченное количество сообщений, которые они могут отправлять в GPT-4o в день. Когда этот порог будет достигнут, вы перейдете на модель GPT-3.5.

GPT-4o намного быстрее
GPT-4 отличается от GPT-3.5 по ряду параметров, и скорость — один из них.
Хотя скорость ответа кажется скорее приятной особенностью, нежели меняющей игру, тот факт, что вы можете получать ответы практически в реальном времени, делает GPT-4o гораздо более жизнеспособным инструментом для таких задач, как перевод и разговорная помощь.
Расширенная голосовая поддержка
Несмотря на то, что в дебюте GPT-4o может работать только с текстом и изображениями, он был создан с нуля, чтобы использовать голосовые команды и взаимодействовать с пользователями с помощью аудио. Это означает, что если GPT-4 мог воспринимать голос, преобразовывать его в текст, отвечать на него, а затем преобразовывать текстовый ответ в голосовой, то GPT-4o может слышать голос и отвечать на него.
Благодаря улучшенной скорости он может отвечать гораздо более разговорчиво и понимать такие уникальные аспекты голоса, как тон, темп, настроение и многое другое.
GPT-4o может смеяться, язвить, ловить себя на ошибках и корректировать их в процессе разговора, а вы можете прервать его, не сбивая его реакцию. Он также может понимать разные языки и переводить на лету, что позволяет использовать его в качестве инструмента перевода в режиме реального времени. Он может петь — и даже дуэтом с самим собой.
Это можно использовать для подготовки к собеседованию, обучения пению, управления NPC в ролевых играх, рассказывания драматических сказок на ночь разными голосами и персонажами, создания озвученных диалогов для игрового проекта, рассказывания шуток (и смеха в ответ на ваши) и многого другого.
Улучшенное понимание
GPT-4o понимает вас гораздо лучше, чем его предшественники, особенно если вы разговариваете с ним. Он гораздо лучше улавливает тон и намерения, а если вы хотите, чтобы он был расслабленным и дружелюбным, он будет шутить с вами, пытаясь поддержать разговор.
Когда он анализирует код или текст, он гораздо лучше учитывает ваши намерения, что позволяет ему давать нужный ответ и не требовать особых подсказок. Он лучше читает видео и изображения, что делает его способным понимать окружающий мир.
В нескольких демонстрациях OpenAI показывал пользователям, как снимает комнату, в которой они находятся, а затем модели GPT-4o описывали ее. В одном из видео ИИ даже описал пространство комнаты другой своей версии, которая затем дала свои собственные ответы, основанные на этом описании.
Нативное приложение для настольной системы macOS
Нативный ИИ в Windows пока ограничивается очень ограниченным Copilot (на данный момент), но пользователи macOS скоро смогут в полной мере использовать ChatGPT и его новую модель GPT-4o прямо с рабочего стола.
С новым приложением для настольных компьютеров ChatGPT станет более доступным — и с новым пользовательским интерфейсом в придачу — что сделает его использование более удобным, чем когда-либо прежде.

Приложение станет доступным для большинства пользователей ChatGPT Plus в ближайшие дни, а в ближайшие недели будет распространено на бесплатных пользователей. Версия для Windows обещает появиться в конце этого года.
Еще не все готово
На момент написания статьи в открытом доступе находятся только текстовый и графический режимы GPT-4o. Нет ни расширенной голосовой поддержки, ни понимания видео в реальном времени, а приложение для настольной системы macOS не будет доступно всем желающим еще как минимум несколько дней.
Но все это уже на подходе. Эти изменения и другие интересные обновления для ChatGPT уже не за горами.