Google AI продвигается вперед благодаря ChatGPT: Gemini Pro 1.5 поднимается на ступеньку выше

Последнее обновление: 2024/06/20 at 11:40 ДП

Опубликовано 20.06.2024

3 Мин. чтение

Google не может остановиться в своем стремлении вернуть себе трон искусственного интеллекта, ведь престиж компании зависит от этого. И, не зная, какое огромное количество сопутствующих сюрпризов ожидает нас на следующей Google I/O, компания просто эволюционировала большую часть своих текущих моделей. В планах даже революция в Gmail, включая Gemini.

Шаг за шагом, новинка за новинкой, Google совершенствует свой генеративный искусственный интеллект, пытаясь отвоевать позиции перед лицом огромного ускорения, достигнутого ее главным конкурентом, ChatGPT от Open AI. И Gemini имеет огромное значение в стратегии Google, поскольку компания приложила все усилия для разработки мультимодальной стратегии, чтобы противостоять всему, что предлагает чат GPT, с помощью лучшего оружия. Дуэль чатботов превращается в битву почти на смерть.

Google специализирует свой генеративный ИИ на изображениях и аудио

На недавнем мероприятии, посвященном облачным технологиям и возможностям искусственного интеллекта, компания Google объявила все новости, предназначенные для ее клиентов, особенно бизнес-клиентов. Поскольку Workspace привлек к себе много внимания, хотя не все в нем относится к профессиональному ИИ, пользователи Android также получат выгоду от качественного и функционального скачка Gemini.

Gemini Pro 1.5

Google продолжает совершенствовать свои основные генеративные движки ИИ, в данном случае это Image2, для создания графического контента, и Gemini Pro 1.5, промежуточная языковая модель (из трех, которые есть у Gemini).

По словам компании, увеличиваются возможности генерации и интерпретации; кроме того, вводятся новые функции, чтобы обеспечить большую широту контента, подходящего для чат-ботов.

Среди новых возможностей Google AI следующие:

Image2 получает возможность создавать Gif. Если вы уже получали очень хорошие результаты при создании изображений с помощью таких инструментов, как Gemini (только в США), то теперь Google предоставляет Image2 возможность создавать Gif-файлы длительностью до четырех секунд, просто попросив его об этом. Кроме того, Google включит невидимый водяной знак для идентификации контента, созданного искусственным интеллектом.
Gemini Pro 1.5 теперь анализирует аудиоконтент. Помимо текста и изображений, чатбот может идентифицировать любой фрагмент звука без необходимости транскрибировать его в текст. Это позволяет, например, подвести итоги разговора. Или из интервью.
ИИ Google теперь создает видео: Появился Google Vids. Этот инструмент, в настоящее время предназначенный исключительно для профессиональных пользователей Workspace, позволит создавать видеоролики на основе заказа. В принципе, контент подойдет для презентаций и тому подобного.
Близнецы приходят в Gmail. Скачок, который готовила Google, скоро произойдет: модели Gemini появятся в почтовом клиенте, так что создание новых писем станет простым запросом. Кроме того, в Gmail появятся голосовые команды.

Как обычно, все эти новости, связанные с искусственным интеллектом, будут постепенно доходить до пользователей. Сначала ими воспользуются подписчики Google Workspaces, а затем они доберутся и до сервисов для частных лиц. Gemini появится в Gmail только для подписчиков Google One, в том числе и в мобильном приложении.