Google не может остановиться в своем стремлении вернуть себе трон искусственного интеллекта, ведь престиж компании зависит от этого. И, не зная, какое огромное количество сопутствующих сюрпризов ожидает нас на следующей Google I/O, компания просто эволюционировала большую часть своих текущих моделей. В планах даже революция в Gmail, включая Gemini.
Шаг за шагом, новинка за новинкой, Google совершенствует свой генеративный искусственный интеллект, пытаясь отвоевать позиции перед лицом огромного ускорения, достигнутого ее главным конкурентом, ChatGPT от Open AI. И Gemini имеет огромное значение в стратегии Google, поскольку компания приложила все усилия для разработки мультимодальной стратегии, чтобы противостоять всему, что предлагает чат GPT, с помощью лучшего оружия. Дуэль чатботов превращается в битву почти на смерть.
Google специализирует свой генеративный ИИ на изображениях и аудио
На недавнем мероприятии, посвященном облачным технологиям и возможностям искусственного интеллекта, компания Google объявила все новости, предназначенные для ее клиентов, особенно бизнес-клиентов. Поскольку Workspace привлек к себе много внимания, хотя не все в нем относится к профессиональному ИИ, пользователи Android также получат выгоду от качественного и функционального скачка Gemini.

Google продолжает совершенствовать свои основные генеративные движки ИИ, в данном случае это Image2, для создания графического контента, и Gemini Pro 1.5, промежуточная языковая модель (из трех, которые есть у Gemini).
По словам компании, увеличиваются возможности генерации и интерпретации; кроме того, вводятся новые функции, чтобы обеспечить большую широту контента, подходящего для чат-ботов.
Среди новых возможностей Google AI следующие:
- Image2 получает возможность создавать Gif. Если вы уже получали очень хорошие результаты при создании изображений с помощью таких инструментов, как Gemini (только в США), то теперь Google предоставляет Image2 возможность создавать Gif-файлы длительностью до четырех секунд, просто попросив его об этом. Кроме того, Google включит невидимый водяной знак для идентификации контента, созданного искусственным интеллектом.
- Gemini Pro 1.5 теперь анализирует аудиоконтент. Помимо текста и изображений, чатбот может идентифицировать любой фрагмент звука без необходимости транскрибировать его в текст. Это позволяет, например, подвести итоги разговора. Или из интервью.
- ИИ Google теперь создает видео: Появился Google Vids. Этот инструмент, в настоящее время предназначенный исключительно для профессиональных пользователей Workspace, позволит создавать видеоролики на основе заказа. В принципе, контент подойдет для презентаций и тому подобного.
- Близнецы приходят в Gmail. Скачок, который готовила Google, скоро произойдет: модели Gemini появятся в почтовом клиенте, так что создание новых писем станет простым запросом. Кроме того, в Gmail появятся голосовые команды.
Как обычно, все эти новости, связанные с искусственным интеллектом, будут постепенно доходить до пользователей. Сначала ими воспользуются подписчики Google Workspaces, а затем они доберутся и до сервисов для частных лиц. Gemini появится в Gmail только для подписчиков Google One, в том числе и в мобильном приложении.