Нейросеть для создания реалистичных видео, генератор изображений Imagen 3: что показала Google на конференции I/O 2024

Собрали некоторые анонсы, о которых компания рассказала на презентации.

В «Google Фото» летом 2024 года появится экспериментальная функция Ask Photos: с её помощью пользователи смогут найти в галерее конкретные снимки или информацию на них. Например, можно спросить: «Какой номер у моего автомобиля?». Тот найдёт нужную фотографию и ответит, прикрепив снимок.

Gemini в Google Workspace теперь использует Gemini 1.5 Pro: помощник сможет давать более содержательные ответы и отвечать на большее количество вопросов. Летом 2024 года функции станут доступны всем платным подписчикам Gemini.
Компания начинает внедрять AI Overviews — краткие сводки по теме в поиске со ссылками на источники — для всех пользователей в США, а позже и в других странах.
Для запросов на английском языке в США «скоро» появится экспериментальная функция запросов из нескольких частей с одним ответом. Например, пользователь может попросить найти лучшие студии йоги в городе, показать детали об их предложениях и время ходьбы от определённого места. ИИ предложит несколько вариантов и покажет их на карте.

Источник: Google

Пользователи смогут искать что-то через Google Lens, записывая видео. Например, вместо описания, что именно не работает в проигрывателе, пользователь может загрузить видео и задать вопрос. Поиск по видео «скоро» будет доступен пользователям Search Labs на английском языке в США.

Источник: Google

Компания представила версию Gemini 1.5 Flash — «самую быструю» модель Gemini, которая работает по API. Версия Gemini Nano появится в десктопном Chrome.
Google анонсировала Imagen 3 — генеративную ИИ-модель для создания изображений: она лучше понимает текстовые запросы, меньше ошибается и позволяет создавать более чёткий текст на изображениях.

«Ответ Google на Sora от OpenAI», как пишет The Verge, — генеративная модель ИИ Veo для создания видео с разрешением 1080p. Пользователи смогут создавать ролики в разных стилях. Сервис протестируют некоторые авторы.

Источник: Google

Google показала прототип Project Astra — мультимодального ИИ-помощника. Компания рассчитывает, что он станет универсальным виртуальным помощником, взаимодействовать с которым можно через камеру. В ролике, например, помощник описывает код на экране, помогает найти очки и решить задачу в реальном времени.

Google также анонсировала Gemini Live, которая будет доступна подписчикам Gemini Advanced в «ближайшие месяцы». Пользователи смогут при разговоре с Gemini выбрать голос для ответа, прерывать ответ уточняющими вопросами, а сам помощник адаптируется к манере речи говорящего. The Verge сравнивает анонс с работой GPT-4o от OpenAI, которую компания показала накануне.

Артур Томилко

Техника

10.05.2023

Cкладной Pixel Fold, планшет Pixel Tabet и новые возможности ИИ — о чём рассказала Google на конференции I/O 2023

Помимо новых устройств, компания представила второе поколение своей языковой модели, объявила о сотрудничестве с Adobe и показала инструмент для генерации музыки.

#новости #google