Нейросеть для создания реалистичных видео, генератор изображений Imagen 3: что показала Google на конференции I/O 2024

Собрали некоторые анонсы, о которых компания рассказала на презентации.

  • В «Google Фото» летом 2024 года появится экспериментальная функция Ask Photos: с её помощью пользователи смогут найти в галерее конкретные снимки или информацию на них. Например, можно спросить: «Какой номер у моего автомобиля?». Тот найдёт нужную фотографию и ответит, прикрепив снимок.
Источник: The Verge
Источник: The Verge
  • Gemini в Google Workspace теперь использует Gemini 1.5 Pro: помощник сможет давать более содержательные ответы и отвечать на большее количество вопросов. Летом 2024 года функции станут доступны всем платным подписчикам Gemini.
  • Компания начинает внедрять AI Overviews — краткие сводки по теме в поиске со ссылками на источники — для всех пользователей в США, а позже и в других странах.
  • Для запросов на английском языке в США «скоро» появится экспериментальная функция запросов из нескольких частей с одним ответом. Например, пользователь может попросить найти лучшие студии йоги в городе, показать детали об их предложениях и время ходьбы от определённого места. ИИ предложит несколько вариантов и покажет их на карте.
Источник: Google
  • Пользователи смогут искать что-то через Google Lens, записывая видео. Например, вместо описания, что именно не работает в проигрывателе, пользователь может загрузить видео и задать вопрос. Поиск по видео «скоро» будет доступен пользователям Search Labs на английском языке в США.
Источник: Google
  • Компания представила версию Gemini 1.5 Flash — «самую быструю» модель Gemini, которая работает по API. Версия Gemini Nano появится в десктопном Chrome.
  • Google анонсировала Imagen 3 — генеративную ИИ-модель для создания изображений: она лучше понимает текстовые запросы, меньше ошибается и позволяет создавать более чёткий текст на изображениях.
  • «Ответ Google на Sora от OpenAI», как пишет The Verge, — генеративная модель ИИ Veo для создания видео с разрешением 1080p. Пользователи смогут создавать ролики в разных стилях. Сервис протестируют некоторые авторы.
Источник: Google
Источник: Google
Источник: Google
  • Google показала прототип Project Astra — мультимодального ИИ-помощника. Компания рассчитывает, что он станет универсальным виртуальным помощником, взаимодействовать с которым можно через камеру. В ролике, например, помощник описывает код на экране, помогает найти очки и решить задачу в реальном времени.
  • Google также анонсировала Gemini Live, которая будет доступна подписчикам Gemini Advanced в «ближайшие месяцы». Пользователи смогут при разговоре с Gemini выбрать голос для ответа, прерывать ответ уточняющими вопросами, а сам помощник адаптируется к манере речи говорящего. The Verge сравнивает анонс с работой GPT-4o от OpenAI, которую компания показала накануне.
24
64 комментария

Комментарий недоступен

24
Ответить

На телеграмм канал не забудь подписаться

12
Ответить

за все в этой жизни приходится платить) вы же когда выходите из дома не жалуетесь, что нужно за кофе в заведении заплатить ,за продукты в супермаркете и т д

2
Ответить

Классика 21 века.

Ответить

Ну этом они и живут, каждый ведь хочет зарабатывать на своих прилоджениях

Ответить

Конечно.. а как иначе. Они на этом живут. Работа должна оплачиваться по достоинству.

Ответить

Интересно что имея нереально мощный deep mind, Гугл не смогли в gpt ну или Оказались в роли догоняющего . Хотя денег изначально у них было больше

11
Ответить