Google выкатили сразу два крутейших релиза: Gemini Omni и Gemini 3.5 Flash

Google выкатили сразу два крутейших релиза: Gemini Omni и Gemini 3.5 Flash

Похоже, Google снова пытается перехватить повестку в ИИ.

Первый релиз - Gemini Omni. Это семейство мультимодальных моделей, которые работают почти со всем сразу: текстом, кодом, изображениями, видео и даже виртуальными мирами.

Модель может принимать разные типы контента и не просто «понимать» их, а редактировать, дополнять и превращать в новые форматы:

- добавить эффекты в видео со смартфона

- сделать картину из грубого наброска

- собрать образовательный подкаст по фото

- работать с кодом, текстом, визуалом и видео в одном контексте

Первая модель семейства - Gemini Omni Flash - должна стать доступна уже сегодня.

Второй релиз - Gemini 3.5 Flash.

Google называет её своей самой сильной моделью для агентов и кодинга. Главное отличие - не просто быстрые ответы, а способность планировать работу по большим кодовым базам, рассуждать на длинной дистанции и запускать subagents параллельно.

По словам Google DeepMind, Gemini 3.5 Flash обходит 3.1 Pro на agentic и coding-бенчмарках вроде Terminal-Bench 2.1, GDPval-AA и MCP Atlas, при этом стоит заметно дешевле фронтирных моделей.

Если коротко:

- Gemini Omni - модель для всего: текст, код, картинки, видео, миры

- Gemini 3.5 Flash - ставка на агентов, кодинг и работу с большими проектами

Интересно, насколько хорошо модель будет работать как исполнитель: в IDE, браузере, видео, агентных workflow и реальных продуктах.

Релиз https://x.com/GoogleDeepMind/status/2056786446636212467

Попробовать: https://gemini.google.com/app

2
1 комментарий