Google выкатили сразу два крутейших релиза: Gemini Omni и Gemini 3.5 Flash
Похоже, Google снова пытается перехватить повестку в ИИ.
Первый релиз - Gemini Omni. Это семейство мультимодальных моделей, которые работают почти со всем сразу: текстом, кодом, изображениями, видео и даже виртуальными мирами.
Модель может принимать разные типы контента и не просто «понимать» их, а редактировать, дополнять и превращать в новые форматы:
- добавить эффекты в видео со смартфона
- сделать картину из грубого наброска
- собрать образовательный подкаст по фото
- работать с кодом, текстом, визуалом и видео в одном контексте
Первая модель семейства - Gemini Omni Flash - должна стать доступна уже сегодня.
Второй релиз - Gemini 3.5 Flash.
Google называет её своей самой сильной моделью для агентов и кодинга. Главное отличие - не просто быстрые ответы, а способность планировать работу по большим кодовым базам, рассуждать на длинной дистанции и запускать subagents параллельно.
По словам Google DeepMind, Gemini 3.5 Flash обходит 3.1 Pro на agentic и coding-бенчмарках вроде Terminal-Bench 2.1, GDPval-AA и MCP Atlas, при этом стоит заметно дешевле фронтирных моделей.
Если коротко:
- Gemini Omni - модель для всего: текст, код, картинки, видео, миры
- Gemini 3.5 Flash - ставка на агентов, кодинг и работу с большими проектами
Интересно, насколько хорошо модель будет работать как исполнитель: в IDE, браузере, видео, агентных workflow и реальных продуктах.
Релиз https://x.com/GoogleDeepMind/status/2056786446636212467
Попробовать: https://gemini.google.com/app