Новая супермодель Nano Banana Pro
Google устроил в AI‑индустрии то, чего от него давно ждали: не тихое обновление моделей, а эффект «ядерной бомбы».
Две презентации подряд — Gemini 3 Pro и Nano Banana Pro — фактически стали заявкой на реванш в войне с ChatGPT.
И если текстовые возможности Gemini 3 только начинают сравнивать с GPT‑4, то модель для генерации и редактирования изображений Nano Banana Pro уже превратился в вирусный феномен
Один из самых ярких примеров — эксперименты Андрея Карпати. Он загрузил в Nano Banana Pro фотографии школьных экзаменационных листов по физике и химии:
Модель не только правильно отвечает на вопросы, но и:
- делает пометки на полях,
- рисует схемы и графики,
- стилизует всё под реалистичный почерк.
Опирается Nano Banana на несколько ключевых способностей:
- мультимодальное понимание (прочитать и осмыслить содержимое фото);
- логическое рассуждение (решить задачу, а не просто угадать ответ);
- точный текстовый рендеринг (аккуратная рукопись, формулы, подписи).
Вторая волна вирусных примеров — супернасыщенные инфографики и визуальные инструкции.
Nano Banana Pro умеет:
- по запросу «как собрать бургер» выдать картинку‑схему, где – по шагам показаны слои, – подписаны ингредиенты, – всё оформлено как понятная инструкция.
- спроектировать недельный план тренировок: – отдельные дни недели, – типы нагрузок, повторения, комментарии; – по просьбе Карпати сделать план «максимально тестостероновым» модель действительно «завинчивает» интенсивность — и это видно напрямую в визуальном расписании.
Eщё один пласт использования: загрузка фрагмента научной статьи и получение наборов иллюстраций, которые точно отражают суть описываемых концепций.