Google представила Gemini AI - она мощнее GPT-4 и может превзойти человека

Google представила Gemini AI - она мощнее GPT-4 и может превзойти человека

Долгое ожидание наконец-то закончилось. После нескольких лет неудачных продуктов в области ИИ, таких как неудачный запуск Bard, Google представила свою самую продвинутую мультимодальную модель ИИ под названием Gemini.

Спонсор статьи - 👨‍💻 Разработка Телеграм-ботов любой сложности (от 5000₽)

Во время презентации мое внимание привлекли две вещи:

  1. Gemini превосходит GPT-4 в некоторых областях
  2. Gemini может превзойти человека в тестах на знание и решение задач

Это свидетельствует о многообещающем прогрессе, но давайте проанализируем ситуацию более тщательно, прежде чем объявлять ее революцией в области ИИ.

🔥Телеграм-бот SYNTX предоставляет доступ к более чем 40 ИИ-инструментам. Без ВПН, оплата любой картой, запросы на любом языке, пробуй бесплатно!

🎙 Общайтесь в одном диалоговом окне с GPT4o/Gemini/Claude, выход в интернет, работа с файлами, неограниченное количество символов!

👨‍🎨 Создавайте изображения в MidJourney, DALL-E 3 и Ideogram

🆕 Любой образ, в любой локации с вашим фото сделает ФотоМастер

🎞 Генерируйте видео текстом или по картинке

🎵 Сочиняй мировые хиты с помощью Suno

🖼 Редактор с 12 различными ИИ-инструментами для ретуши фото

☝️Это только часть функций, доступных в SYNTX!

Что такое Gemini?

Gemini - это новейшая мультимодальная модель ИИ от Google, которая конкурирует с GPT-4 от OpenAI. ИИ может обрабатывать информацию из текста, кода, аудио, изображений и видео. В отличие от него, ChatGPT пока не может работать с видео.

Google представила Gemini AI - она мощнее GPT-4 и может превзойти человека

Возможности Gemini

Gemini является мультимодальным и может выполнять следующие задачи:

  1. Понимание изображений: Он отлично справляется с распознаванием объектов, детальной транскрипцией, пониманием графиков и сложными задачами мультимодального мышления.
  2. Понимание видео: Он демонстрирует превосходную производительность в понимании и рассуждении на основе видеопоследовательностей, а также лучшие результаты в создании субтитров к видео и ответах на вопросы.
  3. Генерация изображений: Он способен генерировать изображения, поддерживая сложные последовательности изображений и текста, не требующие какого-либо описания.
  4. Понимание аудио: Он превосходит другие модели в задачах автоматического распознавания речи и перевода речи на несколько языков.
Google представила Gemini AI - она мощнее GPT-4 и может превзойти человека

Если вы еще не видели, рекомендую посмотреть демонстрацию возможностей Gemini.

Демонстрационные ролики, показанные на старте продаж, поражают воображение, но реальную производительность еще предстоит проверить.

Три версии Gemini

  • Ultra: Эта модель является флагманом, обеспечивая высочайшую производительность в таких сложных задачах, как анализ и работа с несколькими модальностями.
  • Pro: Эта модель, обеспечивающая баланс между стоимостью, производительностью и задержкой, предлагает значительные возможности для решения различных задач. Она демонстрирует сильные способности к рассуждениям и широкую поддержку мультимодальности.
  • Nano: Эта модель, предназначенная для использования на устройстве, ставит во главу угла эффективность. Она доступна в двух версиях, с параметрами 1,8 Б и 3,25 Б, и рассчитана на устройства с малым и большим объемом памяти. Созданная на основе более крупных моделей Gemini и квантованная до 4 бит для оптимального развертывания, она обеспечивает лучшую в своем классе производительность на устройстве.

Если говорить о возможностях, то вот визуальное сравнение различных моделей:

Google представила Gemini AI - она мощнее GPT-4 и может превзойти человека

Более мощные модели Gemini демонстрируют стабильный прирост производительности в задачах на логику, математику/науку, обобщение и длинный контекст, а Gemini Ultra превосходит их по всем шести параметрам. Gemini Pro, хотя и чуть менее мощный, предлагает отличный баланс производительности и эффективности для работы в условиях ограниченных ресурсов.
Для разработчиков это просто замечательно! Вам нужно быстро обобщить информацию на телефоне? Используйте маленькую и быструю модель. Создаете сложный ИИ-ассистент? Используйте большую, мощную модель. Это делает создание приложений проще и быстрее.

Лучше ли Gemini, чем ChatGPT (GPT-4)?

Gemini Ultra превосходит GPT-4 в 17 из 18 протестированных бенчмарков, включая бенчмарк Massive Multitask Language Understanding (MMLU) (Gemini Ultra набрал 90% против 86,4% у GPT-4) и новый бенчмарк Multimodality Massive Multitask Understanding (MMMU) (Gemini Ultra набрал 59,4% против 56,8% у GPT-4).
Однако разница в результатах не слишком велика. Это говорит скорее о сложности существенного усовершенствования этих систем, чем о недостатках в возможностях Google по сравнению с OpenAI.

Google представила Gemini AI - она мощнее GPT-4 и может превзойти человека
Google представила Gemini AI - она мощнее GPT-4 и может превзойти человека

На данный момент сложно однозначно сказать, что лучше - Gemini или ChatGPT, поскольку у них есть разные достоинства и недостатки. Однако Gemini, похоже, обладает некоторыми преимуществами, такими как:

  • Большая гибкость: Gemini может решать более широкий круг задач, включая работу с видео- и аудиоданными.
  • Возможности работы на устройствах: Gemini может работать на устройствах без подключения к Интернету, что делает его более универсальным.
  • Бесплатный доступ: В настоящее время Gemini можно использовать бесплатно, в отличие от ChatGPT, который требует платной подписки в размере 20 долларов в месяц.

Все, что было сегодня представлено, впечатляет, но знаете, чего я жду больше всего? Я хочу получить в свои руки Gemini на Vertex AI.
По словам представителей Google, они сделают Gemini доступной для публики 13 декабря через Google AI Studio и Google Vertex AI.

Google представила Gemini AI - она мощнее GPT-4 и может превзойти человека

Потенциал впечатляет. Впрочем, как и дебют Bard до того, как все пошло не так. Я с нетерпением буду тестировать Gemini вручную, начиная с 13 декабря, когда она станет доступной. Хотя пока рано говорить о революции в области ИИ, которая оставит другие модели в прошлом.
И, если вы пропустили, Bard только что обновился и теперь работает на базе Gemini Pro. Попробуйте.

🔥Телеграм-бот SYNTX предоставляет доступ к более чем 40 ИИ-инструментам. Без ВПН, оплата любой картой, запросы на любом языке, пробуй бесплатно!

🎙 Общайтесь в одном диалоговом окне с GPT4o/Gemini/Claude, выход в интернет, работа с файлами, неограниченное количество символов!

👨‍🎨 Создавайте изображения в MidJourney, DALL-E 3 и Ideogram

🆕 Любой образ, в любой локации с вашим фото сделает ФотоМастер

🎞 Генерируйте видео текстом или по картинке

🎵 Сочиняй мировые хиты с помощью Suno

🖼 Редактор с 12 различными ИИ-инструментами для ретуши фото

☝️Это только часть функций, доступных в SYNTX!

Еще больше полезностей про нейросети и анонсы статей - в моем хобби-блоге про нейросети в Телеграм.

Оригинал статьи на английском - здесь.

7676
126 комментариев

"Gemini может превзойти человека в тестах на знание и решение задач" - ну, тут удивляться не чему, вы еще заставьте пройти тест на IQ меня и ИИ (денежные ставки не ставьте на меня, мы проиграем)

20

или вот с калькулятором в делении например можно еще посоревноваться, я точно проиграю

18

я так понимаю, что победить можно, используя сам gemini.
запрос: ну ка штука хитрожопая, придумай как мне тебя победить

3

Комментарий удалён автором поста

GPT3 и так большинство людей превосходит

11

По способности менять свое мнение на противоположное без сомнения

6

Охват у чатжпт такой, что никакому человеку не снилось.