GPT-4o vs Gemini 1.5 Pro: сравним функционал после обновлений

Что лучше: GPT-4o или Gemini 1.5 Pro? Сравним функции. Выявим сильные и слабые стороны. Узнаем, с какими задачами лучше справляется модель от OpenAI, а с какими – новинка от Google.

С помощью ChatGPT 63% пользователей ищут ответы на вопросы, 41% – переводят тексты, 34% – выполняют рутинные задачи, по данным опроса Anketolog.
С помощью ChatGPT 63% пользователей ищут ответы на вопросы, 41% – переводят тексты, 34% – выполняют рутинные задачи, по данным опроса Anketolog.

Как GPT-4o и Gemini 1.5 Pro обогнали предшественников

GPT-4o:

  • Новая модель быстрее GPT-4 Turbo на 50%.
  • Лучше справляется с текстами на разных языках.
  • Понимает эмоции человека по мимике и дыханию.
  • Реагирует на голос, как человек, в среднем за 0,3 секунды.
  • Не только генерирует разные виды контента, но и комбинирует их.

Gemini 1.5 Pro:

  • Контекстное окно увеличилось до 1 миллиона токенов, при желании его можно расширить до 2 миллионов.
  • Лучше понимает контекст при переводе и быстрее распознает голосовой ввод.
  • Можно загружать изображения, таблицы, файлы PDF и другие материалы.
  • Расширенные функции анализа позволяют делать профессиональную статистику.
  • Удобное взаимодействие с другими сервисами Google.

Кто лучше отвечает на вопросы

Мы спросили GPT-4o и Gemini 1.5 Pro: как быстро сделать чат-бота для телеграм-канала без программирования?

GPT-4o

Предложил онлайн-сервисы Chatfuel, ManyChat, Tars и Make со ссылками. Пошагово описал, как создать чат-бота, настроить диалоги, интегрировать и запустить его в Телеграме.

Gemini 1.5 Pro

Кроме ManyChat и Chatfuel, предложил SendPulse, Botmother и Albato. Привел один общий план без привязки к ресурсам. В конце дал несколько советов для новичков: как начать и куда обращаться в случае вопросов.

Итог

GPT-4o справился лучше, так как предложил более развернутую пошаговую инструкцию для каждой предложенной платформы.

Кто лучше делает посты

Мы предложили GPT-4o и Gemini 1.5 Pro сделать пост для соц. сетей. Тема: “Чем заняться летом”. Объем: 10 предложений. Стиль: легкий, позитивный.

GPT-4o

🏖️☀️ “Лето – время приключений и активного отдыха! Почему бы не попробовать что-то новое? 🌊🏄‍♂️ Пляжный волейбол – отличный способ повеселиться с друзьями и зарядиться энергией. Если любите воду, возьмите доску и отправляйтесь покорять волны – серфинг ждет вас! 🏊‍♀️ Плавание – это не только полезно для здоровья, но и настоящий отдых для души. Для любителей спокойных занятий подойдет паддлбординг – идеален для медитации на воде. 🏃‍♂️ Утренние пробежки вдоль берега помогут встретить новый день с улыбкой. 🚴‍♀️ А еще можно взять велосипед и отправиться на поиски новых мест. Лето – идеальное время, чтобы открыть для себя новые виды спорта и зарядиться позитивом!” 🌞✨

Gemini 1.5 Pro

☀️ “Лето в разгаре, а ты еще не знаешь, чем себя занять?

🏕️ Устрой пикник в парке с друзьями, наслаждайся вкусной едой и веселыми разговорами.

🚴‍♀️ Прокатись на велосипеде по живописным местам, почувствуй ветер в волосах и адреналин в крови.

🏖️ Отправляйся на пляж, построй замок из песка, купайся в море и загорай под теплым солнцем.

📖 Погрузись в увлекательный мир книг, читай на свежем воздухе, в гамаке или на уютном балконе.

🌳 Исследуй новые места, отправляйся в поход, открой для себя удивительные уголки природы.

🍦 Наслаждайся освежающим мороженым, экспериментируй со вкусами и сочетаниями.

🤹‍♀️ Попробуй что-то новое, запишись на мастер-класс по танцам, рисованию или кулинарии.

✨ Лето – это время возможностей, не упусти свой шанс сделать его незабываемым!”

Итог

Мы предложили GPT-4o и Gemini 1.5 Pro сделать пост для соц. сетей. Тема: “Чем заняться летом”. Объем: 10 предложений. Стиль: легкий, позитивный.

Кто лучше переводит тесты

Мы дали задание нейросетям: перевести отрывок из произведения “Хоббит, или Туда и обратно” Дж. Р. Р. Толкина.

“In a hole in the ground there lived a hobbit. Not a nasty, dirty, wet hole, filled with the ends of worms and an oozy smell, nor yet a dry, bare, sandy hole with nothing in it to sit down on or to eat: it was a hobbit­hole, and that means comfort”.

Перевод GPT-4o

“В норе под землей жил хоббит. Не в мерзкой, грязной, влажной норе, полной червей и затхлого запаха, и не в сухой, пустой, песчаной норе, в которой не на чем было бы сесть или нечего поесть: это была хоббитская нора, а это значит — уют”.

Перевод Gemini 1.5 Pro

“В норе под землей жил хоббит. Это была не противная, грязная, мокрая нора, заполненная червяками и источавшая затхлый запах, и не сухая, голая, песчаная нора, в которой не на чем было бы посидеть или что-нибудь съесть: это была хоббичья нора, а это значит — удобство”.

Официальный перевод Н. Л. Рахмановой: “Жил-был в норе под землей хоббит. Не в какой-то там мерзкой грязной сырой норе, где со всех сторон торчат хвосты червей и противно пахнет плесенью, но и не в сухой песчаной голой норе, где не на что сесть и нечего съесть. Нет, нора была хоббичья, а значит — благоустроенная”.

Итог

Обе нейросети перевели текст без потери общего смысла. GPT-4o построила более простые предложения, но есть замечания к падежам “не на чем было бы сесть”. Gemini 1.5 Pro выбрала более сложные выражения и не точно подобрала прилагательное “мокрая”.

Кто лучше распознает изображения

GPT-4o vs Gemini 1.5 Pro: сравним функционал после обновлений

GPT-4o

“На картинке изображены два робота, занимающиеся поклейкой обоев. Один робот стоит на лестнице и приклеивает обои к стене, держа в руке клей или скотч. Второй робот стоит за столом и подготавливает полотно обоев. Они работают в светлом помещении, что создает впечатление совместной работы и использования технологий для выполнения бытовых задач”.

Gemini 1.5 Pro

“На картинке изображены два робота, которые занимаются ремонтом. Один робот стоит на лестнице и клеит обои на стену, а другой робот стоит за столом и режет рулон обоев. На заднем плане видна белая стена с деревянными панелями”.

Итог

Нейросети распознали крупные объекты, но не заметили мелкие. Поэтому они придумали детали, которых нет на картинке. GPT-4o придумала клей и скотч. Gemini 1.5 Pro придумала, что робот за столом режет обои.

Как GPT-4o и Gemini 1.5 Pro оценивают друг друга

Мы спросили GPT-4o, чем она лучше Gemini 1.5 Pro? Нейросеть описала свои базовые функции и нейтрально высказалась о конкуренте.

  • “Производительность. GPT-4o обладает высокой производительностью в задачах понимания текста, генерации креативного контента, перевода. У Gemini 1.5 Pro могут быть различия в производительности в зависимости от конкретных задач.
  • Функциональность. GPT-4o поддерживает широкий спектр задач, включая написание текстов, ответы на вопросы, анализ данных. У Gemini 1.5 Pro могут быть специфические функции.
  • Применение. GPT-4o используется в различных областях, таких как обучение, бизнес, здравоохранение и технологии. Gemini 1.5 Pro в зависимости от особенностей и возможностей, может быть лучше подходит для определенных отраслей”.

Gemini 1.5 Pro оказалось не такой скромной. Модель рассказала о своих преимуществах перед GPT-4o и привела ссылки на статьи, где сравниваются эти модели.

  • “Понимание контекста. Некоторые тесты показывают, что Gemini 1.5 Pro может лучше понимать сложные запросы и нюансы языка.
  • Многоязычность. Gemini 1.5 Pro, возможно, лучше справляется с задачами на разных языках, особенно на тех, которые менее распространены.
  • Креативность. Некоторые пользователи отмечают, что Gemini 1.5 Pro генерирует более оригинальные и творческие ответы.
  • Потенциал. Gemini 1.5 Pro – это новая модель, которая активно развивается, поэтому можно ожидать, что ее возможности будут улучшаться быстрее, чем у GPT-4o”.

Плюсы и минусы нейросетей

Оценка производительности GPT-4o и Gemini 1.5 Pro по данным тестирования OpenAI.
Оценка производительности GPT-4o и Gemini 1.5 Pro по данным тестирования OpenAI.

GPT-4o

Плюсы:

  • Дает релевантные ответы на узкоспециализированные вопросы.
  • Создает визуальный творческий контент.
  • Комбинирует разные виды информации.
  • Умеет распознавать эмоции и реагировать как человек.
  • Имеет удобный и интуитивно понятный интерфейс.

Минусы:

  • Обобщение в тексте.
  • Встречается неправильный падеж при переводе.
  • Иногда не распознает детали на фото.

Gemini 1.5 Pro

Плюсы:

  • Контекстное окно в 16 раз больше, чем у GPT-4o.
  • Генерирует образные, а не общие тексты.
  • Делает перевод с учетом особенностей языка.
  • Есть расширенные функции анализа.
  • Интерфейс настраивается под требования пользователя.

Минусы:

  • Ответы на узкоспециализированные вопросы требуют уточнения.
  • Временно не генерирует изображения.
  • Не работает с фотографиями людей и не всегда видит детали.

Доступность нейросетей

GPT-4o поддерживает 50 языков, включая русский язык. Ограниченный доступ к новой модели есть в бесплатной версии. По подписке Plus лимит сообщений увеличится в 5 раз. Стоимость подписки – 20 долларов в месяц.

Gemini 1.5 Pro доступна на 35 языках, в том числе на русском. Версия с контекстным окном до 1 миллиона токенов доступна в тарифе Gemini Advanced. Первые два месяца – бесплатно, затем подписка будет стоить 19,99 доллара в месяц.

Как начать пользоваться

Чтобы самому оценить GPT-4o, нужно:

  • Зайти на официальный сайт.
  • Создать учетную запись (по желанию).
  • Если нужен полноценный доступ к GPT‑4o, оформить подписку.

Чтобы начать работать в Gemini 1.5 Pro, нужно:

  • Создать аккаунт Google.
  • Зайти на сайт и войти под своим аккаунтом.
  • Выбрать тариф Gemini Advanced с бесплатным периодом.

Хочется не только пользоваться, но и разрабатывать нейросети? Научиться программировать и создать собственную нейронную сеть? Тогда вот практические курсы по разработке и отдельно по Python, на нем пишут нейросети.

1 комментарий

До обновления чатагпт, я активно использовала гимини. Сейчас же использую только новый чатгпт, на мой взгляд он справляется намного лучше

Ответить