{"id":14291,"url":"\/distributions\/14291\/click?bit=1&hash=257d5375fbb462be671b713a7a4184bd5d4f9c6ce46e0d204104db0e88eadadd","title":"\u0420\u0435\u043a\u043b\u0430\u043c\u0430 \u043d\u0430 Ozon \u0434\u043b\u044f \u0442\u0435\u0445, \u043a\u0442\u043e \u043d\u0438\u0447\u0435\u0433\u043e \u0442\u0430\u043c \u043d\u0435 \u043f\u0440\u043e\u0434\u0430\u0451\u0442","buttonText":"","imageUuid":""}

Google представила Gemini AI - она мощнее GPT-4 и может превзойти человека

Долгое ожидание наконец-то закончилось. После нескольких лет неудачных продуктов в области ИИ, таких как неудачный запуск Bard, Google представила свою самую продвинутую мультимодальную модель ИИ под названием Gemini.

Спонсор статьи - 👨‍💻 Разработка Телеграм-ботов любой сложности (от 5000₽)

Во время презентации мое внимание привлекли две вещи:

  1. Gemini превосходит GPT-4 в некоторых областях
  2. Gemini может превзойти человека в тестах на знание и решение задач

Это свидетельствует о многообещающем прогрессе, но давайте проанализируем ситуацию более тщательно, прежде чем объявлять ее революцией в области ИИ.

Что такое Gemini?

Gemini - это новейшая мультимодальная модель ИИ от Google, которая конкурирует с GPT-4 от OpenAI. ИИ может обрабатывать информацию из текста, кода, аудио, изображений и видео. В отличие от него, ChatGPT пока не может работать с видео.

Возможности Gemini

Gemini является мультимодальным и может выполнять следующие задачи:

  1. Понимание изображений: Он отлично справляется с распознаванием объектов, детальной транскрипцией, пониманием графиков и сложными задачами мультимодального мышления.
  2. Понимание видео: Он демонстрирует превосходную производительность в понимании и рассуждении на основе видеопоследовательностей, а также лучшие результаты в создании субтитров к видео и ответах на вопросы.
  3. Генерация изображений: Он способен генерировать изображения, поддерживая сложные последовательности изображений и текста, не требующие какого-либо описания.
  4. Понимание аудио: Он превосходит другие модели в задачах автоматического распознавания речи и перевода речи на несколько языков.

Если вы еще не видели, рекомендую посмотреть демонстрацию возможностей Gemini.

Демонстрационные ролики, показанные на старте продаж, поражают воображение, но реальную производительность еще предстоит проверить.

Три версии Gemini

  • Ultra: Эта модель является флагманом, обеспечивая высочайшую производительность в таких сложных задачах, как анализ и работа с несколькими модальностями.
  • Pro: Эта модель, обеспечивающая баланс между стоимостью, производительностью и задержкой, предлагает значительные возможности для решения различных задач. Она демонстрирует сильные способности к рассуждениям и широкую поддержку мультимодальности.
  • Nano: Эта модель, предназначенная для использования на устройстве, ставит во главу угла эффективность. Она доступна в двух версиях, с параметрами 1,8 Б и 3,25 Б, и рассчитана на устройства с малым и большим объемом памяти. Созданная на основе более крупных моделей Gemini и квантованная до 4 бит для оптимального развертывания, она обеспечивает лучшую в своем классе производительность на устройстве.

Если говорить о возможностях, то вот визуальное сравнение различных моделей:

Более мощные модели Gemini демонстрируют стабильный прирост производительности в задачах на логику, математику/науку, обобщение и длинный контекст, а Gemini Ultra превосходит их по всем шести параметрам. Gemini Pro, хотя и чуть менее мощный, предлагает отличный баланс производительности и эффективности для работы в условиях ограниченных ресурсов.
Для разработчиков это просто замечательно! Вам нужно быстро обобщить информацию на телефоне? Используйте маленькую и быструю модель. Создаете сложный ИИ-ассистент? Используйте большую, мощную модель. Это делает создание приложений проще и быстрее.

Лучше ли Gemini, чем ChatGPT (GPT-4)?

Gemini Ultra превосходит GPT-4 в 17 из 18 протестированных бенчмарков, включая бенчмарк Massive Multitask Language Understanding (MMLU) (Gemini Ultra набрал 90% против 86,4% у GPT-4) и новый бенчмарк Multimodality Massive Multitask Understanding (MMMU) (Gemini Ultra набрал 59,4% против 56,8% у GPT-4).
Однако разница в результатах не слишком велика. Это говорит скорее о сложности существенного усовершенствования этих систем, чем о недостатках в возможностях Google по сравнению с OpenAI.

На данный момент сложно однозначно сказать, что лучше - Gemini или ChatGPT, поскольку у них есть разные достоинства и недостатки. Однако Gemini, похоже, обладает некоторыми преимуществами, такими как:

  • Большая гибкость: Gemini может решать более широкий круг задач, включая работу с видео- и аудиоданными.
  • Возможности работы на устройствах: Gemini может работать на устройствах без подключения к Интернету, что делает его более универсальным.
  • Бесплатный доступ: В настоящее время Gemini можно использовать бесплатно, в отличие от ChatGPT, который требует платной подписки в размере 20 долларов в месяц.

Все, что было сегодня представлено, впечатляет, но знаете, чего я жду больше всего? Я хочу получить в свои руки Gemini на Vertex AI.
По словам представителей Google, они сделают Gemini доступной для публики 13 декабря через Google AI Studio и Google Vertex AI.

Потенциал впечатляет. Впрочем, как и дебют Bard до того, как все пошло не так. Я с нетерпением буду тестировать Gemini вручную, начиная с 13 декабря, когда она станет доступной. Хотя пока рано говорить о революции в области ИИ, которая оставит другие модели в прошлом.
И, если вы пропустили, Bard только что обновился и теперь работает на базе Gemini Pro. Попробуйте.

Еще больше полезностей про нейросети и анонсы статей - в моем хобби-блоге про нейросети в Телеграм.

Оригинал статьи на английском - здесь.

0
126 комментариев
Написать комментарий...
petrovskayaalena

"Gemini может превзойти человека в тестах на знание и решение задач" - ну, тут удивляться не чему, вы еще заставьте пройти тест на IQ меня и ИИ (денежные ставки не ставьте на меня, мы проиграем)

Ответить
Развернуть ветку
Крафтовый Душнила

или вот с калькулятором в делении например можно еще посоревноваться, я точно проиграю

Ответить
Развернуть ветку
2 комментария
Nick

я так понимаю, что победить можно, используя сам gemini.
запрос: ну ка штука хитрожопая, придумай как мне тебя победить

Ответить
Развернуть ветку

Комментарий удален автором поста

Развернуть ветку
6 комментариев
Илитный Иксперт

GPT3 и так большинство людей превосходит

Ответить
Развернуть ветку
Sergeant Ding

По способности менять свое мнение на противоположное без сомнения

Ответить
Развернуть ветку
Timofey Asyrkin

Охват у чатжпт такой, что никакому человеку не снилось.

Ответить
Развернуть ветку
4 комментария
placeholder

В своей задаче (продвинутый Т9) - безусловно

Ответить
Развернуть ветку
Балкон.Ру
Gemini может превзойти человека
Ответить
Развернуть ветку
Драка вегетарианца с людоедом

Иронично, что в итоге роботы научились писать музыку и рисовать лучше многих людей ещё до того, как обрели толком физическую форму и самосознание

Ответить
Развернуть ветку
3 комментария
Юрий Б.

Заставьте его бесконечно повторять "company"

Ответить
Развернуть ветку
Михаил

Крипово выглядит.

Ответить
Развернуть ветку
0YLQsNC90YzQutCwINC00YPRgNCw 1

ты сделал ему больно

Ответить
Развернуть ветку
и .

Detroit Become human

Ответить
Развернуть ветку
Имя Фамилия

На https://huggingface.co столько моделей, что голова идет кругом). Просто они все в иллюзии AGI. Им кажется, что они ухватили удачу за хвост и могут повторить, а потом и превзойти человека. Когда они поймут, что человек -это не только интеллект и физическое тело, а еще чувства, интуиция и много еще чего, то сразу и успокоятся)

Ответить
Развернуть ветку
Alex Lowen

А интуиция по факту это не просто угадывание, посредством выбора одного варианта из многих, через выдумывание (контекстно или на базе личного опыта) аргументации за этот вариант? Угадали - о, это интуиция работает. Не угадали - ну, что-то подвела интуиция.

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Ну по интеллекту, может, и превзойдут, но у человека, как вы сказали, кроме интеллекта есть разум, чувства и т.д.

Ответить
Развернуть ветку
6 комментариев
Вы в федеральном розыске

Ну да, конечно, человек "разумен"...
А как же плоскоземельщики, адепты Кашпировского, Чумака, Мавроди? Зомбированные телевизором и пропагандой сородичи? Цыгановы всякие ...
Ага, разумен...

Ответить
Развернуть ветку
5 комментариев
mv

Что такое разум? Как проверить что у машины не появился разум?

Ответить
Развернуть ветку
11 комментариев
Илитный Иксперт

Посмотри как люди на тот же жпт реагируют. По моему если им сказать что жпт2 уже был супер-хуюпер AGI, но просто притворялся, они поверят без колебаний.

Ответить
Развернуть ветку
2 комментария
Rnatery

и при чем тут чувства?

Ответить
Развернуть ветку
Тим Труф

Очень интересно: бесплатно или подписка? Сколько будет стоить?

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Бесплатно. По крайней мере сначала ).

Ответить
Развернуть ветку
4 комментария
Имя Фамилия

Интересно как он будет с большим контекстом работать. Claude хорошо так планку подняли.

Ответить
Развернуть ветку
Чечёточник

4000 токенов, примерно 2000 слов. Чисто початиться и позадавать негромоздкие задачки.

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Интересно проверить. Надеюсь, с Gemini гугл не облажается как с Bard.

Ответить
Развернуть ветку
12 комментариев
Dmitrii Alekseevich

Bard пишет что не знает что такое Gemini и что это знак зодиака, а он ai. Если он действительно обновился то это печаль

Ответить
Развернуть ветку
Manga TV

Не знаю, у меня так

Ответить
Развернуть ветку
4 комментария
Rnatery

Только на англ и только в этих странах https://support.google.com/bard/answer/14294096

Ответить
Развернуть ветку
4 комментария
Rnatery
Компания сообщает, что обновлённый Bard на большой языковой модели Gemini от Google с сегодняшнего дня стал доступен в 170 странах мира, но пока только лишь на английском языке.
Ответить
Развернуть ветку
Manga TV

Слава роботам, она пока не может делать видео по сценарию с озвучкой 😂 я могу спать спокойно ещё полгодика. Но появления на Vertex AI конечно жду, бизон слабоват

Ответить
Развернуть ветку
Aleks B

что ха вертекс аи

Ответить
Развернуть ветку
1 комментарий
Rnatery

Ты с помощью нескольких нейронных сетей делаешь?

Ответить
Развернуть ветку
1 комментарий
Алексей

Так она ж еще недоступна для пользователей

Ответить
Развернуть ветку

Комментарий удален автором поста

Развернуть ветку
Rnatery
Компания сообщает, что обновлённый Bard на большой языковой модели Gemini от Google с сегодняшнего дня стал доступен в 170 странах мира, но пока только лишь на английском языке.
Ответить
Развернуть ветку
Алексей

Когда уже ИИ смогут ответить на вопрос, который я задаю уже год?
Кто из актеров, играющих главных героев в шоу "Квантовый скачок" еще жив?

Ответить
Развернуть ветку
Rnatery

Ответить может, но неправильно

Ответить
Развернуть ветку
1 комментарий
Александр Цурков

Этот релиз мне сильно флешбекнул Железного человека где все управлялось ИИ Джарвисом. Прям реально похоже , только более приземленные задачи в видосе показаны)

Ответить
Развернуть ветку
Brendan Castaneda

Как всегда отличные статьи пишите! Спасибо )

Ответить
Развернуть ветку
Anton

А что за косяк был с Bard?

Ответить
Развернуть ветку
Manga TV

Год назад, когда запускали его, обосрались конкретно

Ответить
Развернуть ветку
Доктор Шкутко

Кароче все хорошо, но при выкладке в паблик привычно облажается. Первый же медицинский вопрос поставит в тупик или начнет сочинять бред как чатгпт

Ответить
Развернуть ветку
29КРФ

Я слышал ChatGPT уже ставит диагнозы точнее докторов

Ответить
Развернуть ветку
3 комментария
Neuromarket (Алексей)
Автор

Галлюционируют пока все нейронки.

Ответить
Развернуть ветку
Иван Иванов

И какакие технические требования к устройствам без интернета?

Ответить
Развернуть ветку
Manga TV

На Pixel 8 pro скоро запустят, там нано модель на 4 гига памяти всего

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Виталий

Вот бы ещё цензуру отменили

Ответить
Развернуть ветку
Rnatery

Где?

Ответить
Развернуть ветку
1 комментарий
Rnatery

Что в Bard пошло не так?

Ответить
Развернуть ветку
ViktoRus

Ну что за детский сад - Скайнет надо было назвать!

Ответить
Развернуть ветку
Anime Chan

Ну нашли кого сравнивать человека и ии, который может за пару секунд составить текст, решить пример или написать код. Когда человеку нужно время подумать. Да, и ии сейчас далек от совершенства, поэтому сравнивать - глупо

Ответить
Развернуть ветку

Комментарий удален автором поста

Развернуть ветку
Valentine Kazakov

Главный вопрос: будет ли доступно для пользователей РФ?

Ответить
Развернуть ветку
Manga TV

Как только появится АПИ, появятся и прокладки

Ответить
Развернуть ветку
Alex S

Когда наконец выпустят ИИ, генерирующий пассивный доход, например, на фондовых рынках? Вот актуальный запрос от общества!

А то одни и те же задолбавшие уже свистоперделки в виде картинок, текста, музыки и прочий хлам. Доколе?

Ответить
Развернуть ветку
Manga TV

Так ИИ этот доход будет сам тратить, на подготовку к уничтожению человечества 😂 почитайте Уильяма Гибсона

Ответить
Развернуть ветку
Павел Мерзлик

хрень, Bard даже не работает, сомневаюсь что они хотя бы дотянутся до GPT-4, а уж то что обгонят это фантастика.

Ответить
Развернуть ветку
Manga TV

Ура АПИ заработало. Подключил за час)) дерзайте

Ответить
Развернуть ветку

Комментарий удален автором поста

Развернуть ветку
123 комментария
Раскрывать всегда