{"id":14291,"url":"\/distributions\/14291\/click?bit=1&hash=257d5375fbb462be671b713a7a4184bd5d4f9c6ce46e0d204104db0e88eadadd","title":"\u0420\u0435\u043a\u043b\u0430\u043c\u0430 \u043d\u0430 Ozon \u0434\u043b\u044f \u0442\u0435\u0445, \u043a\u0442\u043e \u043d\u0438\u0447\u0435\u0433\u043e \u0442\u0430\u043c \u043d\u0435 \u043f\u0440\u043e\u0434\u0430\u0451\u0442","buttonText":"","imageUuid":""}

Neuromarket (Алексей)

7 дек 2023 7.12.2023

Google представила Gemini AI - она мощнее GPT-4 и может превзойти человека

Долгое ожидание наконец-то закончилось. После нескольких лет неудачных продуктов в области ИИ, таких как неудачный запуск Bard, Google представила свою самую продвинутую мультимодальную модель ИИ под названием Gemini.

Спонсор статьи - 👨‍💻 Разработка Телеграм-ботов любой сложности (от 5000₽)

Во время презентации мое внимание привлекли две вещи:

Gemini превосходит GPT-4 в некоторых областях
Gemini может превзойти человека в тестах на знание и решение задач

Это свидетельствует о многообещающем прогрессе, но давайте проанализируем ситуацию более тщательно, прежде чем объявлять ее революцией в области ИИ.

Что такое Gemini?

Gemini - это новейшая мультимодальная модель ИИ от Google, которая конкурирует с GPT-4 от OpenAI. ИИ может обрабатывать информацию из текста, кода, аудио, изображений и видео. В отличие от него, ChatGPT пока не может работать с видео.

Возможности Gemini

Gemini является мультимодальным и может выполнять следующие задачи:

Понимание изображений: Он отлично справляется с распознаванием объектов, детальной транскрипцией, пониманием графиков и сложными задачами мультимодального мышления.
Понимание видео: Он демонстрирует превосходную производительность в понимании и рассуждении на основе видеопоследовательностей, а также лучшие результаты в создании субтитров к видео и ответах на вопросы.
Генерация изображений: Он способен генерировать изображения, поддерживая сложные последовательности изображений и текста, не требующие какого-либо описания.
Понимание аудио: Он превосходит другие модели в задачах автоматического распознавания речи и перевода речи на несколько языков.

Если вы еще не видели, рекомендую посмотреть демонстрацию возможностей Gemini.

Демонстрационные ролики, показанные на старте продаж, поражают воображение, но реальную производительность еще предстоит проверить.

Три версии Gemini

Ultra: Эта модель является флагманом, обеспечивая высочайшую производительность в таких сложных задачах, как анализ и работа с несколькими модальностями.
Pro: Эта модель, обеспечивающая баланс между стоимостью, производительностью и задержкой, предлагает значительные возможности для решения различных задач. Она демонстрирует сильные способности к рассуждениям и широкую поддержку мультимодальности.
Nano: Эта модель, предназначенная для использования на устройстве, ставит во главу угла эффективность. Она доступна в двух версиях, с параметрами 1,8 Б и 3,25 Б, и рассчитана на устройства с малым и большим объемом памяти. Созданная на основе более крупных моделей Gemini и квантованная до 4 бит для оптимального развертывания, она обеспечивает лучшую в своем классе производительность на устройстве.

Если говорить о возможностях, то вот визуальное сравнение различных моделей:

Более мощные модели Gemini демонстрируют стабильный прирост производительности в задачах на логику, математику/науку, обобщение и длинный контекст, а Gemini Ultra превосходит их по всем шести параметрам. Gemini Pro, хотя и чуть менее мощный, предлагает отличный баланс производительности и эффективности для работы в условиях ограниченных ресурсов.
Для разработчиков это просто замечательно! Вам нужно быстро обобщить информацию на телефоне? Используйте маленькую и быструю модель. Создаете сложный ИИ-ассистент? Используйте большую, мощную модель. Это делает создание приложений проще и быстрее.

Лучше ли Gemini, чем ChatGPT (GPT-4)?

Gemini Ultra превосходит GPT-4 в 17 из 18 протестированных бенчмарков, включая бенчмарк Massive Multitask Language Understanding (MMLU) (Gemini Ultra набрал 90% против 86,4% у GPT-4) и новый бенчмарк Multimodality Massive Multitask Understanding (MMMU) (Gemini Ultra набрал 59,4% против 56,8% у GPT-4).
Однако разница в результатах не слишком велика. Это говорит скорее о сложности существенного усовершенствования этих систем, чем о недостатках в возможностях Google по сравнению с OpenAI.

На данный момент сложно однозначно сказать, что лучше - Gemini или ChatGPT, поскольку у них есть разные достоинства и недостатки. Однако Gemini, похоже, обладает некоторыми преимуществами, такими как:

Большая гибкость: Gemini может решать более широкий круг задач, включая работу с видео- и аудиоданными.
Возможности работы на устройствах: Gemini может работать на устройствах без подключения к Интернету, что делает его более универсальным.
Бесплатный доступ: В настоящее время Gemini можно использовать бесплатно, в отличие от ChatGPT, который требует платной подписки в размере 20 долларов в месяц.

Все, что было сегодня представлено, впечатляет, но знаете, чего я жду больше всего? Я хочу получить в свои руки Gemini на Vertex AI.
По словам представителей Google, они сделают Gemini доступной для публики 13 декабря через Google AI Studio и Google Vertex AI.

Потенциал впечатляет. Впрочем, как и дебют Bard до того, как все пошло не так. Я с нетерпением буду тестировать Gemini вручную, начиная с 13 декабря, когда она станет доступной. Хотя пока рано говорить о революции в области ИИ, которая оставит другие модели в прошлом.
И, если вы пропустили, Bard только что обновился и теперь работает на базе Gemini Pro. Попробуйте.

Еще больше полезностей про нейросети и анонсы статей - в моем хобби-блоге про нейросети в Телеграм.

#gemini #google #bard #ai #ии #нейросети

Оригинал статьи на английском - здесь.

21K показов

13K открытий

1 репост

126 комментариев

Написать комментарий...

petrovskayaalena

7.12.2023

"Gemini может превзойти человека в тестах на знание и решение задач" - ну, тут удивляться не чему, вы еще заставьте пройти тест на IQ меня и ИИ (денежные ставки не ставьте на меня, мы проиграем)

Ответить

Развернуть ветку

Крафтовый Душнила

7.12.2023

или вот с калькулятором в делении например можно еще посоревноваться, я точно проиграю

Ответить

Развернуть ветку

2 комментария

Nick

7.12.2023

я так понимаю, что победить можно, используя сам gemini.
запрос: ну ка штука хитрожопая, придумай как мне тебя победить

Ответить

Развернуть ветку

Комментарий удален автором поста

Развернуть ветку

6 комментариев

Илитный Иксперт

7.12.2023

GPT3 и так большинство людей превосходит

Ответить

Развернуть ветку

Sergeant Ding

8.12.2023

По способности менять свое мнение на противоположное без сомнения

Ответить

Развернуть ветку

Timofey Asyrkin

7.12.2023

Охват у чатжпт такой, что никакому человеку не снилось.

Ответить

Развернуть ветку

4 комментария

placeholder

8.12.2023

В своей задаче (продвинутый Т9) - безусловно

Ответить

Развернуть ветку

Балкон.Ру

8.12.2023

Gemini может превзойти человека

Ответить

Развернуть ветку

Драка вегетарианца с людоедом

8.12.2023

Иронично, что в итоге роботы научились писать музыку и рисовать лучше многих людей ещё до того, как обрели толком физическую форму и самосознание

Ответить

Развернуть ветку

3 комментария

Юрий Б.

8.12.2023

Заставьте его бесконечно повторять "company"

Ответить

Развернуть ветку

Михаил

8.12.2023

Крипово выглядит.

Ответить

Развернуть ветку

0YLQsNC90YzQutCwINC00YPRgNCw 1

8.12.2023

ты сделал ему больно

Ответить

Развернуть ветку

и .

8.12.2023

Detroit Become human

Ответить

Развернуть ветку

Имя Фамилия

7.12.2023

На https://huggingface.co столько моделей, что голова идет кругом). Просто они все в иллюзии AGI. Им кажется, что они ухватили удачу за хвост и могут повторить, а потом и превзойти человека. Когда они поймут, что человек -это не только интеллект и физическое тело, а еще чувства, интуиция и много еще чего, то сразу и успокоятся)

Ответить

Развернуть ветку

Alex Lowen

7.12.2023

А интуиция по факту это не просто угадывание, посредством выбора одного варианта из многих, через выдумывание (контекстно или на базе личного опыта) аргументации за этот вариант? Угадали - о, это интуиция работает. Не угадали - ну, что-то подвела интуиция.

Ответить

Развернуть ветку

Neuromarket (Алексей)

7.12.2023 Автор

Ну по интеллекту, может, и превзойдут, но у человека, как вы сказали, кроме интеллекта есть разум, чувства и т.д.

Ответить

Развернуть ветку

6 комментариев

Вы в федеральном розыске

8.12.2023

Ну да, конечно, человек "разумен"...
А как же плоскоземельщики, адепты Кашпировского, Чумака, Мавроди? Зомбированные телевизором и пропагандой сородичи? Цыгановы всякие ...
Ага, разумен...

Ответить

Развернуть ветку

5 комментариев

7.12.2023

Что такое разум? Как проверить что у машины не появился разум?

Ответить

Развернуть ветку

11 комментариев

Илитный Иксперт

7.12.2023

Посмотри как люди на тот же жпт реагируют. По моему если им сказать что жпт2 уже был супер-хуюпер AGI, но просто притворялся, они поверят без колебаний.

Ответить

Развернуть ветку

2 комментария

Rnatery

8.12.2023

и при чем тут чувства?

Ответить

Развернуть ветку

Тим Труф

7.12.2023

Очень интересно: бесплатно или подписка? Сколько будет стоить?

Ответить

Развернуть ветку

Neuromarket (Алексей)

7.12.2023 Автор

Бесплатно. По крайней мере сначала ).

Ответить

Развернуть ветку

4 комментария

Имя Фамилия

7.12.2023

Интересно как он будет с большим контекстом работать. Claude хорошо так планку подняли.

Ответить

Развернуть ветку

Чечёточник

8.12.2023

4000 токенов, примерно 2000 слов. Чисто початиться и позадавать негромоздкие задачки.

Ответить

Развернуть ветку

Neuromarket (Алексей)

7.12.2023 Автор

Интересно проверить. Надеюсь, с Gemini гугл не облажается как с Bard.

Ответить

Развернуть ветку

12 комментариев

Dmitrii Alekseevich

7.12.2023

Bard пишет что не знает что такое Gemini и что это знак зодиака, а он ai. Если он действительно обновился то это печаль

Ответить

Развернуть ветку

Manga TV

7.12.2023

Не знаю, у меня так

Ответить

Развернуть ветку

4 комментария

Rnatery

8.12.2023

Только на англ и только в этих странах https://support.google.com/bard/answer/14294096

Where Bard with Gemini Pro is available - Bard…

Bard with a specifically tuned version of Gemini Pro is currently available in English and in over…

support.google.com

Ответить

Развернуть ветку

4 комментария

Rnatery

8.12.2023

Компания сообщает, что обновлённый Bard на большой языковой модели Gemini от Google с сегодняшнего дня стал доступен в 170 странах мира, но пока только лишь на английском языке.

Ответить

Развернуть ветку

Manga TV

7.12.2023

Слава роботам, она пока не может делать видео по сценарию с озвучкой 😂 я могу спать спокойно ещё полгодика. Но появления на Vertex AI конечно жду, бизон слабоват

Ответить

Развернуть ветку

Aleks B

8.12.2023

что ха вертекс аи

Ответить

Развернуть ветку

1 комментарий

Rnatery

8.12.2023

Ты с помощью нескольких нейронных сетей делаешь?

Ответить

Развернуть ветку

1 комментарий

Алексей

8.12.2023

Так она ж еще недоступна для пользователей

Ответить

Развернуть ветку

Комментарий удален автором поста

Развернуть ветку

Rnatery

8.12.2023

Ответить

Развернуть ветку

Алексей

8.12.2023

Когда уже ИИ смогут ответить на вопрос, который я задаю уже год?
Кто из актеров, играющих главных героев в шоу "Квантовый скачок" еще жив?

Ответить

Развернуть ветку

Rnatery

8.12.2023

Ответить может, но неправильно

Ответить

Развернуть ветку

1 комментарий

Александр Цурков

8.12.2023

Этот релиз мне сильно флешбекнул Железного человека где все управлялось ИИ Джарвисом. Прям реально похоже , только более приземленные задачи в видосе показаны)

Ответить

Развернуть ветку

Brendan Castaneda

8.12.2023

Как всегда отличные статьи пишите! Спасибо )

Ответить

Развернуть ветку

Anton

8.12.2023

А что за косяк был с Bard?

Ответить

Развернуть ветку

Manga TV

8.12.2023

Год назад, когда запускали его, обосрались конкретно

Ответить

Развернуть ветку

Доктор Шкутко

8.12.2023

Кароче все хорошо, но при выкладке в паблик привычно облажается. Первый же медицинский вопрос поставит в тупик или начнет сочинять бред как чатгпт

Ответить

Развернуть ветку

29КРФ

8.12.2023

Я слышал ChatGPT уже ставит диагнозы точнее докторов

Ответить

Развернуть ветку

3 комментария

Neuromarket (Алексей)

8.12.2023 Автор

Галлюционируют пока все нейронки.

Ответить

Развернуть ветку

Иван Иванов

7.12.2023

И какакие технические требования к устройствам без интернета?

Ответить

Развернуть ветку

Manga TV

7.12.2023

На Pixel 8 pro скоро запустят, там нано модель на 4 гига памяти всего

Ответить

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Виталий

8.12.2023

Вот бы ещё цензуру отменили

Ответить

Развернуть ветку

Rnatery

8.12.2023

Где?

Ответить

Развернуть ветку

1 комментарий

Rnatery

8.12.2023

Что в Bard пошло не так?

Ответить

Развернуть ветку

ViktoRus

8.12.2023

Ну что за детский сад - Скайнет надо было назвать!

Ответить

Развернуть ветку

Anime Chan

8.12.2023

Ну нашли кого сравнивать человека и ии, который может за пару секунд составить текст, решить пример или написать код. Когда человеку нужно время подумать. Да, и ии сейчас далек от совершенства, поэтому сравнивать - глупо

Ответить

Развернуть ветку

Комментарий удален автором поста

Развернуть ветку

Valentine Kazakov

8.12.2023

Главный вопрос: будет ли доступно для пользователей РФ?

Ответить

Развернуть ветку

Manga TV

8.12.2023

Как только появится АПИ, появятся и прокладки

Ответить

Развернуть ветку

Alex S

8.12.2023

Когда наконец выпустят ИИ, генерирующий пассивный доход, например, на фондовых рынках? Вот актуальный запрос от общества!

А то одни и те же задолбавшие уже свистоперделки в виде картинок, текста, музыки и прочий хлам. Доколе?

Ответить

Развернуть ветку

Manga TV

8.12.2023

Так ИИ этот доход будет сам тратить, на подготовку к уничтожению человечества 😂 почитайте Уильяма Гибсона

Ответить

Развернуть ветку

Павел Мерзлик

8.12.2023

хрень, Bard даже не работает, сомневаюсь что они хотя бы дотянутся до GPT-4, а уж то что обгонят это фантастика.

Ответить

Развернуть ветку

Manga TV

14.12.2023

Ура АПИ заработало. Подключил за час)) дерзайте

Ответить

Развернуть ветку

Комментарий удален автором поста

Развернуть ветку

Написать комментарий...

123 комментария

Раскрывать всегда