{"id":14286,"url":"\/distributions\/14286\/click?bit=1&hash=d1e315456c2550b969eff5276b8894057db7c9f3635d69a38d108a0d3b909097","title":"\u041f\u043e\u0440\u0430\u0431\u043e\u0442\u0430\u0442\u044c \u043d\u0430\u0434 \u043a\u0440\u0443\u043f\u043d\u0435\u0439\u0448\u0438\u043c\u0438 \u0418\u0422-\u043f\u0440\u043e\u0435\u043a\u0442\u0430\u043c\u0438 \u0441\u0442\u0440\u0430\u043d\u044b","buttonText":"","imageUuid":""}

Нейросеть дня «Gemini»: конкурент ChatGPT от Google

ChatGPT задал продуктовый стандарт — всё в одном чате: можно загрузить фото рукописного текста, попросить перепечатать, объяснить, создать на основе этого изображение, найти недостающую информацию в интернете и превратить в другой документ. На бэке в это время несколько моделей дают друг другу задания, но мы этого не видим.

25 лет продуктовый стандарт задавал сам Гугл, а сейчас, в роли догоняющего, пытается отвоевать быстро формирующийся рынок ИИ-помощников. Около года назад они выкатили «сырого» Барда, недавно проапгрейдили его и переименовали в Gemini. Сделал для вас обзор этого сервиса.

Gemini — самая мощная большая языковая модель (LLM) от Google. С продуктовой точки зрения копирует ChatGPT: в режиме чата вытворяет с текстом что угодно, может анализировать ваши и генерировать изображения. Утверждают, что качество генерации выше, чем у конкурентов, но проверить это сложно.

Стоит упомянуть два важных преимущества Gemini:

  1. Максимальное контекстное окно в 1 млн. токенов (у ChatGPT 32к, у Claude 80к). Т.е. в рамках одного чата, теоретически, Gemini может хранить в памяти текст объёмом с Войну и мир.
  2. Интеграции в другие продукты Google. Например, прямо из чата создать документ или таблицу Docs, найти что-то в Gmail, сделать выжимку YouTube-видео. Если вы плотно сидите на сервисах Гугла, то Gemini, с его бесшовными интеграциями, выглядит намного интереснее одинокого ChatGPT с его недоделанным магазином расширений. Чуть позже сделаю отдельный разбор интеграций Gemini.
Промо-видео Gemini

Что умеет Gemini от Google:

  1. Вести осмысленный диалог в режиме чата на любую тему
  2. Генерировать любые текстовые материалы
  3. Считывать информацию с изображений
  4. Генерировать изображения
  5. Анализировать документы и сайты по вашей ссылке
  6. Если просите найти какую-то информацию, указывает источники откуда взял ответ
  7. Из чата позволяет взаимодествовать другими сервисами Google — YouTube, Gmail, Drive, Docs, Maps, Flights, Hotels
  8. И наоборот, можно открывать окно чата или давать задания Gemini из других сервисов Google

Что пока не умеет в сравнении с ChatGPT:

  1. Нет открытого магазина приложений, интеграции только с сервисами Гугла
  2. Нет настройки собственных чат-ботов
  3. Нет сквозной памяти
  4. Плохо генерирует изображения

Бесплатная версия Gemini из России открывается только с VPN. В США и некоторых других странах за $20 можно купить более мощную Gemini Advanced. Она имеет в 4 раза больше параметров (137 млрд против 34 млрд), т.е. будет выдавать более качественный материал.

Те же 20 баксов, что и ChatGPT, но Гугл тут накинул плюшек в виде 2тб хранилища на диске Drive + первые два месяца бесплатно. Российские карты, как заведено, не принимают)

P.S. Сначала скептически отнёсся к анонсу, я уже тестил Bard ранее и он не впечатлил. Но со второй попытки распробовал, даже подумываю изменить любимому ChatGPT и полностью переехать к Gemini. Очень подкупают интеграции с другими продуктами, при сопоставимом качестве генерации.

---

Авторские обзоры ИИ-инструментов несколько раз в неделю. Удобнее читать в Telegram — https://t.me/universe_ai

0
Комментарии
-3 комментариев
Раскрывать всегда