Как пользоваться нейросетью Google Gemini для повседневных задач: обзор возможностей с примерами промптов

Бонус: сравнение с ChatGPT и Claude.

Как пользоваться нейросетью Google Gemini для повседневных задач: обзор возможностей с примерами промптов

Google Gemini теперь доступна в любом Android — с начала октября голосовым помощником можно пользоваться бесплатно. Это новый шаг в развитии нейросети от Google. Что умеет Gemini, как справляется с запросами и сколько стоит подписка — в этом материале.

Содержание

Что такое Google Gemini

Чат-бот на основе искусственного интеллекта. Релиз состоялся в марте 2023 года, правда, тогда нейросеть называлась Bard. В феврале 2024-го Google анонсировала ребрендинг и запуск платного тарифа Gemini Advanced с доступом к более мощной версии ИИ-модели.

Gemini умеет отвечать на вопросы, генерить идеи, пересказывать тексты, писать код, переводить. А ещё она мультимодальная, то есть распознаёт информацию не только в виде текста, но и в картинках, аудио, видео. Кроме того, AI-модели Google могут быть полезны разработчикам приложений — Gemini интегрируется через API, нужная для этого документация опубликована на сайте.

Нейросеть поддерживает диалог более чем на 40 языках, в том числе на русском, английском, немецком, французском, китайском.

Как пользоваться нейросетью

Gemini недоступна пользователям с российскими профилями, но с включённым VPN и браузером Chrome ограничения получилось обойти.

Нейросетью можно пользоваться прямо в браузере. Для этого:

  • Откройте страницу https://gemini.google.com/.
  • Нажмите «Войти».
  • Выберите аккаунт Google для входа или создайте новый, если его пока нет.
  • Введите первый запрос в специальную строку — она находится внизу приветственной страницы.

Gemini также адаптирована к использованию на мобильных устройствах. Владельцам смартфонов на iOS понадобится войти в приложение Google и переключиться на вкладку Gemini в верхней части экрана. Для Android есть отдельное приложение с ИИ-помощником — скачать его можно из Google Play.

Примеры промптов

Протестировали возможности Google Gemini, обратившись к ней с разными запросами. Показываем, как нейросеть с ними справилась.

Для начала попросили Gemini рассказать, где в октябре самая жаркая погода. Нейросеть ответила развёрнуто: отметила возможные колебания температуры и порекомендовала для отдыха страны с тропическим климатом, Средиземноморье и Канарские острова.

Промпт: «В какой стране самая жаркая погода в октябре?». Источник: gemini.google.com   
Промпт: «В какой стране самая жаркая погода в октябре?». Источник: gemini.google.com   

В обзоре Gemini упоминается её навык поиска информации по загруженному изображению — проверили, справится ли нейросеть со скриншотом из мультфильма «Зверопой 2». Чат-бот корректно определил животных на картинке и даже отметил, что эти создания — антропоморфные и, скорее всего, участвуют в шоу.

Промпт: «Какие животные есть на скриншоте?». Источник: gemini.google.com   
Промпт: «Какие животные есть на скриншоте?». Источник: gemini.google.com   

В конце ответа Gemini предлагает помощь с дальнейшим поиском — например, определить, из какого именно мультфильма взят кадр. Но на уточняющий вопрос по своей же рекомендации Gemini чёткого ответа не дала, попросив больше контекста. Хотя правильный ответ среди её предположений всё же был.

Промпт: «Из какого мультфильма кадр?». Источник: gemini.google.com

Дальше ИИ нужно было пересказать содержание видео. С резюмированием выступления Gemini справилась. Но на следующий запрос — изложить содержание более подробно — предложила тот же самый ответ. На промпт «Напиши тайм-код для видео» нейросеть не ответила вовсе.

Промпт: «Перескажи содержание видео https://www.youtube.com/watch?v=XEzRZ35urlk». Источник: gemini.google.com   
Промпт: «Перескажи содержание видео https://www.youtube.com/watch?v=XEzRZ35urlk». Источник: gemini.google.com   

В последнем промпте Gemini пришлось покреативить — предложить варианты слогана для производителя одежды больших размеров, сделанной изо льна. Вряд ли подобные тексты будут пригодны в маркетинге компании, однако чат-бот выделил преимущества изделий — их можно учесть в проработке реального слогана.

Промпт: «Придумай 5 вариантов слогана для производителя одежды plus size изо льна». Источник: gemini.google.com   
Промпт: «Придумай 5 вариантов слогана для производителя одежды plus size изо льна». Источник: gemini.google.com   

Сравнение Google Gemini с аналогами

Помимо Google, в развитии нейросетей лидируют ещё 2 компании: OpenAI (ChatGPT, GPT-4) и Anthropic (Claude 3/3.5). Функциональность моделей очень похожа — например, все они поддерживают диалоговый режим общения с пользователем и понимают промпты на разных языках.

Однако есть несколько параметров, по которым Gemini отличается от конкурентов.

  • Доступность. С включённым VPN Gemini работает без ограничений при авторизации в учётке, зарегистрированной в России. Для использования ChatGPT и Claude 3 потребуется регистрация по номеру телефона — для российских номеров опция недоступна.
  • Количество бесплатных запросов. Разработчики предупреждают, что лимит промптов не бесконечен и зависит от общей нагрузки на модель со стороны пользователей. Однако на деле ChatGPT можно отправить около 20 запросов в час, Claude 3 — до 20 в день, а Gemini — сколько угодно (по крайней мере предупреждений со стороны системы о скором исчерпании лимита не было).
  • Мультимодальность. Как и ChatGPT, Gemini умеет работать с текстами и картинками, обрабатывать голосовые запросы. А модели Anthropic сфокусированы на текстовой информации.
  • Интеграции. Gemini встроена в такие популярные сервисы Google, как Gmail, «Документы», «Таблицы» и другие. Но работает она только с оплаченным тарифным планом Google Workspace и в подписке Google One AI Premium (информация про неё — ниже в блоке «Тарифы»).

В целом, если не требуется писать сложный код и обрабатывать массивы данных, разница при взаимодействии с разными моделями будет почти не ощутима. При выборе можно отталкиваться от возможности завести аккаунт (при наличии зарубежного номера), а также от объёма и содержания задач.

Тарифы Google Gemini

Gemini 1.5 Flash (выбрана по умолчанию) доступна бесплатно. Продвинутую модель Gemini 1.5 Pro можно подключить с тарифом Google One AI Premium за $19,99 в месяц. В тариф включены:

  • Обработка более сложных запросов. Контекстное окно в Gemini 1.5 Pro расширено с 32 тысяч до 1 млн токенов (столько информации нейросеть способна «помнить» при работе с одним запросом).
  • Интеграция с сервисами Google. Например, можно использовать Gemini в почте в качестве персонального ассистента: он подготовит краткое содержание переписки и черновик ответного письма.
  • 2 Тб облачного хранилища.
  • Подписка Fitbit Premium с рекомендациями для тренировок.
  • Подписка на сервис Nest Aware для контроля за домом.

Также доступны корпоративные тарифы Gemini Business ($20 за пользователя в месяц при оформлении подписки на год) и Gemini Enterprise ($30 за пользователя в месяц).

Каким чат-ботом вы обычно пользуетесь и почему выбрали именно его?

44
2 комментария

Gemini заметно "тупее" остальных

Мой личный топ:
ChatGPT
Claude
...
Gemini