реклама
разместить

DeepSearch, тексты, код: на что реально способен Грок-3

Протестировал Грок 3 от Илона Маска. Первые впечатления были положительными, но углубленное тестирование выявило как сильные, так и слабые стороны модели. В этой статье я делюсь результатами тестов, сравниваю Грок 3 с GPT-4 Turbo (O3 Mini High) и разбираю его потенциал в генерации длинных текстов, исследовательской работе и программировании.

Грок против GPT: тест на генерацию длинных текстов

Первый тест касался написания объемного текста. Я задал Гроку промпт: написать статью о преимуществах электромобилей объемом 5000 слов.

  • Грок 3 написал 1500 слов вместо запрошенных 5000.
  • GPT O3 Mini High справился гораздо лучше, выдав 4700 слов.
  • По структуре и содержанию текст Грока был качественным, но он просто не дотянул до заданного объема.

Вывод: если вам нужна длинная статья — Грок может не справиться.

DeepSearch

Следующий тест — DeepSearch. Я задал Гроку задачу: подобрать идеальные горные лыжи под мой стиль катания.

  • Грок правильно определил, что мне нужны All Mountain лыжи, начал исследование.
  • Он проанализировал 120 страниц, изучил параметры лыж, рецензии и подборки.
  • Итоговый список был довольно точным

Также я проверил DeepSearch для анализа рынка мотоджерси. Грок собрал:

  • Ключевые жалобы пользователей (например, недостаточная вентиляция).
  • Материалы и технологии (что важно для разных категорий райдеров).
  • Список брендов и их специфику.

Минусы DeepSearch

  • По одному и тому же запросу он выдает разные результаты. На мой взгляд, это противоречит исследовательской работе. Если пропмт один. то и результаты должны быть одинаковыми, пусть и написанные другими словами.
  • По российским сайтам поиск слабее, чем по англоязычным. Ищет среди небольшого числа сайтов и упускает много данных. Например, он не смог внятно выдать список изменений по ПДД за 2024й год, упустил много моментов.

Вывод: DeepSearch полезен, но требует двойной проверки результатов.

Грок и программирование

Попробовал заставить Грока написать парсер выдачи Гугла. Результат:

  • Код содержал ошибки.
  • Не работал с первого раза. Со второго раза тоже не работал.
  • Пришлось несколько раз уточнять запрос, но даже после исправлений он не смог выполнить задачу.
  • GPT написал рабочий код сразу.

Вывод: в программировании Грок уступает GPT.

Итоги

Такое ощущение, что он должен быть мощнее, но видимо из за спешки релиза, что то не допилили. Еще не появилась опция "Big Brain", которая была показана на презентации. Возможно с ее появлением, Грок станет более конкурентным.

А вы уже тестировали Грок 3? Делитесь впечатлениями в комментариях!

55
реклама
разместить
6 комментариев

Если пропмт один. то и результаты должны быть одинаковымстатью тоже через чатгпт писали?)

1

Не надо тут оскорблять чатгпт

Пробовал вчера, работает неплохо, но я бы не сказал, что он лучше или хуже. На мой взгляд claude anthropic по серьезнее будет.

1

Да, как раз вчера его и тестил. Не плохо себя показал.

У меня и жпт выдает разные результаты на 1 промт)

Второй промт запускали в том же диалоге или в другом?

«Умнейший ИИ на Земле»: Grok-3 подтверждает громкие слова Илона Маска
«Умнейший ИИ на Земле»: Grok-3 подтверждает громкие слова Илона Маска
«Мы сами боимся»
Разработчики Grok-3 о нейронке Grok-3
33
реклама
разместить
Так ли хорош ИИ-генератор изображений Grok 3?
Так ли хорош ИИ-генератор изображений Grok 3?

В этом посте я сосредоточусь на возможностях Grok 3 по созданию изображений. Я сравню, насколько он стал лучше по сравнению с Grok 2, и посмотрю, как он выглядит в сравнении с другими ИИ-генераторами изображений, такими как ChatGPT и Flux от Black Forest Labs.

1616
«Удалить нельзя оставить: как справляться с негативными отзывами на Авито и даже зарабатывать на них»

Приветствую, с вами Максим Алакшин!

11
Grok-3: новая нейросеть от Илона Маска. Первые впечатления
Grok-3: новая нейросеть от Илона Маска. Первые впечатления
33
GPT-4.5 не смог обойти Grok 3 в тестах производительности☹️

Вообще Тест производительности grok-3 оказался очень полезен для сравнения базовых моделей, поэтому к нему также добавили GPT-4.5

GPT-4.5
Deep Research в ChatGPT — лучший сборщик информации из интернета?
Deep Research в ChatGPT — лучший сборщик информации из интернета?

Отличие ИИ и человека сейчас в том, что ИИ не был способен до недавнего времени собирать актуальную информацию из интернета. Недавний режим поиска из интернета от Grok 3 меня порадовал. Но Deep Research в ChatGPT показал себя гораздо лучше в этом режиме.

11
Мрачная космоопера про внедрение ERP: баги, Хаос и команда, которая никогда не сдается. Серия 4 «Полный сбор»

«Они были разные – как звезды на небе,но судьба свела их вместе, чтобы зажечь одну общую Сверхновую»

Мрачная космоопера про внедрение ERP: баги, Хаос и команда, которая никогда не сдается. Серия 4 «Полный сбор»
11
Grok-3 официально представлен!
Grok-3 официально представлен!
OpenAI против Grok 3: что лучше для Deep Research?👨🏻 🔬

OpenAI развернула функцию Deep Research для всех подписчиков ChatGPT Plus. Илон Маск сделал Grok 3, включая функцию DeepSearch, бесплатным для всех пользователей X. Стоит ли вкладывать деньги в подписку ChatGPT или Grok 3 может справиться с теми же задачами бесплатно? Выясняем.

OpenAI против Grok 3: что лучше для Deep Research?👨🏻 🔬
11
реклама
разместить
Grok 3: Нейросеть от Илона Маска, которая меняет правила игры
Grok 3: Нейросеть от Илона Маска, которая меняет правила игры
11
Разработчики чат джипити внезапно выпустили модель o3 Mini в ответ на успех дипсик, что из себя представляет новая разработка.

Кремниевая долина, Калифорния – OpenAI объявила о выпуске для публичного тестирования новой языковой модели GPT (o3 Mini), демонстрируя стремление укрепить свои позиции на рынке нейросетевых технологий, после громкого релиза DeepSeek R1, вызвавшей значительный интерес в технологической сфере и потенциально повлиявшей на динамику американского рынка…

Убийца DeepSeek — новый GPT O3
Убийца DeepSeek — новый GPT O3
[]