Ноябрьская битва титанов: Эффект смартфона и стагнация ИИ

Ноябрь нам подарил обновление сразу 4 моделей: GPT-5.1, Grok 4.1, Gemini 3 и Opus 4.5. Я прогнал их через свои тесты, и результаты заставляют задуматься. Кажется, мы уперлись в невидимый потолок.

Gemini: Отлично мыслит абстрактно. Стихи пишет на твердую «четверку» с первой попытки. Но если его чуть подтолкнуть (плюс 1–2 промта), он выдает результат на «отлично», достигая легендарного уровня Opus.

Grok: Очень быстрый, ёмкий и невероятно дешёвый, но муза к нему не заходит — стихи на «троечку».

GPT 5.1: Стал глубже в ассоциациях, но рифма и слог всё ещё хромают (на тройку). В разборе новостей оказался превосходен — выбрал всю фактуру до крупицы, ничего не упустив.

Opus: Всё ещё хорош, его стиль великолепен.

Случилось странное. Мой самый каверзный вопрос, который однажды с блеском расколол GPT 5 Pro, в этот раз оказался не по зубам никому. Я задал его всем обновленным моделям — никто не решил задачу до конца.

Даже GPT 5 Pro словно потерял хватку и не смог повторить свой же успех.

Мы подошли к интересному этапу. Все модели начинают выравниваться и становятся предельно хорошими. Хорошими, но не отличными. Эпоха качественных скачков сменилась эпохой шлифовки.

Это очень напоминает современный рынок смартфонов. Все флагманы сейчас одинаковые, они отлично работают, и лишь мелкие детали выделяют телефон из толпы. То же самое происходит с ИИ: модели, которые раньше доминировали в одной области, теряют преимущество, потому что конкуренты подтягивают свои слабые стороны.

🥇 Gemini. За гибкость ума.

🥈 GPT-5.1. За качество работы с данными.

🥉 Qwen. Самый отличный бесплатный вариант, который наступает лидерам на пятки.

Всем спасибо за прочтения статьи. Буду рад вас видеть в моём телеграм-канале.

Ноябрьская битва титанов: Эффект смартфона и стагнация ИИ

📉 Тревожный звоночек: Общая деградация?

📱 Синдром рынка смартфонов

🏆 Вердикт и личный рейтинг