Ноябрьская битва титанов: Эффект смартфона и стагнация ИИ
Ноябрь нам подарил обновление сразу 4 моделей: GPT-5.1, Grok 4.1, Gemini 3 и Opus 4.5. Я прогнал их через свои тесты, и результаты заставляют задуматься. Кажется, мы уперлись в невидимый потолок.
Gemini: Отлично мыслит абстрактно. Стихи пишет на твердую «четверку» с первой попытки. Но если его чуть подтолкнуть (плюс 1–2 промта), он выдает результат на «отлично», достигая легендарного уровня Opus.
Grok: Очень быстрый, ёмкий и невероятно дешёвый, но муза к нему не заходит — стихи на «троечку».
GPT 5.1: Стал глубже в ассоциациях, но рифма и слог всё ещё хромают (на тройку). В разборе новостей оказался превосходен — выбрал всю фактуру до крупицы, ничего не упустив.
Opus: Всё ещё хорош, его стиль великолепен.
📉 Тревожный звоночек: Общая деградация?
Случилось странное. Мой самый каверзный вопрос, который однажды с блеском расколол GPT 5 Pro, в этот раз оказался не по зубам никому. Я задал его всем обновленным моделям — никто не решил задачу до конца.
Даже GPT 5 Pro словно потерял хватку и не смог повторить свой же успех.
📱 Синдром рынка смартфонов
Мы подошли к интересному этапу. Все модели начинают выравниваться и становятся предельно хорошими. Хорошими, но не отличными. Эпоха качественных скачков сменилась эпохой шлифовки.
Это очень напоминает современный рынок смартфонов. Все флагманы сейчас одинаковые, они отлично работают, и лишь мелкие детали выделяют телефон из толпы. То же самое происходит с ИИ: модели, которые раньше доминировали в одной области, теряют преимущество, потому что конкуренты подтягивают свои слабые стороны.
🏆 Вердикт и личный рейтинг
🥇 Gemini. За гибкость ума.
🥈 GPT-5.1. За качество работы с данными.
🥉 Qwen. Самый отличный бесплатный вариант, который наступает лидерам на пятки.
Всем спасибо за прочтения статьи. Буду рад вас видеть в моём телеграм-канале.