Свежий тест моделей нейросетей для вайбкодинга на реальных задачах

Свежий тест моделей нейросетей для вайбкодинга на реальных задачах

На канале Олега Стефанова вышел новый ролик где он комплексно сравнивает каждую модель на равных условиях в разных задачах. Результат вполне объективный, и, самое главное, полностью совпадает с моим топом, который последний месяц жестко зафиксировался и ставит GPT 5.2 в безоговорочные лидеры.

Топ моделей:

👑 GPT‑5.2 Extra High

2 Claude Code Opus 4.5

3 Claude Code Sonnet 4.5 (на скриншоте очепятка)

4 Gemini 3 Flash

5 Gemini 3 Pro

6 GLM 4.7

7 Composer

8 Kimi K2

9 Qwen 3 Max

Самое важное часто упускается, когда мы сравниваем GPT и Claude Code, а это количество денежных средств, затраченных на решение проблемы. Токены считать смысла нет без привязки к тарифам. Так что 1,75$ у GPT против 5$ у Opus является жирной точкой в сравнении данных моделей.

Конечно, выборка для теста смешная, но даже тех примеров, что были на видео, с головой достаточно, чтобы выявить слабые и сильные стороны каждой модели, я уверяю.

То, что GPT метит в топы, было ясно еще с 5.1 версии, уже тогда они значительно бустанули модель. Ждем релизов от Anthropic, уверен, что скоро представят что-то интересное.

Начать дискуссию