DeepSeek и «мусорные» модели

В последний месяц я активно тестировал бюджетные модели через API: Qwen3.5-Flash, Gemma 3 27B, GPT-5.2, GLM-4-32B-0414-128K и другие недорогие решения, а также бесплатные модели — Nemotron 3 Super, GLM-4.5-Flash и GLM-4.7-Flash. Все эти модели стоят до 1 доллара за вход и выход (а некоторые, как Nemotron 3 Super и GLM-Flash-линейка, вообще бесплатные). Я потратил немного денег и протестировал большинство этих дешёвых и местами уже устаревших моделей — и у меня возник вопрос: зачем они вообще существуют? И кто ими пользуется на постоянной основе (кроме меня, который просто их тестировал)? Ведь есть DeepSeek — модель, по уровню сопоставимая с современными решениями от Claude, OpenAI или Qwen, но при этом стоящая всего 28–42 цента.

Для сравнения по API: у Anthropic Claude Opus 4.6 стоит примерно $30 за вход и $150 за выход за 1 млн токенов, у GPT-5.4 Pro — около $30 и $180 соответственно. А DeepSeek с ~1 трлн параметров — всего 28 и 42 цента. Да, сейчас можно возразить, что некорректно сравнивать китайские модели с топовыми решениями OpenAI и Anthropic. Мол, цифры сами по себе ничего не значат — важны качество, поведение модели на практике и ключевые характеристики. И с этим я частично согласен: OpenAI и Anthropic действительно опережают китайские модели по ряду параметров и бенчмарков. Но вопрос в другом: разве это преимущество в качестве составляет 100-кратную разницу в цене? На 10–15% — возможно. Но точно не в 100 раз. Отсюда возникает ощущение, что цены на топовые модели сильно завышены. И здесь, возможно, есть не только технические, но конспирологические причины. Об этом я подробнее напишу в следующих материалах.

Но вернёмся к «мусорным» моделям. Если существует DeepSeek, который по уровню близок к OpenAI и Anthropic, но стоит в разы дешевле, зачем тогда нужны все эти устаревшие модели по 20–60 центов за миллион токенов? Вот это для меня остаётся загадкой. Я ещё могу понять использование бесплатных моделей вроде GLM-4.5-Flash — для тестов или простых задач, особенно учитывая отсутствие жёстких лимитов. Но платные слабые модели — кто их покупает и зачем, если есть DeepSeek? С маркетинговой точки зрения вся эта «старьевщина» должна либо сильно дешеветь, либо становиться бесплатной — как это сделали Zai со своими GLM-4.5-Flash и GLM-4.7-Flash. Иначе просто нет смысла подключать такие модели, пока DeepSeek держит настолько низкие цены на свой API.