Если написал о LMArena, то надо написать ещё о турецком #стартапдня LLMArena, всего ж в букву отличие. Если проект с одной L сравнивает нейросети по качеству ответов, то двойное L оценивает их по формальным показателям: длине контекста, поддерживаемым фичам, и, главное, цене.
Сделав несколько кликов в удобном интерфейсе, можно, например, увидеть, что GPT-4.1 в 20 раз дороже, чем GPT-4.1-nano и в 5 раз дороже GPT-4.1-mini. А возможности всех трех моделей совпадают – кроме “ума”, конечно. Но ум надо на проекте с одной L смотреть. Или сравним deepseek-r1 у разных провайдеров. Groq оказался в 5.5 раз дешевле Azure. Зайди кл…