В этом посте мы используем термин «производительность LLM», когда имеем в виду оценку того, насколько полезен LLM для данной задачи. Дополнительные показатели, такие как токены в секунду, задержка или стоимость, а также другие оценщики, такие как метрики вовлеченности пользователей, безусловно, будут полезны, но они выходят за рамки этого поста.