В этой статье мы будем использовать термин «производительность LLM», когда речь идет об оценке того, насколько полезен LLM для конкретной задачи. Дополнительные показатели, такие как токены в секунду, задержка или метрики стоимости, а также другие оценщики, такие как метрики вовлеченности пользователей также полезны, но выходят за рамки этой статьи.