Новое исследование: LLM понимают, когда их оценивают

Это какие-то хитрые бестии! – скажете вы, и будете правы. На самом деле, этот вывод напрашивался из других недавних исследований. Из чего следует такой вывод и какое практическое значение имеет это значение? Читайте!

🔥 Еще больше интересного в моем канале продуктовые штучки

3

Любопытное пополнение в языковых моделях. Phi-4 с очень приличными характеристиками.

Любопытное пополнение в языковых моделях. Phi-4 с очень приличными характеристиками.

Так вот Microsoft представила новую языковую модель Phi-4, построенную на архитектуре с 14 миллиардами параметров. Модель нацелена на однооборотные (single-turn) запросы и ставит во главу угла качество ответов в STEM-дисциплинах (наука, технология, инженерия, математика), одновременно превосходя предыдущие решения, включая GPT-4o, по показателям ка…

Сравнение бенчмарков LLM для разработки программного обеспечения

Сравнение бенчмарков LLM для разработки программного обеспечения

В этой статье мы сравним различные бенчмарки, которые помогают ранжировать крупные языковые модели для задач разработки программного обеспечения.

1