Что может интересовать в DeepSeek и Mistral ? Качество ответов ваще не але.

Артур Томилко

9 дек

Сотрудник Yandex Research разработал сервис для запуска большой языковой модели Llama 3.1 «на обычном компьютере»

Он работает на основе методов сжатия, которые позволяют уменьшить модель в несколько раз.

2828

Хотя погодите... 8b - это же не такая уж большая модель.
Я на ноуте 13b давно запускаю... на RTX 3060 8gb.

Новость по прежнему шикарна, но я буду ждать когда другие модели можно будет сжать до сингулярности.
Меня из доступных нейронок очень интересует DeepSeek и Mistral. На остальные пофиг.