Он работает на основе методов сжатия, которые позволяют уменьшить модель в несколько раз.
Интересно, как сервис будет работать на разных устройствах, но сам факт того, что теперь можно запускать Llama 3.1 без подключения к сети, уже потрясающий
Пс , это можно было делать уже несколько лет как
Интересно, как сервис будет работать на разных устройствах, но сам факт того, что теперь можно запускать Llama 3.1 без подключения к сети, уже потрясающий
Пс , это можно было делать уже несколько лет как