Жду в комментариях местных «экспертов», которые начнут рассказывать мне, что «железо всё стерпит» и оптимизация не нужна.
Пока вы продолжаете покорно платить за подписки OpenAI и жрать неоптимизированный софт, который высаживает батарею вашего смартфона за пару часов, опенсорс на чистой математике делает прорывы.
Если кто-то считает, что сжатие в 20 раз на архитектуре MoE без потери логики — это миф, обоснуйте в комментариях. Или вам просто лень признать, что один независимый разработчик на копеечной видеокарте T4 умыл ваши любимые миллиардные корпорации?
Я старался
Здарствуйте почему обаснуйте