Новый Jan-nano-128k от Menlo Research — это новая ИИ с 4 миллиардами параметров, которая кажется удивила всех. Она лучше (!) даже Deepseek с 671 миллиардом параметров, набрав 83.2 балла в тесте SimpleQA (Deepseek — 78.2).
Модель заточена под длинные контексты и глубокий поиск в интернете, что делает её прямым конкурентом Perplexity.
Работает с инструментами, поддерживает YaRN-скейлинг (это я не знаю что такое), а запустить можно даже на слабом железе вроде RTX 2060 с 8 ГБ видеопамяти, если часть данных скинуть на процессор.
Народ на Reddit в восторге (это я читал комментарии), но есть и вопросы. Кто-то подозревает в комментариях накрутку... :)
Модель уже доступна на HuggingFace, а GGUF-версия для локального запуска тоже выложена. Технический отчёт задерживается, но обещают скоро.
В общем для тех, кто хочет мощный поиск без облачных API, это прям находка...
Подписывайтесь на Telegram Русский ИТ бизнес 👨.