Новый Jan-nano-128k от Menlo Research — это новая ИИ с 4 миллиардами параметров, которая кажется удивила всех. Она лучше (!) даже Deepseek с 671 миллиардом параметров, набрав 83.2 балла в тесте SimpleQA (Deepseek — 78.2).

Модель заточена под длинные контексты и глубокий поиск в интернете, что делает её прямым конкурентом Perplexity.

Работает с инструментами, поддерживает YaRN-скейлинг (это я не знаю что такое), а запустить можно даже на слабом железе вроде RTX 2060 с 8 ГБ видеопамяти, если часть данных скинуть на процессор.

Народ на Reddit в восторге (это я читал комментарии), но есть и вопросы. Кто-то подозревает в комментариях накрутку... :)

Модель уже доступна на HuggingFace, а GGUF-версия для локального запуска тоже выложена. Технический отчёт задерживается, но обещают скоро.

В общем для тех, кто хочет мощный поиск без облачных API, это прям находка...

Подписывайтесь на Telegram Русский ИТ бизнес 👨.

Начать дискуссию