Заметки о блокчейне от DevOps специалиста. От базовых знаний до глубоких технических разборов. Без криптотрейдинга и шиткоинов. https://t.me/art_of_chain
Согласен, локальная модель объективно слабее облачного Sonnet. Но здесь другая ниша — безлимитный агент для рутины: рефакторинг, навигация по проекту, шаблонный код. Для серьёзных задач — облачный Claude выигрывает, никто не спорит.
PS: Немного дополнил статью.
Хорошая статья, спасибо автору. С «Плати по миру» удалось получить карту и оплатить подписку на ИИ за 5 мин.
Хорошие вопросы, отвечу по порядку:
— Видеокарта: не нужна, модель работает на CPU. GPU ускорит, но не обязательна.
— RAM: зависит от модели. 9b — всего 6.6 GB, 35b — 24 GB. Если железа совсем мало — есть qwen3.5:cloud, запускается на серверах Ollama без загрузки.
— Квантизация и контекст: по умолчанию Q4_K_M, контекст 256K — прямо из библиотеки Ollama.
— Скорость: на CPU ~5–15 tok/s, да, медленно. Смысл не в скорости, а в безлимите и приватности.
— LM Studio: отличный инструмент для чата. Claude Code — это агент с доступом к файловой системе и bash, другой сценарий использования.
PS: Немного подредактировал и дополнил статью, чтобы было меньше вопросов в будущем.