Мой опыт с ИИ в России глазами европейца 🤯
Это история о том, как я собрал полностью локальную ИИ-среду разработки (и почему вам стоит сделать то же самое).
Переезд из Евросоюза в Москву казался большим приключением — ровно до того момента, как я открыл ноутбук и попытался работать. Я обычный пользователь экосистемы GCP. Ничего сверхъестественного: обычное API Gemini, Vertex AI Studio, Antigravity, иногда Claude и так далее. У меня было три корпоративных заказчика, ждущих кастомные ИИ-решения, куча личных проектов и слепая уверенность, что «всё само собой заработает».
Как вы уже догадались — не заработало.
С 15 апреля 2026 года Россия не просто заблокировала VPN — их научились вылавливать с пугающей эффективностью. Речь о 99% мгновенной смертности коммерческих VPN, как только ваше устройство подключается к сети. Продвинутые кастомные VPS-связки, судя по некоторым Telegram-каналам, работают — но только если вы настроили их до прилёта.
И тут началась паническая мысль: «И как же плохо всё может быть?»
Кладбище VPN
Я перепробовал всё. Каждого провайдера, о котором слышал, каждый протокол, каждый шёпот на Reddit в духе «гарантированно работает в России» — безрезультатно. Пара мобильных решений иногда выживали, но их быстро выкашивали. А ноутбук? Город-призрак с таймаутами подключения. Забудьте. Моим единственным напарником стала ΌΨΗ (arpa.chat) на расширенном тарифе — единственная западная модель, всё ещё доступная без VPN. Она помогала мне тестировать то, что шло дальше.
Qoder, GigaIDE и другие тупики
ΌΨΗ посоветовала забыть об Antigravity, если только я не подниму свой VPS. В отчаянии я переключился на альтернативные IDE. Qoder — IDE на базе Qwen — сначала выглядел многообещающе. Китайский же, санкции не должны касаться? Так-то оно так, но нет! Частью их сделки для продаж в ЕС и США является запрет на обслуживание в России. Жёсткий блок.
Потом я попробовал GigaIDE — сборку на базе GigaChat, российского аналога ChatGPT от Сбера, обученного на архитектуре DeepSeek. Мне очень хотелось её полюбить. Правда. Но интерфейс, производительность и качество ответов заставили меня активно скучать по Gemini 3.1 Pro, как по отрезанной руке. Всё казалось тормознутым, картонным и отставало на три шага от того, к чему я привык.
Дальше — VSCode с KODA, российским плагином. Он говорит. Отвечает. Исключительно на русском. Я мог вбить системные инструкции капсом — он всё равно отвечал: «Конечно, но я расскажу тебе по-русски». Не совсем то, что нужно для корпоративных клиентов.
Свой собственный мозг (на SSD)
Тогда я сделал то, на что способен любой загнанный в угол разработчик — достал тяжёлую артиллерию. У меня хватило ума взять с собой офлайн-модели на портативном SSD. Gemma 4, Qwen 2.5 Coder 3B, Qwen 3.5 9B, DeepSeek Coder 7B и ещё несколько — можно сказать, старые друзья. Я скачал Ollama, последовал инструкциям arpa.chat, открыл терминал — и запустил их локально.
Самым простым и, честно говоря, красивым путём оказалась связка VSCode + плагин Continue + Ollama. Я глубоко залез в config.yaml, назначив разные модели для автодополнения, чата и генерации кода. Разные промпты, разные температуры, разные контексты. Я настраивал, матерился, снова настраивал. Всё работало на CPU и RAM, потому что с VRAM у меня было смешно, а аренда у западных провайдеров — очевидно, не вариант.
И потом… после нескольких итераций оно заработало. Не «кое-как». После серьёзной доводки я добился приемлемой, стабильной производительности. Такой, что ты откидываешься в кресле и смеёшься, потому что ты собрал всю среду разработки из злости и горстки GGUF-файлов. Агенты теперь понимали репозитории, которые я им подсовывал, планировали, работали по шагам и фазам, оценивали себя, решали сложные многошаговые задачи, управляли git и запускали тесты. Вдобавок я поставил Skillware и использовал скилл переписывания промптов, чтобы сжимать токены, сохраняя тот же контекст и результат.
Вывод
Думаю, я не скоро вернусь к платным ИИ-подпискам. Не потому что не могу, а потому что весь этот бардак научил меня важной вещи: ограничения выталкивают тебя за рамки привычного. Когда теряешь доступ к лакированным корпоративным решениям «в один клик», учишься собирать свой собственный стек. Коллекционировать модели как покемонов, настраивать локальный инференс, затачивать модели под конкретные задачи и мириться с терминалом.
Это было бесяче, но ещё это было интересно, увлекательно и дико познавательно. Теперь у меня есть полностью офлайн-ИИ для разработки, который не смогут отнять ни санкционные органы, ни борьба с VPN, ни корпоративная политика.
Так что вот мой непрошеный совет: если вы подсели на коммерческие ИИ-модели и облачные IDE — возьмите выходные и представьте, что завтра они исчезнут. Настройте локальную модель. Научитесь дообучать маленькую модель для своего стека. Возьмите SSD с открытыми весами, если поедете в такие места, как Россия (и, возможно, настройте тот самый кастомный VPS до вылета).
P.S. К тому моменту, как я закончил с локальной настройкой, я понял, что Cursor работает отлично — но только с автопилотом Cursor (не Gemini, Claude и т.д.). Мало ли, окажетесь в похожей ситуации и захотите сэкономить немного нервов. :D