Закинули 200 рублей на API и пилим своего AI-репетитора английского. Как мы устали от «зеленой совы» и спорим из-за виртуальных крыс
Знаете это чувство: у тебя вроде бы твердый B2, ты читаешь документацию в оригинале, но когда на дейли нужно открыть рот и ответить зарубежному заказчику — в голове белый шум, и все нужные слова просто вылетают из головы?
Я пытался лечить это классическими языковыми приложениями (да, теми самыми, с зеленой птицей и кристалликами). Добивал английский, потом пробовал учить японский. Спустя пару недель ежедневных занятий (по часу, без преувеличений) пришло осознание: это просто кликер. Мозг получает дешевый дофамин от расставления правильных слов в предложениях, создавая жесткую иллюзию обучения. Но в активный словарный запас ничего не переходит.
Так к чему это всё? В какой-то момент стрельнула искра, что нужен тренажер, который заставит не тыкать в экран, а говорить. И кто же это сделает, если не мы сами? Так родилась идея Lexiconica.
Вот история о том, как мы, пять студентов, уже полгода пытаемся сделать адекватного ИИ-собеседника, пишем логику памяти и до хрипоты спорим о дизайне.
Как мы собрались — Тиндер для проектов
Всё началось на майноре (дополнительном профиле) в Вышке. У нас было буквально пару недель, чтобы сколотить команды для проектов. Происходило это в формате онлайн-брифингов — эдакий спид-дейтинг, где одни рассказывают о себе, а другие питчат идеи.
На одном из таких созвонов я случайно пересекся со своим старым другом. Слово за слово, начали обсуждать инвайты, и тут всплыла идея про AI-репетитора. «Идейный вдохновитель» команды изначально звал к себе только моего друга, но концепция так срезонировала с моей личной болью, что я буквально влез к ним третьим.
Чуть позже через знакомых подтянулись дизайнер и фронтенд-разработчик. Так собрался наш гаражный стартап.
Под капотом: почему это не просто обертка над ChatGPT
Сделать бота, который просто проксирует запросы в LLM — дело одного вечера. Сделать так, чтобы он приносил пользу — та еще головная боль. Нам нужно было во что бы то ни стало уйти от эффекта «золотой рыбки», когда искусственный интеллект забывает контекст разговора через пять минут.
Основная нагрузка ожидаемо легла на ML и бэкенд. Чтобы заставить нейросеть по-настоящему «запоминать» человека, мы настраиваем сложную логику памяти модели. Работает это так: после каждой вашей сессии система делает правильное саммари и аккуратно вытаскивает факты в профиль. Допустим, в режиме легкого Small Talk вы обмолвились, что работаете DevOps-инженером и любите собак. Бот обязательно сохранит это и использует позже, например, чтобы персонализировать вопросы на виртуальном «Собеседовании».
Но чтобы этот контекст бесшовно передавался из чата в чат, нашему бэкенд-лиду пришлось серьезно повозиться с механизмом сессий. Мы отказались от простых CRUD-таблиц в пользу динамической структуры, которая управляется сложным набором правил, а не статичными сущностями.
Отдельным квестом стало укрощение промптов и настройка строгости ИИ. Базовая модель по своей природе слишком «услужливая» — она охотно игнорирует ваши ошибки, лишь бы поддержать приятную беседу. Нам же нужен тренажер. Поэтому мы выстроили отдельную архитектуру под разные режимы. В легкой болтовне ИИ не душит вас за забытый артикль, чтобы не сбивать флоу речи. Но стоит переключиться на хардкорное интервью — бот превращается в строгого экзаменатора и начинает методично бить по рукам за каждую грамматическую оплошность.
Над оптимизацией всей этой памяти нам предстоит еще просто тьма работы, потому что тащить такую архитектуру своими силами — та еще задачка. Но к середине прошлого месяца нам удалось запустить MVP и начать получать первые отзывы (полные позитива и одобрения, конечно же, ведь у нас пока почти ничего не работает идеально).
Холивары, минимализм и виртуальные крысы
Если вам кажется, что студенческий стартап — это идиллия, то добро пожаловать на наши созвоны по дизайну. Кажется, это больная тема не только для нас. Мы спорим бесконечно. Цвета, шрифты, оставлять интерфейс строгим или сделать его более «нагруженным»? Битвы идут за каждую кнопочку.
Апогеем наших брейнштормов стала идея… сделать сингл-плеерную игру. В какой-то момент мы настолько увлеклись поиском идеального формата, что на полном серьезе начали обсуждать виртуальный город для изучения языка. Идея была в том, чтобы юзер ходил по локациям, общался с NPC, а в качестве мотиватора выступала бы крыса-бандит (как Лис из Даши-путешественницы), который постоянно пакостит игроку. Мы потратили на обсуждение этой метавселенной добрую половину созвона, так и не дойдя до компромисса.
Звучит как бред воспаленного сознания, но мы эту идею даже не забраковали — просто аккуратно отложили в бэклог. То, что мы делаем сейчас, не противоречит появлению виртуальных крыс в будущем. Но пока фокус на MVP.
Экономика: 200 рублей на API и влажные мечты
Многие боятся лезть в AI-продукты из-за мифа о конских счетах за токены. Разрушаю миф: в начале марта мы закинули на баланс буквально 200 рублей. У нас в команде жесткое правило «догфудинга» — мы каждый день тестируем бота на себе, гоняем запросы, ловим баги. И мы до сих пор не сожгли этот бюджет. Реальные траты сейчас уходят в основном на хостинг, серверы и почтовые сервисы.
Что для нас будет успехом прямо сейчас?
- Первая решенная боль. Тот момент, когда к нам придет реальный юзер и скажет: «Пацаны, я благодаря боту прошел собес на английском». Один такой юзкейс даст нам зеленый свет на большой маркетинг.
- 300 живых подписчиков в нашем канале. Пока это влажные мечты, но это станет пруфом, что мы пилим нужную штуку.
Сейчас мы выкатили альфа-версию бота на сайт и в Telegram и активно допиливаем интерфейс.
Если вы тоже устали от зеленой совы и хотите потестить нормального ИИ-собеседника (который не осудит за забытый артикль) — приходите ломать нашего бота на сайте lexiconica.tech или прямо в Telegram: @lexiconica_bot.
А за нашими холиварами и тем, как мы пилим продукт, можно следить в канале Lexiconica. Может, мечты и не такие уж и влажные, кто знает.
Будем рады любым помидорам, баг-репортам и фидбеку в комментариях!