Как я стал "вайбкодером". Часть 1.
Итак, генерацию изображений в ComfyUI и даже совмещение их с реальными фото я освоил. А что еще мне могут предложить эти нейросети?
Листал как-то Реддит в поисках вдохновения и наткнулся на картинку: прозрачная аптечная капсула с мячами да кроссовками внутри. И тут возникла идея - а что если замуровать в капсулы страны и сделать бота-викторину для Телеграм?
Почему страны? Потому что намедни мы открыли турагентство, и я веду туристический канал. Пришла в голову идея сделать не просто отгадайку, а с генерацией именных скидочных сертификатов, да еще туда что-нибудь полезное запихать! В общем, запилить полноценный бизнес-инструмент для набора подписчиков.
С картинками проблем нет, но как сделать бота? Программировал я когда-то в школе на Бейсике, но тут это вряд ли поможет. Начал искать решения, и это оказались конструкторы ботов, за которые нужно постоянно платить. Это не наш метод, и я спросил Gemini: "Что делать-то? Мне бы бота своего..."
На что он отвечает: "Да без "б", ща все будет!" И выдает код на Python. Говорит - готово, запускай. Даже дал инструкции: запусти терминал, создай окружение, установи библиотеки, пропиши зависимости...
Ну это он жестко придумал, конечно. Я этот терминал всегда по жизни избегал, а ты меня заставляешь творить в нем какую-то дичь. Но, как говорится, - курица не птица, терминал - не ягодица! В итоге все оказалось проще, чем я думал. Запустил, проверил - работает!
Это был, конечно, не готовый бот, а набросок, и я отдавал себе отчет, что впереди меня ждут недели учебы и работы одновременно. Но если надо - значит надо!
Задумался, как наполнить бота контентом: прописать вопросы, ответы, факты о странах и т.д. Через диалог с нейросетью это была бы утопия, так как он будет каждый раз переписывать весь код - и неизвестно, что от него в итоге останется.
В идеале создать бы какой-то интерфейс, куда можно заносить всю текстовую информацию, а потом все это выводить в готовый код бота. И у Гугла, оказывается, есть подходящая штука, называется Build your ideas with Gemini. Смысл в том, что ты описываешь свой проект, а он создает из этого описания полноценное приложение прямо в браузере (про полноценное - это, конечно, я перегнул).
Пишу: "Сделай-ка мне, дружок, интерфейс, да чтоб с окнами и кнопками!" Пару минут подождав, вижу перед собой целый комбайн с внушительным названием "Командный центр".
Сказать, что я был удивлен, - это ничего не сказать. Да это просто нереал какой-то! Все по красоте: разные окошки, настройки, документация по функциям, справочник по элементам моего бота. В общем, все, что нужно для работы.
И началась нудная и долгая рутина: заносил контент, прорабатывал логику и сценарии викторины, исправлял по ходу ошибки... В процессе появлялись новые идеи, которые тут же внедрял, вместе с ними появлялись новые баги, которые нужно было исправить. Эта отладка занимала 80% времени и невероятно бесила. Так прошло несколько недель.
В какой-то момент решил сделать вместо одного уровня целых три. Попросил переделать интерфейс и вдруг понял, что все придется начинать заново...😱