История о том как я делал бота генерирующего из текста .svg

История о том как я делал бота генерирующего из текста .svg

Предисловие

Представьте: Вы думаете, что придумали что-то, до чего еще никто не догадался. Вы загораетесь этой идеей и начинаете в соло реализовывать. Делаете киллерфичу, а на следующий день какая-то IT компания реализовала то же, силами целой команды и на порядок лучше. Так же было и со мной. Недавно ребята из recraft.ai выкатили инструмент для генерации svg. Гораздо более мощный и удобный чем тот бот, который я сделал.

Как это выглядит?

Есть бот в телеграм которому пишешь любое слово на английском - получаешь в ответ векторное изображение

Как это работает?

Нейросети генерировать векторные изображения на данный момент (04.06.23) - пока не умеют. На сколько мне известно. Но с имитацией вектора в растре отлично справляются и midjorney и stable diffusion. Процесс - генерируешь в stable, и трассируешь в Adobe Illustrator - работал. Сначала появилась мысль автоматизировать это. И затем понял, что по сути это генерация из текста в вектор обходными путями.

История о том как я делал бота генерирующего из текста .svg

Я использовал модель Lora обученную на Flat иллюстрациях. Для запроса я использовал следующий запрос:

История о том как я делал бота генерирующего из текста .svg

После генерации изображения, мне нужно было трассировать результат чтобы получить вектор. Я сравнил доступные варианты. И все работало плохо. Потом я случайно наткнулся на Vectorizer AI. Он находится в бете и у него оказался бесплатный API. “Ну это знак” - подумал я и решил использовать его.

История о том как я делал бота генерирующего из текста .svg

Результат понравился и я сел за код) Точнее сел не я а GPT4 с плагинами, т.к. питоном я не владею и знаю только основы.

История о том как я делал бота генерирующего из текста .svg

Все шло как по маслу и у меня получилось написать код который генерировал картинку и конвертировал в svg. Осталось сделать Телеграм-бота. Тот ко мне подключился знакомый. Он отрефакторил код и вместе мы в тот же день запилили бота.

На следующий день обнаружилась масса багов и подводных камней.

  • Внешняя ссылка для stable diffusion хостится на huggingface. 72 часа бесплатно, за остальное - плати
  • Сервер с видеокартой стоит порядка 20000 -25000 в месяц
  • Были баги и ошибки
  • Вечером 3го дня я увидел сервис в котором моя фича уже сделана

Заключение

Проблемы - решаемы, но увидев крупного конкурента у меня опустились руки.

Я решил поделиться этой статьей, чтобы показать, что даже в одиночку - реально сделать что-то необычное. Ну и позвать вас к себе в телеграм про UX/UI.

Нейросети меняют мир и это только начало.

9
2 комментария

5+ за старания🤛🏼

1
Ответить

Имба чел, уважуха

Ответить