{"id":14287,"url":"\/distributions\/14287\/click?bit=1&hash=1d1b6427c21936742162fc18778388fc58ebf8e17517414e1bfb1d3edd9b94c0","title":"\u0412\u044b\u0440\u0430\u0441\u0442\u0438 \u0438\u0437 \u0440\u0430\u0437\u0440\u0430\u0431\u043e\u0442\u0447\u0438\u043a\u0430 \u0434\u043e \u0440\u0443\u043a\u043e\u0432\u043e\u0434\u0438\u0442\u0435\u043b\u044f \u0437\u0430 \u0433\u043e\u0434","buttonText":"","imageUuid":""}

История о том как я делал бота генерирующего из текста .svg

Предисловие

Представьте: Вы думаете, что придумали что-то, до чего еще никто не догадался. Вы загораетесь этой идеей и начинаете в соло реализовывать. Делаете киллерфичу, а на следующий день какая-то IT компания реализовала то же, силами целой команды и на порядок лучше. Так же было и со мной. Недавно ребята из recraft.ai выкатили инструмент для генерации svg. Гораздо более мощный и удобный чем тот бот, который я сделал.

Как это выглядит?

Есть бот в телеграм которому пишешь любое слово на английском - получаешь в ответ векторное изображение

Как это работает?

Нейросети генерировать векторные изображения на данный момент (04.06.23) - пока не умеют. На сколько мне известно. Но с имитацией вектора в растре отлично справляются и midjorney и stable diffusion. Процесс - генерируешь в stable, и трассируешь в Adobe Illustrator - работал. Сначала появилась мысль автоматизировать это. И затем понял, что по сути это генерация из текста в вектор обходными путями.

Я использовал модель Lora обученную на Flat иллюстрациях. Для запроса я использовал следующий запрос:

После генерации изображения, мне нужно было трассировать результат чтобы получить вектор. Я сравнил доступные варианты. И все работало плохо. Потом я случайно наткнулся на Vectorizer AI. Он находится в бете и у него оказался бесплатный API. “Ну это знак” - подумал я и решил использовать его.

Результат понравился и я сел за код) Точнее сел не я а GPT4 с плагинами, т.к. питоном я не владею и знаю только основы.

Все шло как по маслу и у меня получилось написать код который генерировал картинку и конвертировал в svg. Осталось сделать Телеграм-бота. Тот ко мне подключился знакомый. Он отрефакторил код и вместе мы в тот же день запилили бота.

На следующий день обнаружилась масса багов и подводных камней.

  • Внешняя ссылка для stable diffusion хостится на huggingface. 72 часа бесплатно, за остальное - плати
  • Сервер с видеокартой стоит порядка 20000 -25000 в месяц
  • Были баги и ошибки
  • Вечером 3го дня я увидел сервис в котором моя фича уже сделана

Заключение

Проблемы - решаемы, но увидев крупного конкурента у меня опустились руки.

Я решил поделиться этой статьей, чтобы показать, что даже в одиночку - реально сделать что-то необычное. Ну и позвать вас к себе в телеграм про UX/UI.

Нейросети меняют мир и это только начало.

0
2 комментария
Невероятный Блондин

5+ за старания🤛🏼

Ответить
Развернуть ветку
Леонид Рябухин

Имба чел, уважуха

Ответить
Развернуть ветку
-1 комментариев
Раскрывать всегда