Нейросетевой "художник" в Telegram: создаем картинки с помощью Fusion Brain и Gemini

Сегодня расскажу вам про интересного Telegram-бота, который умеет создавать картинки по вашим запросам или на основе ваших фотографий. В этом ему помогают сразу две крутые нейросети: российская Fusion Brain и мощная модель от Google – Gemini.

Идея простая: вы пишете боту, что хотите увидеть, или присылаете фото, а он выдает вам новую картинку. Но за этой простотой скрывается интересная техническая реализация, о которой я и хочу рассказать.

Как это работает?

Вот пример простого запроса:

Оригинал: «Молодая красивая девушка из Ростова Великого» Улучшено/Промпт: «Молодая красивая девушка с нежной улыбкой, стоящая на фоне белокаменных стен Ростовского Кремля в золотом свете заходящего солнца. Длинные русые волосы слегка развеваются на ветру.
Оригинал: «Молодая красивая девушка из Ростова Великого» Улучшено/Промпт: «Молодая красивая девушка с нежной улыбкой, стоящая на фоне белокаменных стен Ростовского Кремля в золотом свете заходящего солнца. Длинные русые волосы слегка развеваются на ветру.

Бот использует две основные нейросети:

* Fusion Brain: Эта нейросеть непосредственно рисует картинки по текстовым описаниям.

* Gemini: Эта нейросеть помогает боту лучше понимать ваши запросы. Если вы напишете что-то короткое, Gemini может сделать запрос более подробным, чтобы Fusion Brain нарисовал именно то, что вы задумали. А если вы пришлете фотографию, Gemini опишет ее, и это описание станет заданием для Fusion Brain, чтобы создать похожую картинку.

Бот умеет использовать сразу много API-ключей Fusion Brain (до десяти и даже больше!), что делает его работу более стабильной и позволяет обрабатывать больше запросов без проблем.

Что умеет этот бот?

* Рисовать по словам: Просто напишите, какую картинку вы хотите, и бот постарается ее создать.

* Улучшать ваши идеи: Если ваш запрос не очень подробный, бот может сделать его лучше с помощью Gemini.

* Создавать похожее на фото: Пришлите боту фотографию, и он попытается сгенерировать что-то похожее.

Почему это интересно?

Сочетание Fusion Brain и Gemini позволяет получать действительно интересные результаты. Gemini помогает лучше понять запрос, а Fusion Brain отлично справляется с самой генерацией. Использование нескольких ключей Fusion Brain делает бота более надежным.

Немного техники

Бот написан на языке Python и использует специальные библиотеки для работы с Telegram (python-telegram-bot) и нейросетями (google-generativeai, requests). Чтобы бот работал быстро, используется технология асинхронного программирования (asyncio).

Как попробовать?

Если вам интересно, как это работает, вы можете посмотреть код на GitHub: https://github.com/ByteBudda/fusionBrainTGBot

Возможно, вам даже захочется внести свой вклад в развитие проекта!

В заключение

Этот бот – пример того, как можно объединить разные технологии искусственного интеллекта для создания чего-то нового и интересного. Надеюсь, вам было интересно узнать о нем!

Теги: python, telegram, бот, нейросети, генерация изображений, fusion brain, gemini

Начать дискуссию