Как FLUX.1 разрушает миллиардную индустрию ИИ-генераторов изображений

Как FLUX.1 разрушает миллиардную индустрию ИИ-генераторов изображений

Теперь вы можете генерировать гиперреалистичные ИИ-изображения в промышленных масштабах бесплатно.

За последние несколько лет индустрия генераторов изображений на базе ИИ выросла в геометрической прогрессии.

🔥Телеграм-бот SYNTX предоставляет доступ к более чем 30 ИИ-инструментам. Без ВПН, оплата любой картой, запросы на любом языке, пробуйте бесплатно! Под капотом - GPT4o/Gemini/Claude, MidJourney, DALL-E 3 и Ideogram, LUMA, Runway, Kling, Suno, Синхронизатор губ, Редактор с 12 различными ИИ-инструментами для ретуши фото.

☝Это только часть функций, доступных в SYNTX!

Когда компания OpenAI, создавшая ChatGPT, выпустила свою модель генерации изображений DALL-E в 2021 году, это вызвало огромный интерес, поскольку превращение текста в изображение было неслыханным явлением. Однако по мере того, как выходили новые модели от OpenAI, мир осознал, как это может разрушить несколько отраслей.

Еще больше полезностей - в телеграм-канале про нейросети и канале про генерацию изображений Миджорниум.

Рынок генераторов изображений с искусственным интеллектом на миллиард долларов

Сегодня, согласно исследованиям, мировой рынок ИИ-генераторов изображений принес доход в размере 349,6 млн долларов в 2023 году и, как ожидается, достигнет 1,081 млрд долларов к 2030 году.

Многие компании используют эти генераторы изображений, как вы уже догадались, для создания рекламы, так как это экономит их расходы.

Возможно, вы видели популярную рекламу Coca-Cola, а может быть, сталкивались с одним из многочисленных AI-инфлюенсеров, которые рекламируют бренды. Варианты использования бесконечны.

Гигант электронной коммерции Amazon также использует реалистичные модели, созданные искусственным интеллектом, для создания рекламы.

Как FLUX.1 разрушает миллиардную индустрию ИИ-генераторов изображений

На этом прибыльном рынке ИИ-генераторов изображений работают десятки компаний. Среди них - Midjourney, Adobe, OpenAI, Stability AI, Google, Microsoft, Leonardo AI, Runway AI, Inc. и многие другие.

До июля 2024 года лидерами рынка моделей генерации ИИ были Midjourney V6.1, Dalle-E 3 от OpenAI и Stability AI Stable Diffusion (с открытым исходным кодом).

Однако 1 августа стартап под названием Black Forest Labs выпустил версию FLUX.1, которая шокировала некоторых экспертов отрасли и заставила занервничать некоторые ведущие компании, разрабатывающие ИИ-генераторы изображений.

Почему? Потому что модели FLUX.1 умеют генерировать одни из самых реалистичных изображений, которые вы когда-либо встречали, и, что самое приятное, они с открытым исходным кодом.

Новичок в сфере ИИ - Flux.1

FLUX.1 - это набор моделей, обеспечивающих новый уровень детализации, соблюдения промптов, разнообразия стилей и сложности сцен для преобразования текста в изображение.

Стартап создан командой, в которую входят первоначальные разработчики технологии, лежащей в основе Stable Diffusion, и изобретатели скрытой диффузии. Компания располагается в Германии и привлекла 31 миллион долларов в качестве начального финансирования.

FLUX.1 имеет три модели, которые представлены ниже:

Flux.1 Pro

Это флагманская модель, которая обладает исключительными возможностями по обработке промптов, визуальному качеству, детализации изображений и разнообразию выходных данных.

В ней используются передовые ИИ-технологии, включая диффузионные модели и трансформаторные архитектуры, что позволяет ей генерировать высококачественные изображения, которые соответствуют сложным текстовым промптам.

Эта модель доступна в основном через API и подходит для коммерческого использования, что делает ее идеальной для профессиональных приложений.

FLUX.1 Dev

Это усовершенствованная версия FLUX.1 Pro, разработанная специально для некоммерческого использования.

Она обеспечивает такое же качество и соблюдение промптам, как и FLUX.1 Pro, но при этом более эффективна, чем стандартные модели того же размера.

Эта модель имеет открытый вес, что позволяет пользователям получать доступ и использовать ее в личных и исследовательских целях без коммерческих ограничений.

FLUX.1 Schnell

Это самая быстрая модель из набора моделей FLUX, оптимизированная для локальной разработки и индивидуального использования.

Она находится в открытом доступе под лицензией Apache 2.0, что делает ее доступной для пользователей, которые хотят поэкспериментировать с генерацией ИИ изображений без ограничений, связанных с коммерческим лицензированием.

В этой модели приоритет отдается скорости и эффективности, что делает ее подходящей для быстрого создания прототипов и личных проектов.

Как получить доступ к моделям FLUX.1

Лучший способ получить доступ к модели FLUX.1 - через Hugging Face, известную ИИ-компанию и платформу сообщества, ориентированную на обработку естественного языка (NLP) и машинное обучение.

Эта платформа стала центральным хабом в ИИ-сообществе. Чтобы использовать нужные модели, зайдите в пространство и выполните поиск.

Для FLUX.1 DEV вы можете напрямую перейти в пространство FLUX.1 Dev, а затем ввести промпт для генерации изображения.

Как FLUX.1 разрушает миллиардную индустрию ИИ-генераторов изображений

После ввода нужного промпта нужно нажать «Run», и изображение будет сгенерировано.

Как FLUX.1 разрушает миллиардную индустрию ИИ-генераторов изображений

Промпт: Halloween night scene with a carved, aged pumpkin glowing from within. It sits on a dry tree stump in an abandoned rural landscape, with an old, blurry house in the background surrounded by dry overgrowth. The sky is cloudy and gray, creating a cold and eerie atmosphere.

Аналогичным образом можно получить доступ к пространству FLUX.1 Schnell и генерировать изображения. Однако официальных пространств для доступа к FLUX.1 Pro через Hugging Face не существует.

Одна из проблем использования Hugging Face заключается в том, что у него есть ограничения на количество использований. Это происходит потому, что он позволяет всем желающим использовать модели, размещенные на хостинге, что приводит к увеличению времени ожидания.

Black Forest Labs заключила партнерство с несколькими партнерами, такими как fal.ai, replicate, Freepik и многими подобными платформами. Есть бесплатные и платные тарифные планы, и вы можете выбрать их в зависимости от ваших потребностей.

Некоторые изображения, сгенерированные с помощью моделей FLUX.1

Изображения, созданные с помощью FLUX.1, мягко говоря, впечатляют, и это еще мягко сказано.

У него большое и активное сообщество разработчиков и пользователей, которые помогают ему становиться все лучше. Его открытый исходный код позволяет пользователям настраивать инструмент и добавлять новые функции.

Сейчас я покажу на нескольких примерах, насколько великолепны получаемые изображения.

Девушка держит плакат с текстом

Как FLUX.1 разрушает миллиардную индустрию ИИ-генераторов изображений

Промпт: A girl of Indian descent, engaged with a futuristic machine, inside the Nostromo spaceship. Wide shot revealing distinct machines with intricate designs inspired by H. R. Giger and Escher, presenting elaborate body extensions. The scene illustrates a holiday dad core aesthetic, merging absurdist installations reminiscent of Stanley Kubrick’s films, while she holds a white board displaying “AI is cool” with great prominence.

В принципе, вы можете сгенерировать любой кадр из фильма с любым сюжетом, где персонаж может держать плакат с вашим именем или любым желаемым текстом на нем.

У некоторых генераторов еизображений есть проблема рендеринга текста при генерации изображения. С моделями Flux.1 эта проблема вообще отпадает. Вы можете просто ввести промпт для сюжета и добавить нужный текст в любом виде, который вам нужен на изображении.

Портрет испанской бабушки

FLUX.1 Pro
FLUX.1 Pro
Midjourney v6.1 
Midjourney v6.1 

Промпт: Old family Spanish portrait, candid image, vintage effect, short very old Spanish woman, typical Spanish grandma clothing, in her house, in the middle of a Spanish Mediterranean countryside documental photography, real person, intricate natural lights reflecting in her

Изображения, создаваемые FLUX.1 Pro и Midjourney v6.1, чрезвычайно реалистичны. Обе эти модели по качеству превосходятконкурентов, а в некоторых случаях изображения FLUX.1 Pro более детальны и реалистичны и часто даже лучше изображений, сгенерированных в Midjourney.

Киборги занимают рабочие места людей

FLUX.1 Pro  
FLUX.1 Pro  
Midjourney v6.1
Midjourney v6.1

Промпт: Cyborgs taking the human jobs in the dystopian future.

Лично мне больше понравился дизайн киборга в Midjourney, но следование промпту более точно у FLUX.1 Pro. Midjourney славится точностью создания изображений, но FLUX.1 Pro работает еще лучше.

Селфи женщины на вечеринке

Leonardo’s Lightning XL  
Leonardo’s Lightning XL  
Midjourney v6.1  
Midjourney v6.1  
FLUX.1 Dev
FLUX.1 Dev

Промпт: Selfie, self-portrait of a woman at the party, candid, ultra-wide-angle, distinct facial features, neon lights, red, everyday outfit, 4k

Изображения, созданные всеми моделями, хороши, но давайте посмотрим, как они смотрятся в сравнении друг с другом. Lightning XL - это доработанная модель Leonardo AI, и она проделала довольно приличную работу, за исключением того, что на лице не видны красные неоновые огни.

Midjourney проделал довольно приличную работу, как и модель FLUX.1 Dev, которая не является лучшей моделью.

Иллюстрации с названиями и темами

FLUX.1 Pro
FLUX.1 Pro
FLUX.1 Pro
FLUX.1 Pro

Промпт на тему ужасов (первое изображение): Illustration “Habr” huge letters in the middle of the scene made of houses, a manor, horror with a guy wearing a hat on a horse.

Промпт на тему освоения космоса (второе изображение): Illustration “Habr” in huge letters in the middle of the scene made of space, a spaceship landed on Mars, with a guy wearing the spacesuit walking.

Подумайте о том, какие возможности открываются перед вами при создании контента для социальных сетей или продвижении товаров с помощью подобных изображений. Просто меняйте текст и тему, и с каждой новой попыткой вы будете генерировать очень привлекательные иллюстрации.

Простое отображение сообщения из вашей комнаты

Как FLUX.1 разрушает миллиардную индустрию ИИ-генераторов изображений

Промпт: Authentic share, slightly blurry, amateur quality phone photo, everyday realism, smartphone quality, natural light: Old man taking selfie in living room. Casually dressed, minimal or no makeup. Holding paper with handwritten “I am not real” clearly visible. Soft natural light from nearby window. Couch and home decor visible in background.

Это был один из способов проверки подлинности человека по рукописному тексту, который часто используется на некоторых онлайн-сайтах, особенно в банках. Используя модели Flux.1, вы можете легко повторить этот способ. Просто измените тему, текст и сюжет.

Заглавное изображение статьи также было создано с помощью этого промпта с некоторыми изменениями.

Каждый день генераторы изображений совершенствуются, становятся все лучше и создают изображения, которые крайне сложно распознать. Компании используют такие инструменты в своих целях. Агентства уже использовали эту технологию для создания ИИ-блогеров, которые сейчас зарабатывают миллионы.

Варианты использования бесконечны, и в индустрии генераторов изображений наблюдается только тенденция к росту. Станет ли она миллиардной индустрией к 2030 году? Время покажет.

🔥Телеграм-бот SYNTX предоставляет доступ к более чем 30 ИИ-инструментам. Без ВПН, оплата любой картой, запросы на любом языке, пробуйте бесплатно! Под капотом - GPT4o/Gemini/Claude, MidJourney, DALL-E 3 и Ideogram, LUMA, Runway, Kling, Suno, Синхронизатор губ, Редактор с 12 различными ИИ-инструментами для ретуши фото.

☝Это только часть функций, доступных в SYNTX!

Источник статьи на английском - здесь

1919
2 комментария

Спасибо за статью и прекрасные промпты !

Ответить

все они проигрывают ideogram

Ответить