FLUX — замена Midjourney и DALL-E: Идеальный инструмент для дизайнеров и SMM, который вы искали!
Если в двух словах:
- Это первая модель которая умеет генерировать надписи на ��артинках;
- Качество на уровне Midjourney и реалистичные изображения;— Хорошо понимает смысл и генерит близко к промту;
- Бесплатная опенсорс модель.
В начале августа 2024 года бывшие разработчики Stability AI объявили о создании компании Black Forest Labs. Их цель — разрабатывать передовые генеративные модели глубокого обучения для создания изображений и видео, раздвигая границы креативности, эффективности и разнообразия.
Вскоре после анонса команда выпустила свою первую модель для генерации изображений по текстовому описанию — FLUX. Обученная на 12 миллиардах параметров и основанная на новой архитектуре трансформеров, FLUX поразила сообщество фантастическим качеством изображений и возможностями контроля.
FLUX 1 выпущена в трех вариантах:
FLUX 1 [Pro] — доступна только через API. Можно использовать API Black Forest Labs или их коммерческих партнеров. Веса модели нельзя скачать, да и системные требования слишком высоки для обычных компьютеров.
FLUX 1 [Schnell] («быстрый» по-немецки) — аналог SDXL Lightning. Генерирует изображения быстро, но с небольшой потерей качества.
FLUX 1 [Dev] — открытая модель для некоммерческого использования. Это упрощенная версия Pro, которая обеспечивает похожее качество, но более эффективна и может работать на обычных компьютерах.
Как работает FLUX?
Одним словом — феноменально. Многие в сообществе называют ее «моделью, которую мы так долго ждали», особенно после разочарования в SD3. Качество изображений, соответствие запросу и общее впечатление от результатов исключительны. FLUX устанавливает новый стандарт в мире генерации изображений по текстовому описанию.
Где попробовать:
Для локального разверывания GitHub: https://github.com/black-forest-labs/flux
На серверной платформе Huggingface: https://huggingface.co/black-forest-labs/FLUX.1-schnell
В Телеграм боте: @Fluxora_bot
Преимущества FLUX перед другими моделями
FLUX показывает ряд преимуществ по сравнению с другими моделями, например, Stable Diffusion 3 (SD3):
Качество изображений: FLUX генерирует более детализированные и качественные картинки.
Сложные сцены: Модель лучше справляется с генерацией сложных сцен с несколькими объектами.
Разнообразие: FLUX создает более разнообразные изображения, особенно когда дело касается людей разных национальностей.
Текст на изображениях: Модель умеет генерировать читаемый текст внутри картинок.
Анатомия и руки: FLUX создает более реалистичные изображения людей, особенно хорошо справляясь с рисованием рук.
Точность выполнения запросов: Модель лучше понимает сложные описания и точнее воплощает их в изображениях.
Особенности FLUX 1
Продвинутая гибридная архитектура с 12 миллиардами параметров
Открытый исходный код для некоммерческого использования
Несколько вариантов модели для разных нужд (Pro, Dev, Schnell)
Высокое качество текста на изображениях
Техника "flow matching" для более быстрой и контролируемой генерации
Отзывы сообщества
Пользователи в целом положительно оценивают FLUX , отмечая высокое качество изображений, точность выполнения запросов и разнообразие результатов. Многие сравнивают его с коммерческими сервисами вроде Midjourney.
Среди минусов отмечают высокие требования к оборудованию (рекомендуется 24 ГБ видеопамяти) и сложность в освоении интерфейса ComfyUI для новичков.
Несмотря на эти сложности, FLUX считается значимым игроком на рынке генерации изображений с помощью ИИ благодаря качеству результатов и открытости для сообщества разработчиков.
Как FLUX генерирует картинки
FLUX использует передовую архитектуру гибридных блоков диффузии, сочетая мультимодальные и параллельные трансформеры с масштабом до 12 миллиардов параметров. Это позволяет модели создавать изображения с высокой степенью детализации и реализма. Также FLUX применяет уникальный метод «соответствия потоков», который обеспечивает более быстрый и точный перевод шума в реалистичные изображения, улучшая контроль над процессом генерации.
Особенности промптинга
Модель выделяется своей способностью точно интерпретировать сложные описания. Модель лучше справляется с точным выполнением сложных запросов и требует меньше коррекций или доработок. Особенно это заметно при создании сложных сцен с несколькими объектами, где она обходит своих конкурентов, таких как Stable Diffusion 3 (SD3).
Про стили
FLUX обладает широким диапазоном стилизации — от фотореалистичных изображений до более стилизованных или сюрреалистических. Пользователи отмечают, что модель напоминает результаты Midjourney, но при этом остается открытой и доступной для некоммерческого использования.
Что в итоге
FLUX — отличный аналог других нейросетей для генерации изображений. В отличие от Stable Diffusion, она обеспечивает более качественную детализацию, особенно при сложных запросах, и при этом сохраняет высокую производительность.
Модель не требует глубоких навыков и легко понимает сложные промпты, генерируя изображения с точной анатомией, включая руки, что часто является слабым местом других ИИ.
Модель отлично работает с текстом, создавая разборчивые надписи внутри изображений, и предлагает разнообразие стилей, включая фотореалистичные и стилизованные работы.
Это гибкий инструмент с открытым исходным кодом, доступный для некоммерческого использования и создания разнообразных визуальных проектов.
Протестировать FLUX
Попробовать и посмотреть как работает FLUX можно телеграм боте — @Fluxora_bot
Это мой личный проект, бесплатно по 20 генераций в день. Бот понимает промты на русском и делает очень качественные изображение, попробуйте!
@Fluxora_bot | Генерация картинок для дизайна и smm →