AuraFlow - новейшая модель для генерации изображений с открытым исходным кодом

AuraFlow - новейшая модель для генерации изображений с открытым исходным кодом

AuraFlow — крупнейшая и полностью открытая модель генерации изображений по текстовому описанию, основанная на технологии потоковых моделей (flow-based models).Модель достигает передовых результатов по метрике GenEval и представляет собой значительный шаг вперед в области открытых моделей ИИ для генерации изображений.Эта модель поддерживается командой FAL. Демо доступно на платформе HuggingFace здесь.

Вы также можете построить несколько крутых рабочих процессов Comfy, загрузив модель весов со страницы HuggingFace.

Ещё мы сделали для вас простую удобную портативную версию с установкой в один клик, если вы хотите локально и без костылей насладиться AuraFlow.

Перед установкой отключите антивирус, он ругается на самораспаковывающийся архив. Если переживаете, то скачивайте ZIP-архив, который нужно просто разархивировать в любое удобное место.

AuraFlow - новейшая модель для генерации изображений с открытым исходным кодом
AuraFlow - новейшая модель для генерации изображений с открытым исходным кодом

"ИИ с открытым исходным кодом находится под угрозой. Когда интерес сообщества к моделям ИИ резко возрос за последний год, мы заметили, что разработка новых основополагающих моделей с открытым исходным кодом прекратилась. Некоторые даже смело заявляли, что ИИ с открытым исходным кодом мертв. Не так быстро!" - пишут разработчики.

Подробнее о технических деталях вы можете почитать в блоге, в этой же статье мы посмотрим на возможности и функции нейросети.

AuraFlow - универсальная модель, которая отлично справляется с позиционированием, текстом и различными стилями. Среди основных её возможностей:

  • Высококачественная генерация изображений по текстовому описанию
  • Улучшенное следование промпту и пониманию инструкций
  • Возможность создания сложных и детализированных сцен
  • Открытый исходный код, позволяющий дальнейшие исследования и улучшения
  • Разрешение генерации: 1024x1024

Среди настраиваемых параметров доступны следующие:

AuraFlow - новейшая модель для генерации изображений с открытым исходным кодом

Окно "Prompt" - Окно для ввода текстового запроса

Окно "Negative prompt" - Окно для ввода негативного запроса (то, чего не хотим видеть на изображении)

Seed - Начальное значение шума. Randomize seed - значение шума выбирается случайным образом.

Width и Height - Ширина и Высота изображения.

Guidance Scale - Параметр определяет то, насколько сильно нейросеть будет следовать текстовому запросу. Рекомендую оставлять значение по умолчанию или в пределах 3.5 - 5

Number of inference steps - Количество шагов очистки от первоначального шума.

Давайте посмотрим на её возможности наглядно.

Примеры генераций AuraFlow

Начнём с простых запросов:

Prompt: A photo of a grey british shorthair cat

AuraFlow - новейшая модель для генерации изображений с открытым исходным кодом
AuraFlow - новейшая модель для генерации изображений с открытым исходным кодом

Prompt: an orange cat on a sunny thai beach

AuraFlow - новейшая модель для генерации изображений с открытым исходным кодом

Сгенерируем фото девушки с лавандовыми волосами:

Prompt: Photo of a young beautiful lady with long lavender hair

AuraFlow - новейшая модель для генерации изображений с открытым исходным кодом
AuraFlow - новейшая модель для генерации изображений с открытым исходным кодом

На онлайн-демо есть ограничение по количеству генераций. Чтобы обойти это, достаточно включить VPN.

Посмотрим, как модель работает с текстом и персонажами:

Prompt: astronaut in the ocean, detailed, rgb, 8k,

AuraFlow - новейшая модель для генерации изображений с открытым исходным кодом

Добавим ему табличку в руки:

Prompt: astronaut in the ocean holding a sign with "FOOOCUS" text, detailed, rgb, 8k,

AuraFlow - новейшая модель для генерации изображений с открытым исходным кодом

Prompt: beautiful anime girl with black hair buns holding a sign with the text "WONDER", smiling, closed eyes,

AuraFlow - новейшая модель для генерации изображений с открытым исходным кодом

Prompt: sonic holding a big sign with text "HELLO"

AuraFlow - новейшая модель для генерации изображений с открытым исходным кодом

Попробуем отобразить что-нибудь необычное из еды, и начнём усложнять промпты:

Prompt: (medium full shot) of a cake made of colorful skulls, a sophisticated private club, offering elegant decor, refined furnishings, subdued lighting, and a classy ambiance ,Masterpiece,best quality, photo, realistic, very aesthetic

AuraFlow - новейшая модель для генерации изображений с открытым исходным кодом

Prompt: bull cow (made of wagyu), wearing white chef hat, wearing white chef uniform, arms crossed, cinematic movie poster, dark black background, professional photography, dramatic shadows, aura, (fine wisps of smoke:0.8), detailed,

AuraFlow - новейшая модель для генерации изображений с открытым исходным кодом

Prompt: hyperrealistic majestic giraffe-like creature with a unique and vibrant appearance. The animal has a stunning coat of white fur adorned with bright orange spots, giving it a striking and exotic look. Its eyes are a captivating fiery orange, radiating an intense and mesmerizing gaze. The creature is portrayed lying down with its front paws crossed, emanating a sense of calm and poise. The fur texture is rendered in intricate detail, creating a lifelike and three-dimensional effect. The background is dark, which contrasts beautifully with the bright and vivid colors of the creature, emphasizing its regal and majestic presence

AuraFlow - новейшая модель для генерации изображений с открытым исходным кодом

Попробуем сгенерировать что-то из предоставленных примеров:

Prompt: An abstract and vibrant portrait of a woman's face, where her eyes, nose, and lips are depicted with a swirl of colors, blending seamlessly within the silhouette. The intricate details are accentuated by the landscape of a night forest filled with fireflies, creating an ethereal and dreamlike atmosphere. The background is a mesmerizing mix of pink, purples, and touches of red, green, and yellow, evoking a dynamic and chaotic environment. The artwork exudes intense emotion and passion, drawing the viewer into its captivating world of dark fantasy and artistic expression., illustration, vibrant, painting, dark fantasy, wildlife photography, graffiti, conceptual art

AuraFlow - новейшая модель для генерации изображений с открытым исходным кодом

AuraFlow демонстрирует потрясающие возможности в области генерации изображений, и её определенно стоит попробовать!

Подписывайтесь на 👾Нейро-Софт, канал с портативными версиями ваших любимых нейросетей!

22
1 комментарий

столько уже создано нейронок для генерации изображений, но все такие лично для меня топовым остается midjourney