Black Forest Labs выпустил FLUX 2 с открытым исходным кодом

Он поддерживает генерацию текста в изображение, ссылки на несколько изображений и редактирование изображений, а также значительно улучшает возможности генерации текста и соблюдения словесных подсказок.

Конкретные возможности модели включают в себя:

  • Для оптимальной согласованности просматривайте до 10 изображений одновременно.
  • Более четкие детали, более четкие текстуры и более стабильное освещение.
  • Отображение текста в сложной типографике, инфографике, эмодзи и пользовательских интерфейсах
  • Улучшение производительности при выполнении сложных структурированных инструкций
  • Значительно больше основано на реальных знаниях, освещении и пространственной логике
  • Поддерживает редактирование изображений с разрешением до 4 МП

На этот раз было выпущено четыре версии модели:

— FLUX.2 [pro]: Современное качество изображения, сопоставимое с лучшими закрытыми моделями, предлагающее схожее с другими моделями соответствие сигналам и визуальный реализм, при этом генерируя изображения быстрее и с меньшими затратами.

  • FLUX.2 [flex]: позволяет разработчикам управлять параметрами модели, такими как количество шагов и сила наведения, предоставляя им полный контроль над качеством, соответствием сигналам и скоростью. Эта модель превосходно отображает текст и детали.
  • FLUX.2 [dev]: 32-байтовая модель с открытыми весами, созданная на основе базовой модели FLUX.2. На данный момент это самая мощная модель с открытым исходным кодом для генерации и редактирования изображений, объединяющая синтез текста в изображение и многоканальное редактирование изображений в одной модели.
  • FLUX.2 [klein] (скоро): модель с открытым исходным кодом, лицензированная Apache 2.0, представляющая собой упрощённую версию базовой модели FLUX.2. Она мощнее и проще в использовании для разработчиков, чем аналогичные модели того же размера, обученные с нуля.
  • FLUX.2 - VAE: новый вариационный автоэнкодер для скрытых представлений, обеспечивающий оптимизированный компромисс между обучаемостью, качеством и степенью сжатия.

Тестить тут и тут

Начать дискуссию