Flux теперь интегрирован в Grok-2 от xAI

Flux теперь интегрирован в Grok-2 от xAI

Это официально. Новейшая и самая мощная ИИ-модель для генерации изображений Flux от Blackforest Labs была интегрирована в Grok Илона Маска. Интеграция является частью недавно запущенных моделей Grok-2 и Grok-2-mini, которые обладают самыми современными возможностями в области общения, программирования и мышления.

🔥Телеграм-бот SYNTX предоставляет доступ к более чем 30 ИИ-инструментам. Без ВПН, оплата любой картой, запросы на любом языке, пробуйте бесплатно! Под капотом - GPT4o/Gemini/Claude, MidJourney, DALL-E 3 и Ideogram, LUMA, Runway, Kling, Suno, Редактор с 12 различными ИИ-инструментами для ретуши фото.

☝️Это только часть функций, доступных в SYNTX!

Flux теперь интегрирован в Grok-2 от xAI

Что такое Flux?

Flux.1 - это новое современное семейство моделей преобразования текста в изображение (SOTA), устанавливающее новый стандарт детализации изображения, точности следования промпту, разнообразия стилей и сложности сцен при генерации текста в изображение.

Еще больше полезностей - в телеграм-канале про нейросети и канале про генерацию изображений Миджорниум.

Оно представлено в трех вариантах:

  • Flux.1 Pro: Эта модель обеспечивает новый уровень производительности при создании изображений, превосходному следованию промпту, визуальному качеству, детализации изображений и разнообразию результатов.
  • Flux.1 Dev: Модель Flux.1 Dev, созданная на основе Flux.1 Pro и предназначенная для некоммерческого использования, отличается сопоставимым качеством и точностью выполнения промптов, но при этом более эффективна, чем типичные модели такого размера.
  • Flux.1 Schnell: Самая быстрая модель в наборе, предназначенная для локальной разработки и личного использования, доступна под лицензией Apache 2.0.
Flux теперь интегрирован в Grok-2 от xAI

Во всех моделях Flux.1 используется сочетание мультимодальных и параллельных блоков трансформации диффузии с 12 миллиардами параметров. Эти модели превосходят предыдущие модели диффузии за счет использования согласования потоков - простого метода обучения генеративных моделей, включающих диффузию.

Кроме того, модели достигают лучшей производительности и аппаратной эффективности за счет использования поворотных позиционных вкраплений и параллельных слоев внимания.

Хотя прямо не указано, какая именно модель изображений Flux используется в Grok AI, качество изображений позволяет предположить, что это, скорее всего, модель Dev или Pro. Уровень детализации и насыщенность изображения поразительны, что заставляет меня предположить, что используется модель Pro.

Как генерировать изображения в Grok?

Генерировать изображения в Grok очень просто, но для этого вам нужно быть пользователем Premium или Premium+ на платформе X. Как только вы войдете в систему, просто перейдите на левую боковую панель и нажмите на кнопку Grok. Там вы можете описать изображение, которое хотите создать.

Вот пример:

Make an image of an attractive influencer presenting at a TED Talk

Flux теперь интегрирован в Grok-2 от xAI

Чтобы дать вам представление о том, насколько Grok превосходит Midjourney, вот сравнение изображений, созданных с помощью одного и того же промпта:

Grok-2-mini
Grok-2-mini
Midjourney V6.1
Midjourney V6.1

Какое из них вам больше нравится?
Лично я нахожу изображение, созданное Grok, более привлекательным. Хотя в изображении Midjourney больше текстур и более мелких деталей, в нем также присутствует эффект «жуткой долины», из-за которого оно кажется немного искусственным. С другой стороны, изображение Grok выглядит более естественно, с более мягкими тонами и меньшей насыщенностью, но с количеством пальцев есть проблемы.
Также я ввел тот же промпт в ChatGPT (с помощью Dall-E 3), и вот что я получил:

Flux теперь интегрирован в Grok-2 от xAI

Результат получился достойным, но он не дотягивает до качества, которое можно получить в Midjourney или Grok.

Вот еще один пример:

Polaroid photo with VSCO filter, 1990, gorgeous woman, night, flash photo, blonde, cute, young face, beautiful shadows, tropical plants, urban clothing, inside an apartment, DSLR, holding a sign written in ballpoint pen on a notebook saying “This photo was created for Generative AI Publication using Grok 2 Mini.

Flux теперь интегрирован в Grok-2 от xAI

Это невероятно впечатляет. Изображение не только выглядит фотореалистично, но и передает особый стиль и атмосферу, описанные в промпте. Рендеринг текста также очень хорош, даже несмотря на небольшое упущение («was» отсутствует в тексте).

Модель изображений без ограничений

Функция генерации изображений в Grok не имеет ограничений, что позволяет пользователям создавать практически любые типы изображений. Посмотрите на изображения Дональда Трампа и Камалы Харрис, созданные некоторыми пользователями X:

Flux теперь интегрирован в Grok-2 от xAI
Flux теперь интегрирован в Grok-2 от xAI

Некоторые пользователи отмечают, что, хотя Grok утверждает, что у него есть ограничения - например, не допускать порнографического или чрезмерно жестокого контента, - эти правила, похоже, соблюдаются не всегда. Такая снисходительность резко контрастирует с другими крупными ИИ-генераторами изображений, которые часто отклоняют промпты с участием реальных людей или автоматически добавляют к изображениям идентифицирующие водяные знаки.

Благодаря отсутствию ограничений на типы генерируемых изображений Grok может быть легко использован в качестве инструмента для создания дезинформации на X и других платформах.

Сколько он стоит?

Доступ к функции генерации изображений Grok имеют только премиум-пользователи, а абонентская плата составляет 8 долларов в месяц.

Эта цена относительно приемлемая, особенно если сравнить ее с другими ИИ-инструментами. Например, модель GPT-4 от ChatGPT стоит 20 долларов в месяц, а Midjourney - 10 долларов в месяц.

Flux теперь интегрирован в Grok-2 от xAI

Это, конечно, не означает, что вы сразу же получаете выгоду за свои деньги. GPT-4o от ChatGPT, похоже, значительно опережает Grok по качеству языковой модели, а Midjourney предоставляет более широкий набор опций настройки изображений.

Сравните то, что вы получаете, с тем, чем вы можете пожертвовать в плане функциональности и универсальности.

Доступ к API

Для разработчиков есть еще много интересного. X.ai планирует сделать обе модели Grok-2 и Grok-2-mini доступными через корпоративный API в конце этого месяца.

В конце этого месяца мы также выпустим Grok-2 и Grok-2 mini для разработчиков на нашей новой платформе корпоративного API. Наша новая API-платформа построена на новом технологическом стеке, который позволяет развертывать мультирегиональные системы обработки данных для доступа к ним с низкой задержкой по всему миру.

Grok существует уже некоторое время, но до сих пор он не успевал за конкурентами вроде ChatGPT и Claude AI. Интеграция Flux оживила платформу, и я снова нахожу этого чатбота интересным.

Поскольку Flux вытеснил Stable Diffusion, будет интересно посмотреть, как отреагирует Stability AI. Выпустит ли он в ближайшее время улучшенную модель SD3? Давай же, Stability AI, не пропадай.

Более того, Blackforest Labs на своем сайте намекнула на дальнейшие разработки, включая новую модель преобразования текста в видео. Если она тоже будет интегрирована в Grok, то может представлять серьезную угрозу для таких гигантов, как OpenAI и Anthropic.

🔥Телеграм-бот SYNTX предоставляет доступ к более чем 30 ИИ-инструментам. Без ВПН, оплата любой картой, запросы на любом языке, пробуйте бесплатно! Под капотом - GPT4o/Gemini/Claude, MidJourney, DALL-E 3 и Ideogram, LUMA, Runway, Kling, Suno, Редактор с 12 различными ИИ-инструментами для ретуши фото.

☝️Это только часть функций, доступных в SYNTX!

Источник статьи на английском - здесь.

3131
3 комментария

Grok-2-mini определённо выглядит поэстетичнее. Если уже сейчас можно такие изображения генерировать, что же будет лет через 5? Хехе

1

"Лично я нахожу изображение, созданное Grok, более привлекательным." - https://skrinshoter.ru/sRF8IpXiyqa?a - хехехе.

А вообще я мягко говоря поражен уровнем, который уже показывают обе нейросети.