Так ли хорош ИИ-генератор изображений Grok 3?
Вчера Илон Маск и компания xAI объявили, что Grok 3 будет бесплатным для всех в течение ограниченного времени. Это означает, что вы можете использовать Grok 3 для обычных чатов, глубокого исследования темы и даже для создания изображений.
В этом посте я сосредоточусь на возможностях Grok 3 по созданию изображений. Я сравню, насколько он стал лучше по сравнению с Grok 2, и посмотрю, как он выглядит в сравнении с другими ИИ-генераторами изображений, такими как ChatGPT и Flux от Black Forest Labs.
Давайте начнем.
Телеграм-бот SYNTX предоставляет доступ к более чем 30 ИИ-инструментам. Без ВПН, оплата любой картой, запросы на любом языке, пробуйте бесплатно! В боте есть GPTo1, Gemini, Claude, Grok, Llama, Perplexity, DeepSeek, MidJourney, DALL-E 3, Flux, Ideogram и Recraft, LUMA, Runway, Kling, Sora, Pika, Hailuo AI (Minimax), Suno, синхронизатор губ, Редактор с 12 различными ИИ-инструментами для ретуши фото. ☝Это только часть функций, доступных в SYNTX!
Что такое Grok 3?
Grok 3 - это мультимодальная ИИ-модель, которую Маск называет «самым умным ИИ на земле». Во время презентации, транслировавшейся в прямом эфире, он добавил: «[Это] максимально правдивый ИИ, даже если эта правда иногда расходится с политической корректностью».
По данным xAI, Grok 3 в 10-15 раз мощнее своего предшественника. Он работает на суперкомпьютере Colossus, оснащенном 100 000 графических процессоров Nvidia H100, которые используют 200 миллионов GPU-часов для обучения. Благодаря такому уровню вычислительной мощности Grok 3 может обрабатывать огромные массивы данных с высокой скоростью и точностью, поднимая возможности ИИ на совершенно новый уровень.
Как получить доступ к генератору изображений Grok 3?
Существует 4 способа получить доступ к генератору изображений Grok. Первый и, вероятно, самый простой - через платформу X. Просто перейдите на вкладку Grok, выберите модель Grok 3 и попросите ее сгенерировать изображение.
2. xAI также представила новый отдельный сайт grok.com. Преимущество использования отдельного сайта в том, что на нем больше возможностей, чем в X.
Третий способ - через недавно выпущенное приложение Grok, доступное в Apple App Store.
Четвертый способ пользоваться Grok 3 подойдет для тех, кто живет в России. Перейдите в телеграм-бота SYNTX, кликните "Начать", выберите язык.
В главном меню выберите пункт "GPTs/Claude/Gemini"
Затем выберите "Управление"
В появившемся всплывающем меню выберите Grok 3. Теперь вы можете писать запросы к нейросети.
Примеры сгенерированных в Grok 3 изображений
Теперь давайте попробуем сгенерировать несколько изображений с помощью Grok 3.
Промпт: a river otter playing a ukelele
Реалистичность этих изображений впечатляет, особенно это касается текстуры меха выдры и тщательно детализированной травы. Освещение и тени способствуют созданию ощущения естественности, делая сцену визуально убедительной.
Однако есть небольшие несоответствия в анатомии, которые немного нарушают иллюзию - в первую очередь это недостающая нижняя лапа на одном изображении и недостающая верхняя лапа - на втором. В остальном изображение выглядит удивительно реалистично.
Вот что делает его интересным: обратите внимание, что вы можете ввести повторный промпт, чтобы еще больше изменить предыдущие изображения.
Попробую добавить в изображение элемент «under a rainbow», и вот какие результат у меня получился:
Это очень круто. Вы можете продолжать улучшать результаты, просто давая указания Grok.
Давайте рассмотрим другие примеры:
Промпт: A fluffy cat curled up inside a transparent wine glass with realistic fur details, glass reflections, and accurate light refraction.
К сожалению, ни на одном из двух изображений ИИ-генератору не удалось изобразить кошку, свернувшуюся калачиком внутри винного бокала, как было задумано. ИИ не смог правильно расположить кошку в бокале, вероятно, из-за сложности сочетания прозрачности, отражений и точной кошачьей анатомии в ограниченном пространстве.
Мне было интересно посмотреть, как другие модели ИИ справляются с этой задачей, я решил проверить ее с помощью Flux 1.1 Pro Ultra. По сравнению с предыдущими результатами, Flux показал гораздо лучшее понимание промпта, успешно передав как прозрачность стекла, так и естественную позу кошки.
Композиция кажется более целостной, а реалистичность взаимодействия кошки с окружающей средой повысилась. Хотя ни одна ИИ-модель не может быть идеальной, рендеринг Flux гораздо точнее соответствует запросу.
Далее посмотрим, как с подобными промптами справляется ChatGPT.
Как видите, ChatGPT с моделью GPT-4o лучше справляется с генерацией изображений, чем Grok 3.
Возвращаясь к Grok, давайте посмотрим, насколько хорошо он генерирует текст на изображениях.
Промпт: tars in a galaxy spelling “Grok”
Великолепно. Мне нравится, насколько разборчивы буквы и как хорошо стиль сочетается с фоном.
Наконец, давайте оценим реалистичность генерации изображений в Grok. Насколько хорошо он справляется с анатомически точными человеческими фигурами? Убедительно ли он передает текстуру кожи, мелкие детали, такие как пряди волос, и общую пропорциональность? Давайте оценим.
Промпт: An elderly potter shaping a clay pot on a spinning wheel, with detailed wrinkles, veins on his hands, and wet clay sticking to his fingers.
Качество впечатляет. Одним из первых моментов, который я проверил, было количество пальцев на руках, поскольку ИИ-модели иногда испытывают трудности с этим, и, на удивление, Grok сделал все правильно. Я также обратил внимание на степень загрязнения рук во время изготовления глиняного горшка, и рендер хорошо передал это. Детали на коже и отдельные пряди волос также хорошо проработаны, что делает изображение еще более реалистичным.
В этом случае качество уже находится на одном уровне с Flux 1.1 Pro Ultra и Midjourney, что впечатляет, учитывая, насколько сложными для ИИ могут быть анатомия человека и детали текстур.
Судя по моим тестам, создатели Grok 3 проделали большую работу, поэтому этот ИИ-генератор по качеству изображения уже не уступает Midjourney и Flux 1.1 Pro Ultra. Детализация текстур, освещения и анатомии впечатляет, а с некоторыми промптами он справляется на удивление хорошо.
Тем не менее, есть несколько заметных недостатков. Он не справляется со сложными композициями, иногда неправильно понимает взаимодействие объектов и поддерживает только соотношение сторон 1:1. Эти проблемы могут расстроить, особенно в сравнении с более гибкими ИИ-генераторами изображений.
Но если учесть, что сейчас Grok можно использовать совершенно бесплатно, то причин для недовольства практически нет. Кроме того, Маск заявил, что модель ежедневно совершенствуется, так что в ближайшем будущем мы можем увидеть значительные обновления. Следует помнить, что бесплатный доступ предоставлен только на ограниченное время.Если вам интересно, как Grok генерирует изображения, сейчас самое время испытать его. Напишите в комментариях, как вы оцениваете его возможности.
Источник статьи на английском - здесь
В апреле 2024 года в МТС Финтех появилась корпоративная well-being платформа Ритм.
Расскажу заодно и о Grok3: что это за ИИ модель, ради которой пользователям придется платить немаленькие деньги.
Илон Маск и его команда из xAI только что (18 февраля) представили новую версию своего ИИ-помощника, Grok 3. Многие ждали! Так что же там показали – действительно прорыв или планомерное улучшение?
Компания xAI Илона Маска представила новую версию своего чат-бота Grok-3, который уже завоевал лидерство в рейтингах среди ИИ-моделей. В слепых тестах на платформе Chatbot Arena он обошёл ChatGPT, Gemini и DeepSeek, продемонстрировав выдающиеся результаты в программировании, математике и обработке сложных запросов.
модель иногда «пугающе умна», предлагая неожиданные решения, о которых пользователи даже не задумывались.
Так Грок изначально на Флаксе генерирует, не?
Маск всегда о своих продуктах заявляет громкими обещаниями самый лучший, самый крутой и тд. Пока grok не переплюнуть ни Dalli, ни Midjourney. И Шедевруму уступает.