Обновление нейро-интерфейса Fooocus до версии v2.4.1, Hyper-SD и TCD, что еще нового, как обновиться?
Друзья, всем привет! Недавно популярный нейросетевой интерфейс Fooocus обновился сразу до версии v2.4.1. Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me, техноблогер и нейро-евангелист. Давайте посмотрим, какие основные нововведения и улучшения появились. Я отдельно озвучу самые заметные обновления и оставлю полный список изменений в конце.
Добавился новый режим Hyper-SD, это еще одна лора чтобы генерировать за 4 шага в ущерб качеству, кому-то пригодится, работает не хуже чем лайтнинг.
Aspect Ratios - разрешения теперь зачем-то свернуты, меня лично это бесит, это не красиво и не удобно.
Random style - случайный стиль при каждой генерации будет включать - случайный стиль, если вам совсем нечем заняться, не забудьте выставить на максимум количество изображений.
На вкладке Debug Menu в разделе Inpaint вы найдете Inpaint brush color, на тот случай если вас всегда бесил белый цвет маски.
Там же в Debug Menu, но уже в разделе Debug Tools появился параметр CLIP Skip, который по умолчанию выставлен на 2, имейте это ввиду.
Там же добавились семплер и планировщик TCD, которые запрашивал ваш покорный слуга. Сначала скачайте и включите вот эту лору, затем в Debug Menu, в разделе Debug Tools поставьте на 1 CFG Mimicking from TSNR, затем Sampler поставьте TCD, а Scheduler - sgm_uniform, ниже Forced Overwrite of Sampling Step поставьте на 6, я нашел это оптимальным значением для соотношения скорость - качество, но вы конечно можете поэкспериментировать и написать в комментариях как работает лучше. Guidance Scale рекомендуется поставить на минимум, но я нахожу что на 1.5-2 изображения получаются интереснее. Изображение с обложки было создано именно в таком режиме всего за 6 шагов и за 2 секунды в разрешении 1280х768, а так и не скажешь. Еще несколько изображений в карусели ниже.
Все новые функции и улучшения:
- Добавлена возможность загружать файлы с Hugging Face через зеркальный сайт.
- Обновлен модуль Interposer с v3.1 до v4.0.
- Теперь можно переподключиться к интерфейсу без перезагрузки страницы с помощью специальной кнопки.
- Появился выбор VAE моделей для генерации.
- Добавлен новый стиль "Random Style" для случайного выбора стиля.
- Обновлена модель аниме с animaPencilXL_v100 до animaPencilXL_v310.
- В историю логов теперь сохраняются полные необработанные промпты (full raw prompts).
- При загрузке изображения для апскейла (upscaling) теперь можно автоматически получить его описание.
- Добавлена цензура NSFW изображений (отключает предварительный просмотр промежуточного изображения при генерации). Установите значение конфигурации default_black_out_nsfw в True, чтобы всегда включать эту опцию.
- Добавлена поддержка встроенных ссылок на LoRA в промптах с поддержкой подпапок, пример: colorful bird lora:toucan:1.2
- При описании изображения теперь даются рекомендации по размеру и соотношению сторон.
- В инструменте инпейнтинга появился выбор цвета кисти, что удобно, когда изображение и кисть маски имеют одинаковый цвет.
- Автоматизирована сборка Docker-образа с помощью Github Actions при каждом релизе.
Планировщики и семплеры:
- Добавлен планировщик AlignYourSteps от Nvidia.
- Добавлены семплер TCD и планировщик, основанный на sgm_uniform (аналогично lcm).
Производительность:
- Добавлена производительность "hyper-sd" на основе 4-шагового LoRA.
Исправления:
- Исправлено значение clip skip по умолчанию с 1 на 2.
- Добавлена проверка типов на неопределенные значения, использование резервных вариантов, когда нет перевода для соотношений сторон.
- Использовано корректное свойство CSS border-radius.
- Исправлен незакрытый мета-тег в заголовке HTML.
- Удален оставшийся код для тестирования hyper-sd.
- Оптимизировано управление моделями для цензуры NSFW изображений.
- Улучшена панель прогресса генерации.
- Оптимизирована работа со встроенными LoRA.
Настройки интерфейса:
- Элементы вкладки настроек стали более компактными.
- Добавлен слайдер clip skip.
- У большинства полей ввода изображений удалены подписи.
- Настройки пользовательского интерфейса стали более компактными.
Прочее:
- Изменен владелец кода с @lllyasviel на @mashb1t для автоматического уведомления о проблемах и Merge Requests.
- Используются только действительные встроенные LoRA, добавлена поддержка подпапок.
- Значение 'CFG Mimicking from TSNR' теперь читается из пресетов.
- Изменена конфигурация окончания строк по умолчанию.
Оригинальный список изменений доступен на странице автора.
Как обновиться?
Скорее всего обновление уже произошло автоматически когда вы запускали фокус и никаких специальных действий не требуется. Если в консоли вы видите Already up-to-date, то можно не беспокоиться.
Но в моем случае была вот такая ошибка и я не нашел иного решения как просто скачать новый установщик и после этого все прошло гладко.
Читайте другие мои материалы о нейросети Fooocus:
А если захотите изучить Fooocus профессионально, то приглашаю на мой курс Fooocus.ru, где за 15 уроков вы узнаете всю базу необходимую для дальнейшего развития.
Пока индустрия ИИ замерла в ожидании Midjourney V7, Google выпустил Imagen 3, и это может полностью изменить расстановку сил на рынке генерации изображений. В этой статье — детальное сравнение трех главных игроков рынка, анализ их возможностей и практические рекомендации по использованию каждого инструмента. Вы узнаете, почему Google может стать но…
"Выживальщика" потому, что минимальная корзина в России формируется по принципу минимальных потребностей человека в калориях и балансе ЖБУ. Так что полноценно жить на таком рационе можно вряд ли, но о конкретном составе корзины позже, прежде о ценах.
Устали от бесконечного переключения между разными сервисами искусственного интеллекта? Тратите время на регистрацию в десятках приложений, каждое из которых выполняет только одну функцию? Хотите использовать мощь современных нейросетей, но запутались в их многообразии? Эта статья поможет вам разобраться, как объединить более 70 передовых ИИ-инструм…
Идеи закончились? Бриф пуст, проект буксует, а вдохновение не приходит? Творческий кризис – реальность не только для писателей, но и для дизайнеров, художников, маркетологов и других креаторов. В этой статье я покажу, как Midjourney и ChatGPT помогают генерировать идеи, находить свежие решения и превращать творческий процесс в игру. Освойте мощный…
🎵 Друзья, вы готовы к настоящей революции в мире аудио? В этом видео я покажу вам три невероятные нейросети, которые перевернут ваше представление о работе со звуком! MM-Audio создаст потрясающие звуковые эффекты для ваших видео и игр всего за пару кликов, Fish Speech поразит вас качеством клонирования голоса по минутному образцу, а LatentSync иде…
Первая валюта не теряет внимания рынка, ведь халвинг Биткоина 2024, случившийся 20 апреля, продолжает оказывать влияние на криптовалюту до сих пор. Тогда, на блоке 840 000, награда за майнинг сократилась с 6,25 до 3,125 BTC, и почти год спустя — в марте 2025 — это все еще важная тема.
Вы когда-нибудь задумывались, какие нейросети реально помогают в работе, а какие просто выглядят впечатляюще? Один из крупнейших инвестфондов Andreessen Horowitz (a16z) провел опрос среди своих специалистов, чтобы выяснить, какие ИИ-сервисы они считают самыми полезными. Результаты впечатляют. Давайте разберёмся, какие инструменты сейчас на пике поп…
Нейросети не только полезны, но и вредны. Наверняка вы слышали про галлюцинации и то, как наказали адвокатов, наслушавшисхся советов ChatGPT. В каких еще случаях не стоит прибегать к нейронке?
Друзья, в этом видео мы проведем честное сравнение всех популярных языковых моделей на реальной задаче! Я дам им задание переписать моё React-приложение для сравнения изображений в обычный HTML+JS. Какая модель справится лучше всех?
Вас беспокоит, что AI вытеснит фотографов и дизайнеров с рынка? В этой статье я подробно анализирую, как Midjourney 6 и другие генераторы изображений трансформируют рынок визуального контента, какие ниши останутся за людьми, а где AI действительно заменит специалистов. Разбираю инструменты Midjourney и Flux, делюсь конкретными промптами и настройка…
Доброго времени !
Может Вы разъясните что такое "CFG Mimicking from TSNR" и чем он/оно отличается от обычного CFG ?
Это динамическое изменение CFG и его максимум.
а для чего вообще эти нейросети созданы, по-моему картинки сгенерированные нейросетями не столь важны в наших жизнях)
Вы просто еще не замечаете как много вокруг того, что создано нейросетями.