Hugging Face: где искать бесплатные нейросети

На площадке можно сгенерировать корги с блинчиками, записать озвучку и придумать ещё больше промптов.

Hugging Face: где искать бесплатные нейросети

Для генерации текста, картинок, аудио, видео, анализа данных, как правило, нужны разные нейросети. Но Hugging Face эту проблему решает — на площадке собраны тысячи моделей. И их можно использовать бесплатно. А ещё здесь пробуют инструменты, которые есть только в демоверсии, и работают с тяжёлыми нейросетями через ZeroGPU (заменяет высокопроизводительные компьютеры). Рассказываем, какие возможности и недостатки есть у Hugging Face, как зарегистрироваться и пользоваться. А ещё делимся результатами генераций — попробовали пять разных моделей.

Содержание:

Что такое Hugging Face

Это платформа для машинного обучения и целое комьюнити, задача которого — помочь пользователям быстрее и продуктивнее создавать и обучать нейросети. Hugging Face сравнивают с GitHub (это крупнейшая площадка для публикации написанного кода), поскольку здесь разработчики так же открыто могут выкладывать и тестировать модели.

Площадка подойдёт и для повседневных задач. Сотни моделей можно запускать прямо в Hugging Face или на внешних ресурсах вроде Google Colab — для этого понадобится скопировать код.

Hugging Face Inc. была основана в Нью-Йорке в 2016 году тремя французскими предпринимателями. На машинном обучении здесь сфокусировались не сразу — сначала компания работала над чат-ботом для подростков, но позже выложила исходный код в открытый доступ. У Hugging Face широкая сеть партнёрств — например, с ней сотрудничают Amazon Web Services, Google, Nvidia.

Как начать работу

Потестировать Hugging Face получится без регистрации. Неавторизованные пользователи могут скачивать общедоступные модели и наборы данных, а также экспериментировать с нейросетями через промпты. Но есть ситуации, когда завести аккаунт всё же полезно. Например, чтобы:

  • Использовать функции нейросетей в полном объёме. Без авторизации доступ к определённой модели может быть ограничен. Например, в AI Comic Factory (нейросеть для создания комиксов) удалось выполнить только одну генерацию в анонимном режиме — для дальнейшей работы сервис попросил войти в аккаунт.
  • Персонализировать опыт — как вариант, подписаться на аккаунты интересных ИИ-разработчиков и следить за релизами.
  • Создать свою организацию на платформе и купить платную подписку с расширенными возможностями. Подробнее о тарифах — в разделе.
  • Хранить модели и наборы данных в личном репозитории (хранилище).

Создать аккаунт можно по кнопке «Sign up» в верхнем левом углу. Это займёт пару минут.

Так видит главную страницу неавторизованный пользователь. Источник: https://huggingface.co  
Так видит главную страницу неавторизованный пользователь. Источник: https://huggingface.co  

Сначала сервис попросит выбрать язык (английский, испанский, китайский и ещё восемь — русского нет) и решить капчу (тест для определения ботов). Дальше нужно указать электронную почту — это единственный способ регистрации. Останется указать никнейм и полное имя и принять пользовательское соглашение. По желанию — загрузить аватар, добавить соцсети и описать свои интересы в ИИ.

Стартовый экран авторизованного пользователя выглядит как на скриншоте ниже.

Главная страница после авторизации. Источник: https://huggingface.co
Главная страница после авторизации. Источник: https://huggingface.co

В верхнем меню — основные разделы Hugging Face:

  • «Models» («Модели»). Список из загруженных на платформу моделей — их почти 1,5 млн. Фильтровать каталог можно по пяти параметрам: «Tasks» («Задачи»), «Libraries» («Библиотеки»), «Datasets» («Наборы данных»), «Languages» («Языки»), «Licenses» («Лицензии»).
  • «Datasets» («Наборы данных») — больше 300 тысяч наборов. Фильтры те же, что и для «Models». Раздел будет полезен профессиональным пользователям — например, ML-инженеры на опубликованных наборах могут обучать новые модели.
  • «Spaces» («Пространства») — здесь собраны все модели, которые можно запустить прямо в интерфейсе Hugging Face. Они сгруппированы более чем по 30 задачам, которые может решить ИИ. Например, есть модели для генерации картинок и видео.

В левом меню — персональная информация, в том числе кнопка перехода в профиль («Profile») и добавления организации («Create New»). В центре — персонализированная лента с карточками моделей, наборов данных и пространств. Изначально она пустая, но заполнится контентом, как только пользователь подпишется хотя бы на одного разработчика. В правой части экрана — тренды за последнюю неделю.

Эксперименты с моделями в Hugging Face

Проще всего подключиться к нужной нейросети из раздела «Spaces».

Раздел «Spaces». Источник: https://huggingface.co
Раздел «Spaces». Источник: https://huggingface.co

Вначале заходим в подходящую под задачу подборку нейросетей. Если нужно сгенерировать картинку, подойдёт «Image generation». Кликаем на неё — откроется лента с моделями. По умолчанию они отсортированы по релевантности, но выдачу можно изменить с помощью кнопки «Sort» — например, по числу лайков или последнему обновлению.

Генерация изображения

Создадим картинку в модели FLUX.1 [dev]. Можно обойтись только строкой промпта — описываем запрос на генерацию и нажимаем «Run». Если нужны расширенные настройки, понадобится блок «Advanced settings». А под ним можно посмотреть примеры промптов и готовых изображений.

Страница генерации в модели FLUX. Источник: https://huggingface.co
Страница генерации в модели FLUX. Источник: https://huggingface.co

Вот такого милого корги с блинчиками нарисовала FLUX.

Промпт: «Corgi bakes pancakes and spreads jam on them» («Корги печёт блины и мажет их вареньем»). Источник: https://huggingface.co/spaces/black-forest-labs/FLUX.1-dev
Промпт: «Corgi bakes pancakes and spreads jam on them» («Корги печёт блины и мажет их вареньем»). Источник: https://huggingface.co/spaces/black-forest-labs/FLUX.1-dev

Клонирование голоса

С этой задачей помогут справиться модели из раздела «Voice cloning». Например, самая популярная на Hugging Face — XTTS v2.0.3. Вставляем текст для озвучки, выбираем язык (русский есть в списке), добавляем аудио для клонирования голоса или записываем онлайн с помощью микрофона. В конце обязательно нужно поставить галочку в пункте «Agree» (это согласие с условиями использования модели). Когда всё готово, нажимаем «Send» («Отправить»).

Страница генерации в модели XTTS v2.0.3. Источник: https://huggingface.co
Страница генерации в модели XTTS v2.0.3. Источник: https://huggingface.co

Как нейросеть предложила озвучить корги с блинчиками — в аудио ниже. Он приглашает к застолью голосом щенка из мультфильма «Котёнок по имени Гав»: «Я испёк очень вкусные блинчики на завтрак, угощайтесь!»

А так выглядел запрос на генерацию. Источник: https://huggingface.co 
А так выглядел запрос на генерацию. Источник: https://huggingface.co 

Генерация текста

В этой группе чаще других лайкали модель Stable Diffusion Prompt Generator. Она поможет придумать запрос на генерацию изображения, например, когда не хватает идей или нет времени готовить детализированное описание. Допустим, картинка с корги не подходит, а нужна какая-то другая иллюстрация Масленицы. На скриншоте ниже — варианты промптов от ИИ-генератора.

Промпт: «Shrovetide» («Масленица»). Источник: https://huggingface.co 
Промпт: «Shrovetide» («Масленица»). Источник: https://huggingface.co 

Модель подошла к задаче слишком креативно. Так, во втором варианте смешались Масленица, Тарковский, Вавилонская башня, киберженщина и манга: «Shrovetide, Tarkovsky, majestic ancient tower of babylon of terror, a woman in cyber clothing, hyperrealistic, blame manga illustration by tyler edlin, full color manga cover art, symmetrical, highly detailed, insanely detailed, smooth, sharp focus, cinematic lighting, ArtStation, greg rutkowski, 8 k» («Масленица, Тарковский, величественная древняя башня ужаса Вавилона, женщина в киберодежде, гиперреалистичная, иллюстрации к манге “Blame!” от Тайлера Эдлина, полноцветная обложка манги, симметричная, очень подробная, безумно подробная, плавная, четкий фокус, кинематографическое освещение, ArtStation, Грег Рутковски, 8k»).

Генерация видео

Больше всего лайков в этой подборке у модели Live Portrait — попробуем её. Эта нейросеть оживляет портреты. В левой части экрана — окно для загрузки изображения человека, а в левой — для добавления видео с движением (его и повторит объект с картинки после анимирования). Когда всё загружено, можно нажимать «Animate» (кнопка находится ниже).

Для эксперимента взяли «Даму с горностаем» да Винчи и видео из списка референсов — вот что получилось. Анимация очень реалистичная, а мимика — естественная.

Страница генерации в модели Live Portrait. Источник: https://huggingface.co 
Страница генерации в модели Live Portrait. Источник: https://huggingface.co 
Источник: https://huggingface.co 

Редактирование изображения

Попробуем теперь изменить эмоции на лице дамы с горностаем с помощью инструментов редактирования. Заходим в «Image editing» и выбираем модель Expression Editor («Редактор эмоций»). Сначала нужно загрузить изображение человека — нейросеть автоматически определит область головы и обрежет картинку. Дальше — установить нужные настройки для наклона головы («Head»), глаз («Eyes») и губ («Mouth») — для этого можно двигать ползунок. Когда подходящие параметры заданы, нажимаем «Submit» («Отправить данные»).

Страница генерации в модели Expression Editor. Источник: https://huggingface.co 
Страница генерации в модели Expression Editor. Источник: https://huggingface.co 

В результате редактирования девушка опустила голову, подмигнула зрителю и более явно улыбнулась. Получилось правдоподобно.

Дама с горностаем после редактирования мимики. Источник: https://huggingface.co
Дама с горностаем после редактирования мимики. Источник: https://huggingface.co

Тарифы и технические ограничения

План HF Hub полностью бесплатный — он даёт доступ ко всем ключевым возможностям платформы:

  • Размещение моделей и наборов данных без ограничений по количеству.
  • Создание организаций без лимита на число участников.
  • Доступ к самым свежим инструментам машинного обучения.

Платные тарифы Pro Account и Enterprise Hub можно рассмотреть, если использование и разработка моделей будет в профессиональных или коммерческих целях. Так, первый в пять раз увеличит квоту на ZeroGPU (даёт доступ к графическим процессорам Nvidia A100 для сложных задач по обучению моделей) и откроет режим разработчика в «Spaces» («Spaces Dev Mode»), стоит $9 месяц. Enterprise Hub включает возможность настраивать доступ к репозиториям (например, выдать права на просмотр или редактирование), выбирать их локацию (страну), просматривать аналитику. Стоимость — от $20 за пользователя в месяц.

У Hugging Face есть некоторые технические ограничения, которые важно учесть перед началом использования:

  • Могут понадобиться большие вычислительные ресурсы. Так, для полной функциональности модели Llama 3.1 70B нужно не менее 64 Гб оперативной памяти (в то время как стандартная память — от 8 до 32 Гб). Если устройство не соответствует этим требованиям, можно столкнуться с ошибками.
  • Лимит места в хранилище. В бесплатном тарифе объём приватного репозитория — 100 Гб. Их не хватит для профессионального использования, например, если нужно обучать большие модели. Зато место в публичных репозиториях не ограничено во всех тарифах.
  • Ограничения по работе с ZeroGPU: в бесплатном тарифе можно пользоваться до пяти минут в день.

Недостатки Hugging Face

Ниже — основные минусы для повседневного использования:

  • Не все опубликованные модели работают. Узнать это получится, только если начать тестировать модель. Stable Diffusion 2.1 Demo при генерации выдала ошибку, а Long-Form Summarization: LED & BookSum не обработала запрос на краткий пересказ сказки за три минуты ожидания.
  • Сложно выбрать подходящую модель. На каждую задачу Hugging Face предлагает десятки моделей. Чтобы определиться с подходящей, придётся читать описания похожих друг на друга нейросетей.
  • Разработчики публикуют предобученные модели. Это значит, что нейросеть тренировали на универсальном наборе данных. Результат генерации в такой модели может получиться некачественным.

Краткий вывод

  • Hugging Face — площадка с большим выбором моделей под разные задачи (основная часть — для генерации и редактирования контента). В нашем эксперименте получилось довольно быстро получить качественный результат, но сложности тоже были — не все модели работали.
  • Потестировать многие модели можно без регистрации, а чтобы завести аккаунт, понадобится пара минут.
  • Hugging Face — бесплатная платформа с возможностью перейти на продвинутые тарифы от $9 в месяц. Но для повседневного использования они, скорее всего, не нужны.
  • Для выбора оптимальной модели стоит запастись терпением — в открытом доступе есть сотни моделей, а оценить релевантность и качество получится только путём эксперимента.

Вы уже оценили возможности Hugging Face? Для каких задач использовали? Делитесь результатами в комментариях.

9
3
1
2 комментария