Hugging Face: где искать бесплатные нейросети
На площадке можно сгенерировать корги с блинчиками, записать озвучку и придумать ещё больше промптов.
Для генерации текста, картинок, аудио, видео, анализа данных, как правило, нужны разные нейросети. Но Hugging Face эту проблему решает — на площадке собраны тысячи моделей. И их можно использовать бесплатно. А ещё здесь пробуют инструменты, которые есть только в демоверсии, и работают с тяжёлыми нейросетями через ZeroGPU (заменяет высокопроизводительные компьютеры). Рассказываем, какие возможности и недостатки есть у Hugging Face, как зарегистрироваться и пользоваться. А ещё делимся результатами генераций — попробовали пять разных моделей.
Содержание:
Что такое Hugging Face
Это платформа для машинного обучения и целое комьюнити, задача которого — помочь пользователям быстрее и продуктивнее создавать и обучать нейросети. Hugging Face сравнивают с GitHub (это крупнейшая площадка для публикации написанного кода), поскольку здесь разработчики так же открыто могут выкладывать и тестировать модели.
Площадка подойдёт и для повседневных задач. Сотни моделей можно запускать прямо в Hugging Face или на внешних ресурсах вроде Google Colab — для этого понадобится скопировать код.
Hugging Face Inc. была основана в Нью-Йорке в 2016 году тремя французскими предпринимателями. На машинном обучении здесь сфокусировались не сразу — сначала компания работала над чат-ботом для подростков, но позже выложила исходный код в открытый доступ. У Hugging Face широкая сеть партнёрств — например, с ней сотрудничают Amazon Web Services, Google, Nvidia.
Как начать работу
Потестировать Hugging Face получится без регистрации. Неавторизованные пользователи могут скачивать общедоступные модели и наборы данных, а также экспериментировать с нейросетями через промпты. Но есть ситуации, когда завести аккаунт всё же полезно. Например, чтобы:
- Использовать функции нейросетей в полном объёме. Без авторизации доступ к определённой модели может быть ограничен. Например, в AI Comic Factory (нейросеть для создания комиксов) удалось выполнить только одну генерацию в анонимном режиме — для дальнейшей работы сервис попросил войти в аккаунт.
- Персонализировать опыт — как вариант, подписаться на аккаунты интересных ИИ-разработчиков и следить за релизами.
- Создать свою организацию на платформе и купить платную подписку с расширенными возможностями. Подробнее о тарифах — в разделе.
- Хранить модели и наборы данных в личном репозитории (хранилище).
Создать аккаунт можно по кнопке «Sign up» в верхнем левом углу. Это займёт пару минут.
Сначала сервис попросит выбрать язык (английский, испанский, китайский и ещё восемь — русского нет) и решить капчу (тест для определения ботов). Дальше нужно указать электронную почту — это единственный способ регистрации. Останется указать никнейм и полное имя и принять пользовательское соглашение. По желанию — загрузить аватар, добавить соцсети и описать свои интересы в ИИ.
Стартовый экран авторизованного пользователя выглядит как на скриншоте ниже.
В верхнем меню — основные разделы Hugging Face:
- «Models» («Модели»). Список из загруженных на платформу моделей — их почти 1,5 млн. Фильтровать каталог можно по пяти параметрам: «Tasks» («Задачи»), «Libraries» («Библиотеки»), «Datasets» («Наборы данных»), «Languages» («Языки»), «Licenses» («Лицензии»).
- «Datasets» («Наборы данных») — больше 300 тысяч наборов. Фильтры те же, что и для «Models». Раздел будет полезен профессиональным пользователям — например, ML-инженеры на опубликованных наборах могут обучать новые модели.
- «Spaces» («Пространства») — здесь собраны все модели, которые можно запустить прямо в интерфейсе Hugging Face. Они сгруппированы более чем по 30 задачам, которые может решить ИИ. Например, есть модели для генерации картинок и видео.
В левом меню — персональная информация, в том числе кнопка перехода в профиль («Profile») и добавления организации («Create New»). В центре — персонализированная лента с карточками моделей, наборов данных и пространств. Изначально она пустая, но заполнится контентом, как только пользователь подпишется хотя бы на одного разработчика. В правой части экрана — тренды за последнюю неделю.
Эксперименты с моделями в Hugging Face
Проще всего подключиться к нужной нейросети из раздела «Spaces».
Вначале заходим в подходящую под задачу подборку нейросетей. Если нужно сгенерировать картинку, подойдёт «Image generation». Кликаем на неё — откроется лента с моделями. По умолчанию они отсортированы по релевантности, но выдачу можно изменить с помощью кнопки «Sort» — например, по числу лайков или последнему обновлению.
Генерация изображения
Создадим картинку в модели FLUX.1 [dev]. Можно обойтись только строкой промпта — описываем запрос на генерацию и нажимаем «Run». Если нужны расширенные настройки, понадобится блок «Advanced settings». А под ним можно посмотреть примеры промптов и готовых изображений.
Вот такого милого корги с блинчиками нарисовала FLUX.
Клонирование голоса
С этой задачей помогут справиться модели из раздела «Voice cloning». Например, самая популярная на Hugging Face — XTTS v2.0.3. Вставляем текст для озвучки, выбираем язык (русский есть в списке), добавляем аудио для клонирования голоса или записываем онлайн с помощью микрофона. В конце обязательно нужно поставить галочку в пункте «Agree» (это согласие с условиями использования модели). Когда всё готово, нажимаем «Send» («Отправить»).
Как нейросеть предложила озвучить корги с блинчиками — в аудио ниже. Он приглашает к застолью голосом щенка из мультфильма «Котёнок по имени Гав»: «Я испёк очень вкусные блинчики на завтрак, угощайтесь!»
Генерация текста
В этой группе чаще других лайкали модель Stable Diffusion Prompt Generator. Она поможет придумать запрос на генерацию изображения, например, когда не хватает идей или нет времени готовить детализированное описание. Допустим, картинка с корги не подходит, а нужна какая-то другая иллюстрация Масленицы. На скриншоте ниже — варианты промптов от ИИ-генератора.
Модель подошла к задаче слишком креативно. Так, во втором варианте смешались Масленица, Тарковский, Вавилонская башня, киберженщина и манга: «Shrovetide, Tarkovsky, majestic ancient tower of babylon of terror, a woman in cyber clothing, hyperrealistic, blame manga illustration by tyler edlin, full color manga cover art, symmetrical, highly detailed, insanely detailed, smooth, sharp focus, cinematic lighting, ArtStation, greg rutkowski, 8 k» («Масленица, Тарковский, величественная древняя башня ужаса Вавилона, женщина в киберодежде, гиперреалистичная, иллюстрации к манге “Blame!” от Тайлера Эдлина, полноцветная обложка манги, симметричная, очень подробная, безумно подробная, плавная, четкий фокус, кинематографическое освещение, ArtStation, Грег Рутковски, 8k»).
Генерация видео
Больше всего лайков в этой подборке у модели Live Portrait — попробуем её. Эта нейросеть оживляет портреты. В левой части экрана — окно для загрузки изображения человека, а в левой — для добавления видео с движением (его и повторит объект с картинки после анимирования). Когда всё загружено, можно нажимать «Animate» (кнопка находится ниже).
Для эксперимента взяли «Даму с горностаем» да Винчи и видео из списка референсов — вот что получилось. Анимация очень реалистичная, а мимика — естественная.
Редактирование изображения
Попробуем теперь изменить эмоции на лице дамы с горностаем с помощью инструментов редактирования. Заходим в «Image editing» и выбираем модель Expression Editor («Редактор эмоций»). Сначала нужно загрузить изображение человека — нейросеть автоматически определит область головы и обрежет картинку. Дальше — установить нужные настройки для наклона головы («Head»), глаз («Eyes») и губ («Mouth») — для этого можно двигать ползунок. Когда подходящие параметры заданы, нажимаем «Submit» («Отправить данные»).
В результате редактирования девушка опустила голову, подмигнула зрителю и более явно улыбнулась. Получилось правдоподобно.
Тарифы и технические ограничения
План HF Hub полностью бесплатный — он даёт доступ ко всем ключевым возможностям платформы:
- Размещение моделей и наборов данных без ограничений по количеству.
- Создание организаций без лимита на число участников.
- Доступ к самым свежим инструментам машинного обучения.
Платные тарифы Pro Account и Enterprise Hub можно рассмотреть, если использование и разработка моделей будет в профессиональных или коммерческих целях. Так, первый в пять раз увеличит квоту на ZeroGPU (даёт доступ к графическим процессорам Nvidia A100 для сложных задач по обучению моделей) и откроет режим разработчика в «Spaces» («Spaces Dev Mode»), стоит $9 месяц. Enterprise Hub включает возможность настраивать доступ к репозиториям (например, выдать права на просмотр или редактирование), выбирать их локацию (страну), просматривать аналитику. Стоимость — от $20 за пользователя в месяц.
У Hugging Face есть некоторые технические ограничения, которые важно учесть перед началом использования:
- Могут понадобиться большие вычислительные ресурсы. Так, для полной функциональности модели Llama 3.1 70B нужно не менее 64 Гб оперативной памяти (в то время как стандартная память — от 8 до 32 Гб). Если устройство не соответствует этим требованиям, можно столкнуться с ошибками.
- Лимит места в хранилище. В бесплатном тарифе объём приватного репозитория — 100 Гб. Их не хватит для профессионального использования, например, если нужно обучать большие модели. Зато место в публичных репозиториях не ограничено во всех тарифах.
- Ограничения по работе с ZeroGPU: в бесплатном тарифе можно пользоваться до пяти минут в день.
Недостатки Hugging Face
Ниже — основные минусы для повседневного использования:
- Не все опубликованные модели работают. Узнать это получится, только если начать тестировать модель. Stable Diffusion 2.1 Demo при генерации выдала ошибку, а Long-Form Summarization: LED & BookSum не обработала запрос на краткий пересказ сказки за три минуты ожидания.
- Сложно выбрать подходящую модель. На каждую задачу Hugging Face предлагает десятки моделей. Чтобы определиться с подходящей, придётся читать описания похожих друг на друга нейросетей.
- Разработчики публикуют предобученные модели. Это значит, что нейросеть тренировали на универсальном наборе данных. Результат генерации в такой модели может получиться некачественным.
Краткий вывод
- Hugging Face — площадка с большим выбором моделей под разные задачи (основная часть — для генерации и редактирования контента). В нашем эксперименте получилось довольно быстро получить качественный результат, но сложности тоже были — не все модели работали.
- Потестировать многие модели можно без регистрации, а чтобы завести аккаунт, понадобится пара минут.
- Hugging Face — бесплатная платформа с возможностью перейти на продвинутые тарифы от $9 в месяц. Но для повседневного использования они, скорее всего, не нужны.
- Для выбора оптимальной модели стоит запастись терпением — в открытом доступе есть сотни моделей, а оценить релевантность и качество получится только путём эксперимента.
Вы уже оценили возможности Hugging Face? Для каких задач использовали? Делитесь результатами в комментариях.