{"id":14276,"url":"\/distributions\/14276\/click?bit=1&hash=721b78297d313f451e61a17537482715c74771bae8c8ce438ed30c5ac3bb4196","title":"\u0418\u043d\u0432\u0435\u0441\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0432 \u043b\u044e\u0431\u043e\u0439 \u0442\u043e\u0432\u0430\u0440 \u0438\u043b\u0438 \u0443\u0441\u043b\u0443\u0433\u0443 \u0431\u0435\u0437 \u0431\u0438\u0440\u0436\u0438","buttonText":"","imageUuid":""}

Появился еще один сервис для генерации видео из текста

Можно воспользоваться Stable Video 1.1 прямо сейчас, и совершенно бесплатно.

Созданное моделью Stable Video 1.1 видео на основе текста по запросу "африканский слон". Источник

Что может модель?

Создавать короткие (до 4 сек.) видео, можно попробовать тут уже сейчас. Модель Stable Video Diffusion обучена создавать 25 кадров с разрешением 576x1024.

После недавнего скандала с Gemini, разработчики Stable Video Diffusion оговариваются, что модель предназначена только для исследовательских целей (например, для понимания возможностей и ограничений генеративных моделей) или как креативный инструмент: для художественных или образовательных намерений.

Модель не нацелена на правдивое изображение людей или событий и фотореализма. “Использование модели для создания такого контента выходит за рамки возможностей этой модели” и нарушает правила компании.

Качество видео чуть хуже, чем у Sora (продукт OpenAI), но вполне хорошее:

Сравнение возможностей для генерации видео двух конкурирующих моделей.

Кто разработчик?

Автор модели - компания Stability AI. Это опенсорсная компания, основанная в 2019 году с весьма амбициозной целью: “демократизации ИИ и создания глобальной основы для активации потенциала человечества”.

По словам компании, она уже собрала сообщество из более чем 300 тыс. авторов, разработчиков и исследователей по всему миру. У компании есть свыше 10 млн. пользователей, которые появились уже через 2 мес. после запуска сервиса. В конце 2023 года компания получила $50 млн инвестиций от Intel.

Stability AI представила свою модель генерации видео по тесту раньше, чем OpenAI. Буквально на днях компания представила Stable Diffusion 3 - новую модель для генерации изображений по тексту. У компании также есть генератор музыки, 3D объектов.

OpenAI выпустил модель Sora для генерации видео из текста в середине февраля, а чуть ранее Google выпустил модель Lumiere с аналогичным функционалом.

Подробнее о том, почему создание моделей для генерации видео из текста непростая техническая задача и какое у этого может быть практическое применение - читайте тут.

Пожалуйста, поддержите меня, поставьте лайк!

Что ждет искусственный интеллект в 2024 году: 4 главных тренда от MIT

Эти тренды имеют вполне практическое значение для нас, обычных пользователей. К оценкам Массачусетского технологического института (MIT) стоит прислушаться: их прогнозам на 2023 год сбылись почти в полном объеме, и текущие прогнозу, к слову, уже начали сбываться.

Ян Лекун, визионер и отец искусственного интеллекта о технологии и будущем

Ян Лекун — пионер современного искусственного интеллекта (ИИ) и один из самых ярых защитников технологии. В отличие от других, он высмеивает апокалиптические сценарии развития ИИ и ратует за открытый исходный код. Кто такой Лекун, что он сделал для развития ИИ, что он думает об OpenAI, суперинтеллекте и страхах в отношении ИИ.

Ян Лекун, фото Wired
0
Комментарии

Комментарий удален модератором

Развернуть ветку
-3 комментариев
Раскрывать всегда