{"id":14279,"url":"\/distributions\/14279\/click?bit=1&hash=4408d97a995353c62a7353088166cda4ded361bf29df096e086ea0bbb9c1b2fc","title":"\u0427\u0442\u043e \u0432\u044b\u0431\u0435\u0440\u0435\u0442\u0435: \u0432\u044b\u0435\u0445\u0430\u0442\u044c \u043f\u043e\u0437\u0436\u0435 \u0438\u043b\u0438 \u0437\u0430\u0435\u0445\u0430\u0442\u044c \u0440\u0430\u043d\u044c\u0448\u0435?","buttonText":"","imageUuid":""}

Появился еще один сервис для генерации видео из текста

Можно воспользоваться Stable Video 1.1 прямо сейчас, и совершенно бесплатно.

Созданное моделью Stable Video 1.1 видео на основе текста по запросу "африканский слон". Источник

Что может модель?

Создавать короткие (до 4 сек.) видео, можно попробовать тут уже сейчас. Модель Stable Video Diffusion обучена создавать 25 кадров с разрешением 576x1024.

После недавнего скандала с Gemini, разработчики Stable Video Diffusion оговариваются, что модель предназначена только для исследовательских целей (например, для понимания возможностей и ограничений генеративных моделей) или как креативный инструмент: для художественных или образовательных намерений.

Модель не нацелена на правдивое изображение людей или событий и фотореализма. “Использование модели для создания такого контента выходит за рамки возможностей этой модели” и нарушает правила компании.

Качество видео чуть хуже, чем у Sora (продукт OpenAI), но вполне хорошее:

Сравнение возможностей для генерации видео двух конкурирующих моделей.

Кто разработчик?

Автор модели - компания Stability AI. Это опенсорсная компания, основанная в 2019 году с весьма амбициозной целью: “демократизации ИИ и создания глобальной основы для активации потенциала человечества”.

По словам компании, она уже собрала сообщество из более чем 300 тыс. авторов, разработчиков и исследователей по всему миру. У компании есть свыше 10 млн. пользователей, которые появились уже через 2 мес. после запуска сервиса. В конце 2023 года компания получила $50 млн инвестиций от Intel.

Stability AI представила свою модель генерации видео по тесту раньше, чем OpenAI. Буквально на днях компания представила Stable Diffusion 3 - новую модель для генерации изображений по тексту. У компании также есть генератор музыки, 3D объектов.

OpenAI выпустил модель Sora для генерации видео из текста в середине февраля, а чуть ранее Google выпустил модель Lumiere с аналогичным функционалом.

Подробнее о том, почему создание моделей для генерации видео из текста непростая техническая задача и какое у этого может быть практическое применение - читайте тут.

Пожалуйста, поддержите меня, поставьте лайк!

Что ждет искусственный интеллект в 2024 году: 4 главных тренда от MIT

Эти тренды имеют вполне практическое значение для нас, обычных пользователей. К оценкам Массачусетского технологического института (MIT) стоит прислушаться: их прогнозам на 2023 год сбылись почти в полном объеме, и текущие прогнозу, к слову, уже начали сбываться.

Ян Лекун, визионер и отец искусственного интеллекта о технологии и будущем

Ян Лекун — пионер современного искусственного интеллекта (ИИ) и один из самых ярых защитников технологии. В отличие от других, он высмеивает апокалиптические сценарии развития ИИ и ратует за открытый исходный код. Кто такой Лекун, что он сделал для развития ИИ, что он думает об OpenAI, суперинтеллекте и страхах в отношении ИИ.

Ян Лекун, фото Wired
0
Комментарии

Комментарий удален модератором

Развернуть ветку
-3 комментариев
Раскрывать всегда