{"id":14292,"url":"\/distributions\/14292\/click?bit=1&hash=23aed192f809013ec1c0769a11eb00fbed4dd7038bbe5f8e3db447db2e792dcd","title":"\u0421 \u043d\u0430\u0447\u0430\u043b\u0430 \u0433\u043e\u0434\u0430 \u043a\u0430\u0440\u0442\u043e\u0439 \u00ab\u0425\u0430\u043b\u0432\u0430\u00bb \u043e\u043f\u043b\u0430\u0442\u0438\u043b\u0438 40 \u043c\u043b\u043d \u043f\u043e\u043a\u0443\u043f\u043e\u043a","buttonText":"","imageUuid":""}

Нейросеть для создания звуковых (спец)эффектов от единорога ElevenLabs

Для демонстрации возможностей они просто добавили звуковые эффекты к "крышесносным", по их собственным словам, видео, созданным нейросетью Sora от OpenAI:

Дата выхода неизвестна ("скоро"), поиграться нельзя, можно запросить ранний доступ.

ElevenLabs недавно стал единорогом, закрыв раунд серии B на $80 млн при оценке компании в $1,1 млрд. и представил сервис онлайн дубляжа видео и аудио записей.

Как это работает?

ElevenLabs использует алгоритмы машинного обучения для анализа текстовых описаний звуков и преобразования их в реалистичные звуковые эффекты. Технология основана на опыте компании в области синтеза речи и клонирования голоса.

В результате, расширяя применение технологии в новой области, создатели могут создавать звуки по запросу, без необходимости искать в библиотеках или записывать звуки с нуля.

Кому это нужно?

Создание звуковых спецэффектов зачастую требует доступа к обширным и недешевым библиотекам или длительной записи. ElevenLabs намерен упростить этот процесс, дав возможность создавать высококачественные звуковые эффекты на основе простых текстовых описаний (промптов).

Процесс создания звуков станет более доступным, позволяя экспериментировать и создавать уникальные эффекты без больших затрат или специальных знаний. Это может оказать влияние на звукозаписывающую индустрию, открывая новые возможности для создателей фильмов, видеоигр, подкастов и других мультимедийных продуктов.

Пожалуйста, поддержите меня, поставьте лайк!

OpenAI выпустил модель Sora для генерации видео из текста (и не только)
Пример видео, сделанного моделью Sora. Источник - OpenAI
Стратап-единорог ElevenLabs представил сервис онлайн дубляжа видео и аудио записей

Dubbing Studio может переводить записи на 29 языков (включая русский) за минуты, при этом сохраняя уникальные особенности голосов спикеров (тон, стиль). Нужно лишь загрузить видео или аудио и выбрать язык для перевода.

Интерфейс сервиса для дубляжа. Источник
Китайский стартап выпустил реставратор изображений

Вот как меняется изображение:

Результат реставрации фото. Слева - исходная картинка, справа - улучшенная. Источник
Apple выпустила сервис MGIE для редактирования изображений

Инновационное решение под названием «MGIE» позволяет редактировать изображения с помощью простых текстовых инструкций.

Редактирование изображений с помощью MGIE: сделать пиццу более здоровой; добавить контраста на фото, убрать женщину на фоне, добавить зеленую страницу на ноутбуке. Источник
0
Комментарии
-3 комментариев
Раскрывать всегда