{"id":14276,"url":"\/distributions\/14276\/click?bit=1&hash=721b78297d313f451e61a17537482715c74771bae8c8ce438ed30c5ac3bb4196","title":"\u0418\u043d\u0432\u0435\u0441\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0432 \u043b\u044e\u0431\u043e\u0439 \u0442\u043e\u0432\u0430\u0440 \u0438\u043b\u0438 \u0443\u0441\u043b\u0443\u0433\u0443 \u0431\u0435\u0437 \u0431\u0438\u0440\u0436\u0438","buttonText":"","imageUuid":""}

Нейросеть для создания звуковых (спец)эффектов от единорога ElevenLabs

Для демонстрации возможностей они просто добавили звуковые эффекты к "крышесносным", по их собственным словам, видео, созданным нейросетью Sora от OpenAI:

Дата выхода неизвестна ("скоро"), поиграться нельзя, можно запросить ранний доступ.

ElevenLabs недавно стал единорогом, закрыв раунд серии B на $80 млн при оценке компании в $1,1 млрд. и представил сервис онлайн дубляжа видео и аудио записей.

Как это работает?

ElevenLabs использует алгоритмы машинного обучения для анализа текстовых описаний звуков и преобразования их в реалистичные звуковые эффекты. Технология основана на опыте компании в области синтеза речи и клонирования голоса.

В результате, расширяя применение технологии в новой области, создатели могут создавать звуки по запросу, без необходимости искать в библиотеках или записывать звуки с нуля.

Кому это нужно?

Создание звуковых спецэффектов зачастую требует доступа к обширным и недешевым библиотекам или длительной записи. ElevenLabs намерен упростить этот процесс, дав возможность создавать высококачественные звуковые эффекты на основе простых текстовых описаний (промптов).

Процесс создания звуков станет более доступным, позволяя экспериментировать и создавать уникальные эффекты без больших затрат или специальных знаний. Это может оказать влияние на звукозаписывающую индустрию, открывая новые возможности для создателей фильмов, видеоигр, подкастов и других мультимедийных продуктов.

Пожалуйста, поддержите меня, поставьте лайк!

OpenAI выпустил модель Sora для генерации видео из текста (и не только)
Пример видео, сделанного моделью Sora. Источник - OpenAI
Стратап-единорог ElevenLabs представил сервис онлайн дубляжа видео и аудио записей

Dubbing Studio может переводить записи на 29 языков (включая русский) за минуты, при этом сохраняя уникальные особенности голосов спикеров (тон, стиль). Нужно лишь загрузить видео или аудио и выбрать язык для перевода.

Интерфейс сервиса для дубляжа. Источник
Китайский стартап выпустил реставратор изображений

Вот как меняется изображение:

Результат реставрации фото. Слева - исходная картинка, справа - улучшенная. Источник
Apple выпустила сервис MGIE для редактирования изображений

Инновационное решение под названием «MGIE» позволяет редактировать изображения с помощью простых текстовых инструкций.

Редактирование изображений с помощью MGIE: сделать пиццу более здоровой; добавить контраста на фото, убрать женщину на фоне, добавить зеленую страницу на ноутбуке. Источник
0
Комментарии
-3 комментариев
Раскрывать всегда