Imaginary Soundscape: нейросеть подбирает звук фотографиям
Группа ученых из Японии представила обновленную версию приложения Imaginary Soundscape. Этот проект на базе искусственного интеллекта позволяет превращать изображения в соответствующий звуковой пейзаж, определенный нейронной сетью.
Особенно интересным стал результат обработки логотипов компаний и абстрактных картинок: в логотипе Tproger ИИ нашел звон бокалов.
Как работает Imaginary Soundscape?
Приложение использует механизм распознавания объектов и базу данных из 52 000 звуковых файлов. Когда на загруженной картинке появляется объект, который ИИ может распознать, соответствующий звук добавляется в созданный результат.
Разработчики предлагают опробовать приложение на живописи, которая уже доступна на сайте проекта. Новая версия Imaginary Soundscape также распознает фотографии улиц и подбирает звуковое окружение, не хуже, чем первый релиз для фотографий, полученных из Google Street View.
Исследование распознавания объектов при помощи искусственного интеллекта остается актуальной темой для гигантов IT.
ChatGPT - это одна из востребованных нейросетей 2023 года, которая способна генерировать тексты.