«ChatGPT для музыки»: нейросети для генерации музыки
🔥 Еще больше интересного в моем канале продуктовые штучки
Они действительно создают (новую) музыку?
Создатели уверенно говорят об этом, и это не противоречит нашим знаниям о возможностях нейросетей. Модель делает что-то новое из своих обучающих данных.
К слову, этот аргумент также использует OpenAI, когда утверждает, что в недалеком будущем ИИ сможет делать научные открытия. Некоторые недоверчивые пользователи проводят эксперименты, чтобы это проверить. И да, они убеждаются в этом.
Что в этом примечательного?
Еще совсем недавно многие эксперты полагали, что ИИ еще нескоро будет способен генерить полноценные, высококачественные песни из текстовых подсказок. И вот мы уже видим целых три инструмента для создания музыки.
Udio
Появился последним, совсем недавно. Нейросеть может создавать трек на ваши слова или придумать текст самостоятельно. Возможно, компания также выпустить сервис по клонированию голоса (такой инструмент уже есть у OpenAI)
Udio подает себя как инструмент для профессионалов (так, он умеет генерировать музыку в стерео-формате, где левый и правый каналы реально отличаются).
Сервис может создавать музыку в разных стилях. Можно попробовать уже сейчас, и создать до 1200 (!!) песен в месяц. Доступ открывается сразу, без листа ожидания. Пользователи отмечают, что у Udio композиции на английском языке получаются "выразительными и запоминающимися".
Сервис произвел большой фурор (о нем написал, к примеру, «Rolling Stone» — известный американский журнал, посвящённый музыке и поп-культуре), поэтому сервис испытывает перегрузки и не может генерить музыку так быстро, как хотелось бы, о чем предупреждает.
Стартап Udio создан выходцем из Сколтеха и экс-исследователями Google DeepMind Ярославом Ганиным (но не только, у стартапа 4 сооснователя). Udio собрал $10 млн от венчурных фондов и инвесторов, таких как сооснователь и технический директор Instagram Майк Кригер. Также в списке инвесторов Udio есть несколько известных музыкальных имен. Продукт появился очень быстро: сооснователи создали компанию в декабре 2023 года.
Suno
Ранее, в декабре появился сервис Suno AI. Он больше рассчитан на массовую аудиторию пользователей. Suno генерирует двухминутные музыкальные клипы из подсказок, у сервиса есть подписка. Модель Suno v3 была представлена всего несколько недель назад и стала настоящим прорывом, особенно в области реалистичного, человеческого вокала. Блюзовая песня AI, созданная Rolling Stone с помощью Suno v3, в прошлом месяце стала вирусной.
На сайте сервиса есть композиции в том числе и на русском языке - Трава у дома и Владимирский централ. Вернее, это вольные каверы нейросети на слова этих песен.
По отзывам, звучание музыки Udio чуть более четкое и реалистичное, чем у Suno, меньше выдает машинное происхождение треков.
Sonauto
Третий сервис - Sonauto. Позволяет генерировать песни в стиле известных музыкантов.
Так, в топе мелодий - композиция в стиле Кэти Перри:
Пожалуйста, поддержите меня, поставьте лайк!
В 2025 году нейросети вышли на новый уровень, предлагая решения для генерации изображений, видео, текста, озвучки и даже 3D-контента. В этом материале мы собрали самые передовые и эффективные ИИ-инструменты, которые помогут вам в работе.
Наша сегодняшняя героиня — молодая феминистка, только что закончившая ВУЗ по специальности филолог, решает устроиться воспитательницей в детский сад за 20 000 рублей в месяц. Как ей удалось попасть на работу в крупнейшие IT-компании и построить там карьеру, а потом всё бросить и уехать в другую страну — читай прямо сейчас!
Сегодня я подготовил подборку 50 ИИ-инструментов в 7 категориях, которые ускоряют работу, экономят время и повышают производительность. Здесь будут и супер-трендовые корпоративные нейросети типа Midjourney, и менее популярные плоды труда одного разработчика.
Давай разберемся, как работают эти технологии и как ты можешь использовать их для создания собственных хитов.
🎵 Друзья, вы готовы к настоящей революции в мире аудио? В этом видео я покажу вам три невероятные нейросети, которые перевернут ваше представление о работе со звуком! MM-Audio создаст потрясающие звуковые эффекты для ваших видео и игр всего за пару кликов, Fish Speech поразит вас качеством клонирования голоса по минутному образцу, а LatentSync иде…
Generate Video – инструмент от конкурента Sora (OpenAI) позволяет любому создавать 5-секундные видео с разрешением 1080 p.
Riffusion — это платформа, которая позволяет создавать музыку на основе текстовых описаний. Введя запрос, пользователь может получить уникальный музыкальный трек в реальном времени буквально за минуту. Сервис использует искусственный интеллект для преобразования текстовых подсказок в спектрограммы, которые затем превращаются в аудиофайл.
В последние годы нейросети плотно вошли в нашу жизнь. Они способны выполнять задачи, которые ранее требовали значительных человеческих ресурсов и времени, открывают новые горизонты для творчества и инноваций. И если о ChatGPT, Midjourney и DeepSeek знают все, то о других, не менее интересных сервисах, мы знаем меньше.
Современные технологии все глубже проникают в сферу музыкального восприятия, предлагая принципиально новые подходы к созданию персонализированного звукового опыта. Одним из наиболее перспективных направлений стало использование биометрических данных для адаптации музыкального контента. В этом контексте особенно интересны проекты, сочетающие научные…
класс
Гойда