Udio против Suno: какая нейросеть лучше?

Udio против Suno: какая нейросеть лучше?

Совсем недавно в мире музыкальных нейросетей у главного титана Suno AI нарисовался новый конкурент. Ну, как новый, уже существовавший, но именно сейчас показывающий себя с лучшей стороны. И уже многие ютуберы успели употребить что-то вроде «Udio выносит Suno…» А «выносит» ли? Давайте разберемся.

Хочу заметить, что перед данным сравнительным обзором провел десятки часов (а в Суно – сотни) за генерациями, поэтому постараюсь максимально объективно и без воды сравнить эти два инструмента.

Интерфейс и юзабилити

Для ценителей Суно ИИ нейросетка Юдио при первом заходе покажется вполне знакомой. В основной панели всё те же возможности:

1. Выбор варианта генерации (кастомная, по тексту и инструменталка)

2. Работа с полем промтов

3. Поле для текста и тегов (при работе с авторским текстом)

4. И даже все те же 5 попыток по 2 открывка для бесплатных генераций

Но всё это немного в другом порядке!

Udio против Suno: какая нейросеть лучше?

А что разработчики Юдио внесли нового? Из полезного в глаза сразу бросается «умный» поиск тегов, который позволяет быстро накидать промт из готовых вариантов. При этом ничего не мешает вам зашить в промт описание композиции (типа сделай мне «медленный рок про любовь») , предав композиции особое настроение. Насколько нейронка это учтёт, это уже второй вопрос.

Теги в текстовом описании в принципе те же самые, впрочем, разработчики приложили гайд прямо в панели настроек, поэтому не буду останавливаться на этом.

Когда продолжаем генерировать трек по частям, можно включить отображения дерева генераций, да и в принципе массово удалять ненужные отрывки.

Ну, и еще здесь есть кнопка «Manual Mode». По-умолчанию, Udio пытается доработать, улучшить ваш промт «со своей колокольни». Вот данная функция по сути является отказом от этой «помощи».

Генерация трека

По тому же принципу, что и в Suno, при работе с авторским текстом вы заносите текст вместе с тегами. При этом вам сразу вылетит ограничение по количеству знаков. Нейронка говорит: «Много текста не вводи – ничего хорошего не будет!» На самом деле генерация запустится при любом количестве символов, но так как изначально генеративный отрывок будет ограничен 32 секундами (а иногда, без объяснения причин, и меньше!) , смысл в этом отпадает чисто логически. Суно в этом плане выдает первый кусок композиции до 2 минут (если нет ограничений) , да и делает это намного быстрее.

Udio против Suno: какая нейросеть лучше?

Факапит Юдио на старте, периодически создавая один кусок сначала, а второй – продолжением этого начала, но в другом варианте. И это действительно напрягает, так как по факту вы их на старте даже сравнить не можете, чтобы выбрать. И вроде бы это можно решить на следующем этапе работы над треком, но логики в такого рода генерациях все равно никакой нет.

Стоит отметить, что прочитывает русский текст Юдио лучше Суно. По крайней мере, у меня ни разу не возникло серьезных проблем с ударениями и произношением сложных слов. За это разрабам респект. Но! Зато на этапе генерации композиции случаются флешбеки, которые отсылают нас ко 2-ой версии Суно, когда вместо вашего текста генеративка напевает чей-то чужеродный трек на непонятном языке. А ещё она может выкинуть целый абзац или «пропеть» рандомные строчки из тех, что вы занесли в текстовое поле. В общем, пока беда. Двойка.

Продление трека и редактура

Функция Extend в Udio реализована интереснее, чем в Suno. Она более тонко улавливает изменения в промте, а также позволяет продолжать или даже дополнять трек «с разных сторон». Да, да, тут вы можете переписать композицию перед сгенерированным отрывком, вставить Intro и Outro, которые на уровне тегов сейчас не срабатывают адекватно, зато в таком варианте работают хорошо. А вишенка на торте – это выбор удачного отрывка через опцию Select Selection. Наверное, это то, чего порой не хватает Суно, когда до идеала остается совсем чуть-чуть, а нейронка не позволяет полноценно отредактировать конкретный момент, неудачно «спетую» фразу.

На выходе вы сразу получаете скомпонованный фрагмент первой композиции и второй, то есть Юдио поэтапно соединяет трек, делает его бесшовным, что удобно для прослушивания.

Udio против Suno: какая нейросеть лучше?

Ремиксы и точечное редактирование

Во-первых, в Юдио разрабы позволяют отстроить процент сходства в режиме Ремикса с первоначальным вариантом. При этом по мере увеличения Variance трек действительно становится другим. Кстати, здесь данная функция в небольшом значении иногда помогает быстро исправить произношение текста без серьезных перемен в музыкальной составляющей композиции.

Во-вторых, бросается в глаза функция Inpainting. Это корректировка фрагментов готовой композиции. Функция, как по мне сырая, но очень нужная. Маленькие фрагменты правит успешно, вот только без платной подписки вы его использовать не сможете!

Еще одна интересная функция — Advanced Controls. Включается внизу панели редактирования. По сути, это изменение шаблонности трека, то есть её уменьшение будет влиять на вариативность, правда, не всегда успешно.

Качество звучания

Если вы хоть раз делали в Суно свою песню, особенно с чистым рок-вокалом, то, наверняка, обращали внимания, что голос отличается эдакой звонкостью, будто слегка наложен высокий фланжер. И это, конечно выдает нейронку достаточно часто. На удивление, в Юдио разрабы уделили этому моменту немало внимания. Голос, напротив, способен отличаться реалистичностью, порою даже настолько, что вокал выглядит по-человечески отвратительным!

Однако в своих тестах обратил внимание, что именно русские композиции в определенных стилях действительно успешно повторяют нашу эстраду. Ко всему прочему, достаточно хорошо нейронка справляется с агрессивным вокалом, да и в принципе учитывает с первого раза в промте и хрипоту голоса, если ее прописать, и другие особенности. В Суно с этим всегда приходится довольно долго экспериментировать.

Музыка с первого взгляда чище, плотнее, объемнее, но не всегда, естественно.

Не резюмируем, а наблюдаем

В любом случае наличие конкуренции – двигатель прогресса. Поэтому и тот и другой разработчик явно начнут гонку по удобству и качеству. Не буду выделять лидера. Суно быстрее и проще, за какие-то минуты позволяет сделать хороший трек. Юдио – это больше возможностей для корректировок, детализации трека. Вторая нейронка потребует терпения и времени, но на выходе вы можете получить весьма качественную композицию, которая может вообще не иметь намеков на ИИ, но при этом еще достаточно сырая. Поэтому генерируйте, тестируйте, творите музыку, ну, и слушайте мои треки:

33
Начать дискуссию