Как мы записывали голоса Николая Дроздова, AcademeG и Галины Юзефович для навигатора «2ГИС»

Навигатор — вещь более-менее привычная. «Поверните налево», «На следующем перекрёстке держитесь правее». Обезличенный голос вовремя говорит вам, куда ехать — и вот вы не пропустили нужный поворот, а доехали быстро и чётко. Что тут улучшать?

Мы решили сделать так, чтобы наш навигатор заговорил голосами известных людей — привлечь таким образом новых пользователей и порадовать тех, кто уже ездит с 2ГИС.

Пусть навигатор — вещь служебная, но и он может давать плюс к комфорту за рулём, как хорошая музыка или любимая радиостанция. Мы хотели дать пользователю возможность выбрать попутчика, который бы подсказывал дорогу.

Меня зовут Рома Жайворон, в проекте я отвечал за запись голосов. Рассказываю про внутреннюю кухню: как записывали, как выбирали звёздные голоса и придумывали фразы. И про пасхалки.

Контекст

Мы — это 2ГИС. Приложение в формате геосервиса: с картой, справочником адресов и организаций, навигатором, пробками. MAU >50 млн. Раньше наш навигатор был одноголосным. Теперь можно выбрать, под чей голос ехать.

Промо голосов навигатора 2ГИС + бекстейдж

Как выбирали голоса

Мы прекрасно понимали, что идея навигатора с известными голосами не новая, мы далеко не первые. Значит ценность нужно создать за счёт того, кого мы позовём озвучивать. Учитывая известность персоны, узнаваемость голоса, релевантность для аудитории и небольшой по меркам индустрии бюджет.

2ГИС — компания из региона. Мы давно федеральные по цифрам, но остаёмся «местными» по сути. Поэтому нам было важно не просто найти и уговорить дорогих федеральных звёзд участвовать в проекте, а понять, кто станет «своим» для разных сегментов пользователей. Вызвать wow-эффект не просто за счёт известности голоса, а за счёт близости к аудитории. Приятный сюрприз — такой подход даже дешевле.

Но допустим, бюджет вашего проекта безграничен. Нельзя просто выбрать топовых звёзд и записать с ними навигатор. Важно, чтобы узнаваемым был именно голос в речи. Известного имени, лица или вокала не достаточно. Узнают ли пользователи кумира по фразе «плавно поверните налево»? Это не всегда очевидно.

Например, мы почти решили записать Светлану Лободу. Посмотрели несколько интервью с ней — у неё мощный вокал, однако мы засомневались, что люди узнают голос певицы в речи. Навигатор — это сильно другой контекст.

А вот, например, в Александре Гудкове не сомневались. Дикая популярность, голос не спутаешь. Однако стоимость записи оказалась на порядок выше наших ожиданий.

На грабли мы тоже наступали. Сначала воспринимали затею как большую интеграцию у звёзд и прикидывали цены на основе стандартных расценок. Звёзды думали иначе. Во-первых, интеграция редко предполагает передачу авторских прав: блогер рекомендует ваш продукт в своём посте один раз и всё. Пост его. В случае с навигатором это он или она передаёт право на использование голоса, который мы встраиваем в приложение. Это предмет покупки.

Далее, фактор времени. Для многих звёзд он оказался ключевым. Записать интеграцию для Ютуба или Инстаграма — меньше часа. Записать навигатор — минимум один день в студии. Именно время, а не сложность задачи влияли на гонорар в первую очередь. И чем популярнее (актуальнее, если угодно) персона, тем дороже часы в студии.

В итоге мы стали составлять шорт-лист заново и решили, что именно узнаваемость голоса в речи должна быть главным критерием отбора, а не популярность. У нас получился длинный список людей, чьи голоса вы вряд ли спутаете. При этом все они — далеко не топовые звёзды с безумными ценами на интеграции.

Кого выбрали

Остановились на пяти голосах. Все очень разные.

Николай Дроздов (фото автора)

Николай Дроздов — легенда «В мире животных». Очень широкая аудитория узнаёт и любит этот голос. К слову, в прошлом году у Николая Николаевича была коллаборация с Gucci, что привлекло к нему дополнительное внимание. Мы об этом не знали, когда включали его в список.

Андрей Гаврилов (в центре)

Андрей Гаврилов — голос с VHS-кассет из знаменитой когорты кинопереводчиков 90-х. Сам по себе не селебрити, вы вряд ли узнаете его по имени, но его голос — почти что самостоятельный мем («А ну иди сюда, решил ко мне лезть…?»). Именно на мемность мы и рассчитывали, когда включали его в список. И на ностальгию.

Константин Заруцкий (AcademeG)

AcademeG — автоблогер Константин Заруцкий. Без малого пять миллионов подписчиков на YouTube. Тот случай, когда мы сделали ставку не на узнаваемость, а на релевантную аудиторию (автолюбители). Тем не менее, если вы смотрели хоть одно видео Академега, вы узнаете и его голос, в нём много харизмы и узнаваемой ютубной подачи.

Галина Юзефович

Галина Юзефович — литературный критик, ведущая подкаста «Книжный базар». Пригласив её, мы получаем и фанатскую базу (читающая аудитория знает и любит Галину), и просто очень приятный интеллигентный женский голос для тех, кто ранее о Юзефович не слышал.

Пётр Гланц

Пётр Гланц (Иващенко) — актёр дубляжа. Если вы не пропускаете ни одного блокбастера, голос Пётра Гланца вы узнаете сразу, как только услышите. Его голосом разговаривает множество киногероев, и как актёр он может быть разным: в голосе сочетаются и эпичность, и комичность, и дерзость. Высокий профи, свой обычный голос моментально настраивает на роль. Мы решили, что такая киношность понравится пользователям.

Итого в нашем наборе оказались: голос из 90-х (ставим на ностальгию), автоблогер (ставим на релевантную аудиторию), голос из блокбастеров (ставим на экшн, дерзость и комедию), спокойный книжный голос (для интеллигентной аудитории) и сама доброта — голос Николая Николаевича (народная любовь + ностальгия).

Грамматика

Где нам не пришлось изобретать велосипед, так это в грамматике. На момент записи у нас уже был проверенный годами навигатор с дефолтной озвучкой. С точки зрения текста он устроен так.

Всего 253 отдельных фразы. От коротких («развернитесь») до весьма длинных («впереди начало участка контроля средней скорости»). Когда вы за рулём идете по маршруту, и происходит событие, алгоритм склеивает отдельно записанные фразы в предложения, и получается голосовое уведомление: через + 500 + метров + на светофоре + развернитесь.

Каждой фразе присвоено уникальное имя

Массив фраз мы разделили на группы. Вот некоторые из них.

Числительные. Самая большая группа. Здесь мы заставили звёздных дикторов считать от 0 до 19, затем назвать все десятки и сотни, остановившись на тысячи. Не забыли про вариативность рода и числа: не только один, два, тысяча но и одну, две, тысячу, тысяч и т.д. Порядковые числительные ограничили двадцатью: они нужны только для обозначения номера съезда с кольца(«круговое движение + третий + съезд»).

Буквы. Кириллица и латиница. Они обычно нужны для обозначения трасс, въездов и выездов на автострады.

Единицы измерения. Метры и километры со всеми возможными окончаниями.Манёвры на перекрёстке. Все возможные действия: повороты, плавные повороты, крутые повороты, движение прямо, разворот. Уведомления о камерах. Не только обычных камерах скорости, но и камерах средней скорости, камерах полосы, контроля остановки, обочины и других.

Ориентиры. Короткие поясняющие фразы, которые добавляются в середине или в конце предложения: перед мостом, на светофоре, в арку, на мост.

Системные уведомления. Отдельно стоящие фразы, которые, например, сообщают, что вы ушли с маршрута, что навигатор проанализировал пробки и нашёл маршрут лучше, или что вам пора зарядить телефон.

Дорожные события и объекты. О том, что впереди дорожные работы, авария или ДПС(с указанием ряда!). Или о том, что двигаться нужно через тоннель.

Фразы для пешеходных маршрутов. Мы посчитали важным сделать навигатор с голосовым ведением не только для водителей, но и для тех, кто любит гулять. Этого не было в прошлых версиях, мы решили предусмотреть эти сценарии, когда записывали звёздные голоса. Продумали грамматику так, что 90% фраз автомобильного навигатора подходят для пеших маршрутов. Добавили фразы в духе «вы пришли» (альтернатива «вы приехали»), «перейдите дорогу», «пройдите через калитку» и тд.

Пример категоризации фраз для навигатора

При проектировании грамматики постоянно сталкиваешься с выбором. Есть две очевидные крайности. Можно записать только отдельные слова и дать алгоритму их склеивать. Слов будет мало, запись пройдёт быстро, но алгоритму придётся делать много-много склеек. Каждое предложение будет лоскутным одеялом: через + 200 + метров + на + светофоре + поверните + направо + в + арку. У вас будут десятки тысяч комбинаций. Звучать будет плохо.

Другая крайность — прописать в грамматике максимум готовых составных фраз, чтобы алгоритм делал меньше склеек, просто доставал из библиотеки целиком записанную фразу. Звучать будет естественнее. Конечно, это нереально. Пришлось бы записывать тысячи(если не десятки тысяч) комбинаций. Особенно с числительными. Поэтому мы искали золотую середину.

Получилось так: через + 200 + метров + на светофоре + поверните направо + в арку. С числительными ничего не поделаешь, а вот остальные части предложений мы старались группировать. Никогда не записывали отдельно предлоги (исключение: через), только в составе фраз. Например, пришлось каждый по второму кругу записывать десятки («60», «70»), чтобы обозначить скоростные лимиты («на 60», «на 70»), и алгоритм каждый раз не склеивал предлог «на» и числительные.

Пасхалки

Было бы преступлением пригласить звёзд и просто записать дефолтные голосовые инструкции. Мы решили заменить некоторые фразы на«кастомные» пасхалки. Для каждого диктора придумали свои.

Николай Дроздов

Хотелось не просто добавить эмоциональности, а объединить фирменные фразы метафорой. Что, например, Николай Дроздов делает в навигаторе в вашей машине? Мы придумали, что он ведёт пользователя по «бетонным джунглям» и комментирует происходящее как в передаче«В мире животных», а вся поездка — это сафари. В этой метафоре мы совместили сюжет передвижения из пункта А в В с фирменным образом Дроздова.

Николай Дроздов в меню выбора голосов навигатора 2ГИС:

Вот ещё несколько примеров дефолтных фраз и фирменных аналогов от Николая Николаевича:

До конца маршрута осталось три километра. → До конца сафари осталось три километра.

Вы сошли с маршрута. → Осторожно, вы ушли с маршрута! Повадки местной фауны слабо изучены.

Впереди камера. → Гепард разгоняется до 100 км в час! А вам не надо. Впереди камера.

Андрей Гаврилов

В случае с Андреем Гавриловым поездка превращается в киносеанс.

Андрей Гаврилов в меню выбора голосов навигатора 2ГИС:

Маршрут построен. → Кинокомпания «Двойной Джис» представляет кинокартину «Маршрут построен».

До конца маршрута осталось два километра. → До финальных титров осталось два километра.

Впереди камера. → Это же не фильм«Скорость», и вы не Киану Ривз. Впереди камера.

Сложно представить Гаврилова без бессмертного монолога из фильма «Кровь и бетон»: «А-ну иди сюда, решил ко мне лезть…», — и далее по тексту. По понятным причинам, мы не смогли включить в навигатор оригинал. Адаптировали.

Галина Юзефович

Разумеется, метафора чтения книги. Здесь, как в путешествии на машине, есть начало, есть финал, есть магистральная линия сюжета, промежуточные точки (главы).

Галина Юзефович в меню выбора голосов навигатора 2ГИС:

Поверните направо. → Плавный сюжетный поворот направо.

Круговое движение, второй съезд. → Кольцевая композиция, второй съезд.

Впереди камера. → И какой же русский не любит быстрой езды? Впереди камера.

Вы ушли с маршрута.→ Автор увлёкся второстепенными сюжетными линиями и ушёл с маршрута.

AcademeG

Константин Заруцкий знаменит энергичными автообзорами, поэтому путешествие с ним по навигатору 2ГИС мы превратили в тест-драйв. Не забыли про коронные фразы, которые узнают фанаты автоблогера: «господа», «больше жогова!» и про бобров.

AcademeG в меню выбора голосов навигатора 2ГИС:

Впереди дорожные работы. → Там впереди бобры всё перекопали!

Впереди камера. → Э-эй, не наваливайте так! Впереди камера.

Потерян сигнал GPS. → Господа, я понятия не имею, где мы. GPS пропал.

С пасхалками опасно заиграться. Если их будет слишком много, фразы слишком длинные, а юмор слишком тонким, эти игры будут мешать пользоваться продуктом — навигатор станет неудобным. Мы несколько раз пересматривали список кастомных фраз, корректировали, сокращали.

Боялись, что придумаем что-то чуждое нашим героем, но им креатив понравился, они с удовольствием включились в игру. Лишь малую часть фраз меняли под себя уже в студии в день записи. Например, Академег изменил «дадим жогова» на «больше жогова» и добавил фразу про бобров.

В студии

Есть пять ключевых параметров, за которыми приходилось следить: скорость, тональность, громкость, интонация и артикуляция. Первые три можно до некоторой степени изменить на пост-продакшене, последние два не правятся. Но и первые лучше не трогать, а записать всё сразу «на чистовик».

Для проекта мы запартнёрились со студией CUBIC STUDIO в Москве, которая специализируется на записи дикторов для аудиорекламы, голосовых помощников и других подобных проектов. Опыт записи навигатора у студии был, однако действовать строго по прошлому шаблону не получилось, у нашей задачи была специфика. У звукорежиссёрского пульта был саунд-дизайнер и композитор Стас Дмитриев, обладатель ТЕФИ.

Скорость. Если за ней не следить на записи, можно получить, например, быстрые десятки, уйти на обед, расслабиться, а после записать медленные сотни. При склейке фразы «через + 100 + 50 + метров + развернитесь» будет звучать странно.

Тональность. У речи она тоже есть, не только когда поют. Мы не всегда говорим в одной и той же тональности. Если склеить фразы разных тональностей, будет похоже на гитару, у которой расстроена одна из струн.

Громкость. Мы не только говорим с разной громкостью, но ещё и склонны держаться то ближе, то дальше от микрофона, особенно когда записываемся много часов подряд. К тому же, есть эффект «близости» голоса: если записать фразу дальше от микрофона, а потом сделать запись погромче, звучать она будет всё равно не так, как записанная близко к микрофону.

Интонация. С ровной интонацией говорят роботы. Люди так не делают. Обычно мы делаем «домик» в середине фразы, когда говорим. Но в случае с навигатором совсем естественно говорить не получится.

Пример: есть фраза «двигайтесь прямо». Она может быть в начале предложения («двигайтесь прямо пять километров»), может в конце («через 200 метров двигайтесь прямо»). В жизни мы произносим каждую такую фразу с разной интонацией. Записывать несколько вариантов интонации для каждой из 253 фраз не вариант. Но и роботизированный навигатор мы не хотели. Поэтому стремились добиться наиболее нейтральной ровной интонации для фраз, которые могут стоять в разных частях предложения. А уже в отдельно-стоящих фразах могли позволить более специфическую интонацию. В тех же пасхалках.

Артикуляция. Звёздные голоса не обязаны говорить идеально с точки зрения норм советского радио. Они должны быть приятными и узнаваемыми. Тем не менее, правильная артикуляция тоже важна. Есть слова, которые трудно произносить даже профессиональным дикторам. Пришлось помучиться и перезаписывать несколько раз порой неожиданные фразы, вроде «найден маршрут лучше», «железнодорожный переезд», «держитесь левее» (сливалось в «держите Сливея!»), «в арку» (сливалось в «варку»).

Все пять параметров непостоянны. А ещё есть обертона, осиплость, эмоциональная подача. Внимательное ухо расслышит разницу, когда записанные в разные дни фразы выстроятся в предложение. Поэтому мы спланировали график записи и объём материала так, чтобы каждую знаменитость записать за один день.

В студии мы выбрали около 20 тестовых фраз из разных функциональных групп, чтобы они могли выстраиваться в предложения. Через, пять, 200, метров, километров, поверните налево, перед светофором и подобные. Записали их, отправили диктора отдохнуть, а сами выбрали удачные дубли и прогнали материал через тестовый стенд, эмулирующий алгоритм навигатора.

Эмулятор помогал нам сразу понять, насколько удачна запись, хорошо ли фразы склеиваются в предложения. Далее мы через наушники включали диктору, например, «200» из тестовой сессии и записывали остальные фразы группы — сотни. Таким образом диктор мог«снять» интонацию, тональность, скорость и другие параметры с одобренного образца и записать остальные фразы из группы в том же ключе.

Сколько дублей? Оптимально записывать «тройками». Звукорежиссёр говорит «пишем», диктор произносит одну фразу три раза через паузы. Запись останавливается, и мы коллективно выбираем удачный дубль из трёх. Если ни один не нравился, писали ещё одну тройку. Так мы ещё и сэкономили время на отборе дублей — почти всегда сразу знали, что пойдёт в бой.

Знаменитости

Работать со звёздными голосами — одно удовольствие!

Николаю Николаевичу 83 года, и, признаться, мы волновались, что нам не хватит стандартной смены в студии. Всё-таки, 253 фразы по 3 дубля каждая (или больше) — это утомительно. Волновались зря.

Мы постоянно его спрашивали: «Николай Николаевич, может, вы передохнёте, давайте перерыв устроим?». А он: «Нет-нет, давайте, дальше работаем!». Дроздова записали быстро, время чистой работы — пять часов. При этом много общались в перерывах. Николай Николаевич — прекрасный собеседник и энергичный рассказчик.

В конце смены не мы ему, а он нам — всем, кто принимал участие в записи, — подарил подарки: открытки с автографами. У меня, вот, на рабочем столе висит открытка с фотографией Дроздова из 1980-х, он тут на коне — он её подписал. А ещё подарил диск, называется «А вы слыхали, как поёт Дроздов?».

Открытка с автографом и диск с песнями — подарок от Николая Дроздова

Голос Андрея Гаврилова в жизни — это фантастика! Например, Пётр Гланц в жизни говорит обычно, и ему нужно как бы включить«режим киногероя» — он его моментально включает и всё классно. А Гаврилову не надо ничего включать, вживаться в образ — он просто так разговаривает.

Есть такой эффект лоу-фай — как будто мы его записали на кассету и сто раз перезаписали. Мы потом такой эффект добавили, но уверяю — и без эффекта это звучит сногсшибательно. В первую очередь, наверно, за счёт узнавания. Все, кто брал у одноклассника видеокассеты с боевиками в озвучке Гаврилова, сразу ловят эти флешбэки и тёплые воспоминания.

Пост-продакшн

Пост-продакшн занял около 2-3 недель для каждого голоса

После записи были недели пост-обработки. За это отвечал Стас: чистил и корректировал каждый дубль, настраивал уровень, эквализацию, компрессию. Вы слушаете инструкции навигатора в машине или в динамике телефона при сильном фоновом шуме, поэтому важно, чтобы голос звучал ровно, не был то громким, то тихим (например, в кино звук делают именно таким, для усиления драмы), а настройки частот были оптимальными для окружения.

Для приветственных фраз, которые вы слышите в меню выбора голосов, Стас придумал звуковые эффекты — они погружают в контекст будущего путешествия. Так приветствие Галины Юзефович сопровождают звуки печатной машинки и перелистывания страниц. Под голос Дроздова звучат африканские барабаны, слышен рёв слона. У Академега можно заметить свист тормозов и скрежет ручника.

После мы получили голосовые пакеты на тестирование. Недостаточно отслушать записанные 253 фразы. Важно проверить комбинации. Для этого мы написали тестовый стенд, я упомянул его выше. Эмулятор содержит около 1500 комбинаций. Я лично отслушал их все. Для каждой фразы. Затем то же самое сделал мой коллега Антон Мирошниченко. Я не спрашивал, как у Антона, но лично я теперь слышу по ночам голоса (навигатора 2ГИС).

Первая реакция

Как думаете, кто после релиза оказался в топе по скачиваниям? Не буду говорить, на кого ставил я, но пари я проиграл. Спустя две недели после релиза, места распределились так:

  • Дроздов.
  • Гланц.
  • Гаврилов.
  • Академег.
  • Юзефович.

В комментариях в соцсетях, постах и публикациях в СМИ больше всего внимания предсказуемо досталось Николаю Николаевичу. Многие писали, что вроде бы очевидный, но в тоже время неожиданный выбор. Вспоминали детство и «В мире животных». Судя по комментариям, к цели привлечь в навигатор новых пользователей мы близки. Реакция в духе «ради одного только Дроздова!» — самая частая.

Волну ностальгии и вау-эффект вызвал Андрей Гаврилов. Многие жаждут услышать ту самую цитату из фильма «Кровь и бетон».

Киношный голос Гланца тоже вызвал бурную реакцию и ассоциации с героями блокбастеров.

Факапы

Не без них.

На пост-продакшене тяжелее всего было с паузами — тишиной в начале и в конце каждого файла. У нас был регламент: оставлять по 10 миллисекунд. Оказалось, что ровные паузы звучат неестественно. Казалось бы, разница в несколько миллисекунд, но в длинной фразе слышно. Приходилось после корректировать паузы вручную в каждом файле и проверять, отслушивая фразу в составе предложения.

В голосовом пакете Дроздова и Академега мы промахнулись со скоростью. Всё звучало хорошо, консистентно, с одной скоростью. И красиво звучало! Но«в поле» оказалось, что пока бархатный баритон Николая Николаевича договорит предложение, скажем, «через 150 метров на светофоре круто поверните налево», можно проехать два лишних квартала.

Мы решили ускорить оба пакета целиком на 10-15%. В два клика это не делается: пришлось ускорять сотни файлов вручную, проверять, чтобы звучало хорошо и не было артефактов(щелчков, помех, искажений при ускорении), заново отслушивать тысячи комбинаций. На правки у меня ушло три дня новогодних каникул.

С тональностью всё-таки кое-где промахнулись. Тоже ручная коррекция, проверка на артефакты. Тут мало что можно скорректировать: чуть-чуть пережмешь поправку тона, и голос начинает звучать неестественно, теряет узнаваемость.

Наконец, в случае с Галиной Юзефович мы поняли, что перестарались с пасхалками. Мы намеренно «играли» почти всегда с нейтральными фразами, которые звучат отдельно, не в составе предложения, чтобы приём не стал назойливым. Но здесь решили добавить к манёврам слово «сюжетный». Получился «сюжетный поворот налево», «плавный сюжетный поворот направо» и т.д.

Оказалось, что фишка быстро приедается, так как манёвры звучат несколько десятков раз за поездку. На десятый раз шутка не смешная. К тому же, заметно удлиняет почти каждое голосовое уведомление. Хотя добавили всего одно слово.

Николай Николаевич шлёт привет всем попутчикам 2гис!

Спасибо!

Всем причастным в 2ГИС — их много, но особенно Саше Сыркову, Семёну Кольцову, Тане Денисовой, Антону Мирошниченко, Лере Хам.

Студии CUBIC STUDIO, лично проджект-менеджеру Артёму Никишину и звукорежиссёру Стасу Дмитриеву.

И конечно, Николаю Николаевичу Дроздову, Галине Юзефович, Петру Гланцу, Андрею Гаврилову и Константину Заруцкому.

0
51 комментарий
Написать комментарий...
Роботы

С Гоблином лишь имидж бы себе подпортили и не малый % пользователей отказались бы от услуги. С Дроздовым - попадание в самое "яблочко".

Ответить
Развернуть ветку
Ivan Susanin

А представьте Соловьева или Киселева?))

Ответить
Развернуть ветку
2 комментария
Данила Орлов

Немалый - это какой? Который вышел после фильма про дворец? Или у вас другие претензии к Дим Юричу? 😂

Ответить
Развернуть ветку
1 комментарий
Брат мужа знакомой

Озвучка от Дениса Колесникова (Кураж-Бамбей) норм бы зашла

Ответить
Развернуть ветку
Alexandr Demchenko

После "Через" (и еще в некоторых местах) чересчур большие паузы. Так люди не говорят. Логично, что фразы должны собираться как конструктор, но это легко фиксится, если записывать либо всю фразу целиком, либо тот же "Через" и фонетическое начало следующих потенциальных слов (если приложение уведомляет о двухстах метрах, пятидесяти и ещё скольких-нибудь, достаточно записать "Через с-", "Через д-" и тому подобные. На склейке это будет звучать органичнее).
А в целом — круто! Кастомизация — это хорошо.

Ответить
Развернуть ветку
Ruslan Stepanov

Плюсую. Достаточно неестественные паузы в конструкциях типа "через_двести_метров съезд,_поверните направо", чем грешат и конкурентные навигаторы.

Звуковики и актёры - молодцы, вопрос не к ним. В идеале конечный алгоритм должен не просто проигрывать аудиофайлы в ряд, а сшивать из них на лету цельные предложения с интонационными паузами по контексту. Тогда собственно и несчастным звуковикам не пришлось бы их и подрезать вручную на сотне файлов.

Ответить
Развернуть ветку
Ренат Ренатович
Другая крайность — прописать в грамматике максимум готовых составных фраз, чтобы алгоритм делал меньше склеек, просто доставал из библиотеки целиком записанную фразу. Звучать будет естественнее. Конечно, это нереально. Пришлось бы записывать тысячи(если не десятки тысяч) комбинаций.

Есть ведь здесь умные люди? Подскажите, разве нельзя было на основе записей голоса (плюс может со старых видео подтянуть звук) сгенерировать десятки тысяч комбинаций фраз, не мучая диктора? Deepfake ведь с видео справляется, неужели с аудио сложнее (наверно проще)?

Ответить
Развернуть ветку
Роботы

Склейки вот да, звучат будто на дворе 10-й год. Даже тупые роботы-озвучники, которых всякие стримеры юзают, давно уже на порядок лучше слова клеят. И даже пытаются интонационно и ударениями слова в предложениях выделять.

Ответить
Развернуть ветку
1 комментарий
Профессор Фортран

Даже без нейронных сетей, на классических алгоритмах звучало бы лучше. Но в любом случае нужно не менее 20 часов записанного аудио для качественного звучания. В статье же речь идёт об одном дне, то есть не больше 5-6 часов. Если прямо совсем упороться, то можно и с 5-6 часами сделать лучше, но тогда нужно нанимать программиста с опытом в данной области, то, опять же, резко повышает стоимость проекта. Так что, я думаю, ребята просто определили для себя бюджет и постарались в него уложиться.

Ответить
Развернуть ветку
Bulat Ziganshin

наверно проще. вот только deepfake - это результат работы учёных в области ML, так что пока подобных алгоритмов для звука нет, этот вариант невозможен

Ответить
Развернуть ветку
4 комментария
Владимир Дрим

нет, в стократ сложнее, у нас индустрия по визуальному  df полумертвая, про звук говорить пока вообще не приходится.

Ответить
Развернуть ветку
Ivan Susanin

Молодцы! Переманивайте активно народ с Apple CarPlay на свой навигатор с Яндекса, пока те тупят с выкатом карплейной версии

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Ант Ант

Есть 

Ответить
Развернуть ветку
i h8ers

помню как мой сын услышал голос Николая Дроздова, когда  он поздравил его с днем рождения!  Это стоило моих усилий, чтобы договориться с ним

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Пётр Радищев

Гаврилов классный. 
Дроздов милый)  

Ответить
Развернуть ветку
Мария Масленникова

Дроздов как всегда - очаровательный няш-мяш)

Ответить
Развернуть ветку
Денис Седов

А с «Олегом» озвучки не будет !?) Молодцы, хорошая работа 💪🏼

Ответить
Развернуть ветку
ilia

"в Александре Гудкове не сомневались. Дикая популярность, голос не спутаешь. Однако стоимость записи оказалась на порядок выше наших ожиданий" - ну и славно, хоть где-то не будет Гудка,который из каждого утюга...И актера (или лучше "актера"?) Петрова.

Тех же "попсовиков" из 90-х - начала нулевых можно было если брать "по известности голоса" - Жуков, рыжий из "Иванушек") За последнее десятилетие мало голосов и вообще лиц, которые не просто широко известны "в моменте", а помнятся - в том числе и голос.

Можно тех же "кубиков" с 18+ версией: едешь такой и тебе "е*ушки-воробушки - пробка!")

Ответить
Развернуть ветку
Евгения Радыгина

Надо было моргенштерна позвать

Ответить
Развернуть ветку
nabokin

Наконец-то первая годная статья за весь день) спасибо.

Ответить
Развернуть ветку
Михаил Анюков

"Кинокомпания «Двойной Джис» представляет кинокартину «Маршрут построен»." Это потрясающе))

Ответить
Развернуть ветку
Александр Вербицкий

Это все интересно, но зачем вы это делали???

Ответить
Развернуть ветку
Jackzavr

в статье написано, в самом начале даже!

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Роботы

Так почти так и есть. Блохеры всякие, чёрт-те кто. Сама игра уныль, ещё и эта братия добавила свой гвоздь в крышку гроба.

Ответить
Развернуть ветку
1 комментарий
Ренат Ренатович
У нас был регламент: оставлять по 10 миликесунд. Оказалось, что ровные паузы звучат неестественно. Казалось бы, разница в несколько милисекунд, но в длинной фразе слышно. Приходилось после корректировать паузы вручную в каждом файле и проверять, отслушивая фразу в составе предложения.

А если в файлах вообще убрать паузы и добавлять их программно при генерации фразы? Так ведь гораздо проще регулировать?

Ответить
Развернуть ветку
Alexandr Demchenko

Некоторые комбинации слов всегда проговариваются слитно, а некоторые — раздельно. Мне кажется, вы правы, что можно пробовать алгоритмизировать, добавив ряд исключений. Владельцу этого продукта в 2гис предстоит интересная работа :)

Ответить
Развернуть ветку
Денис Семенов

На микрофон наверно?

Ответить
Развернуть ветку
Арина Тарбокова

Спасибо, классное дополнение разработали! Но... почему в статью не добавили образцы записи фраз Петра Гланца(Иващенко)? Всех, кроме него, вставили (

Ответить
Развернуть ветку
Shlomo Goldenberg

Дроздов и Гаврилов ок. И вполне "мемные". Остальные понятия не имею кто такие 

Ответить
Развернуть ветку
Biggymen

Оооо,это будет не плохо!)))

Ответить
Развернуть ветку
Alex Ondre

ДубльГис ёпта, какой ДваГис.

Ответить
Развернуть ветку
Killer

Гаврилова знаю, Дроздова знаю, остальных не знаю  и они говно.

Ответить
Развернуть ветку
Smirnov

Задумка не новая, но в действительности думаю будет работать и сыграет в плюс. И озвучка от Гудкова - хорошая идея!) или Безрукова, Хабенского, но вот это конечно будет дорого и не понятно насколько оправдано

Ответить
Развернуть ветку
Мурад Валитов

Установил бета-версию 2GIS, чтобы пользоваться в Android Auto для отображения на навигатора непосредственно на дисплее авто. В принципе, пользоваться удобно, но есть некоторые моменты:
1. Набор адреса неудобный, т.к. вылезает алфавит в строчку, а не в виде привычной клавиатуры, но чисто случайно обнаружил, что оказывается есть голосовой ввод через Гугл Ассист (наверное)
2. Не часто, но бывает что вылетает или просто зависает. Приходится маршрут строить заново.
3. В частном секторе маршрут ведёт какими-то козьими тропами, через переулки, маленькие улицы,а не по основной дороге
4. По городу время в пути до конечной точки немного занижает, это на старте маршрута, в пути уже более реальное время показывает
5. Недавно ездил за 350 км, включил Яндекс Навигатор и 2GIS, сравнить. Маршрут построили одинаковый, 2GIS обещал на 20-30 мин раньше приехать. 2GIS не всегда корректно показывает ограничение скорости, например, говорит что 60км/ч, а по факту там уж давно 90км/ч. Поэтому бывает сидишь думаешь, то ли действительно знак проглядел, то ли 2GIS врёт.
6. О камерах, о разметке, т.е. с какой полосы куда ехать - в этом плане всё норм.
7. Ради интереса поставил голос Гаврилова, но через 3 дня как-то сильно надоел.
8. И да, подтверждаю, паузы по фразах неестественные, в Яндекс Навигаторе на слух приятнее звучит.
9. Зум карты стандартной крутилкой в авто не делается, нужно переставлять курсор либо на "-", либо на "+" и нажимать на них.

Ответить
Развернуть ветку
Николай Комаревцев

Стало явно веселее)

Ответить
Развернуть ветку
Лорис Селиверстов

Почему-то каждый раз умиляюсь видеть Дроздова. Некая ностальгия) 

Ответить
Развернуть ветку
John Fima

А голос Бузовой будет?

Ответить
Развернуть ветку
Ivan Ivanov

Молодцы проделали такую работу ! Вопрос к Вам, на улице 2022 год, когда ждать НОРМАЛЬНУЮ штатную озвучку ? То, что есть, уж извините, только начало пути (раздражает десятки моментов), уже почти год жду когда допилите .

Ответить
Развернуть ветку
48 комментариев
Раскрывать всегда