Алексей Свищев

+46
с 2016
1 подписчик
26 подписок

Всегда думал, что если человек без рук и мозгов, то он не меняет мир под себя, а живет на его дне.
Что изменится, если без рук и мозгов будет целое поколение? Что оно изменит? Что оно умеет делать?
Не случится ли так, что это подрастающее особо "одаренное" поколение, просто спустит все позиции, завоеванные умными, рациональными, приземленными, трудолюбивыми родителями. Ведь в мире миллиарды людей, готовых окровавленными пальцами выдирать себе место под солнцем . . .

Читаю и не вижу мяса. Одни фантазии и гигантские прибыли в придуманном мире по придуманным правилам.
Главный посыл - "дети и внуки . . . "

7

Причем тут распил? Других слов не знаете? Команда исследователей делает технологию синтеза речи (вообще делает, для различных проектов, не только Сбера). Это был вызов для команды (эта задача). В мире пока не существует систем клонирования голоса высокого качества, особенно когда материал для обучения системы качества низкого и синтезировать нужно экспрессивную (насыщенную эмоциональную) речь. Справились быстро и, насколько я понимаю, успешно.
Попросить актера нельзя было. У него голос изменился уже сильно. У людей вообще голос с возрастом меняется. Это проблема и биометрических голосовых систем.
Откуда столько негатива?

Проекты, подобные Боровому в Питере есть на Крестовском. Цены от миллиона евро за квартиру (но и квартиры от 100 квадратов). Качественная архитектура, адекватные соседи (имущественный ценз) + развитая инфраструктура везде будет дорого стоить.

И насколько быстро разница в стоимости обслуживания окупает разницу в стоимости между таким зданием и традиционным?

1

Емкость модели больше, чем объем тренировочных данных.
Еще первую GPT критиковали за то, что она "вспоминала" данные (дополняла текст открывком из обучающих данных).
Это трансформер по архитектуре. На них хайп проходит. По сути, это крутой поисковик по обучающим данным.
GPT - 4 будет графовой сетью, скорее всего завязанной на графовые базы знаний, и она будет уже реальные reasoning делать.

7

GPT-2 настолько емкая сеть, что она просто выучила весь датасет . . .

Голос в телефонном канале обычно крайне низкого качества. Обучать на таком TTS - сомнительно.

Мы постоянно так балуемся при разработке. Тут же люди еще обернули это все в визуальный интерфейс (поделка уровня 3го курса). Это баловство. Тупиковый вариант. Интересный эффект при добавлении нового эмбеддинга по образцу в мультиспикерной системе. Тема активно продвигается - быстрое добавление нового диктора в TTS, но такой способ ущербен. Много артефактов, к тому же он частично воспроизводит только тембр голоса. Манера речи, дефекты - не передаются.

Хорошая система биометрии снабжается системой антиспуфинга. Синтез - один из видов атак, причем не самый сложный (даже самый продвинутый). Просто не пройдет. К тому же качество синтеза в предложенной системе не ахти. Они просто мультиспикерную TTS обучили, обусловленную на эмбеддинги спикеров (векторы признаков голоса) и новых спикеров добавляют, получаю новый эмбеддинг из образца. Это плохо работает. Есть ситемы voice conversion, они лучше работают. Но там не синтез, а конверсия конкретной записи с голосом одного диктора в такую же запись с голосом другого. Хотя ничего не мешает сначала синтезировать одним голосом, а потом провести конверсию в другой (образец).

1

Настоящая жизнь - "Сварщик варит без краг - голыми руками" . . . .

17

Судя по количеству лайкой и дизлайков оппонента, а также лицам, совершившим это, становится совершенно очевидно, кто тут бот.

3

"Знание математики", "классический ML" ... Основы статистики, ито для галочки, немного алгебры. Python и несколько пакетов: pandas, numpy, sklearn, xgboost, bokeh. Иногда что-нибудь специфическое данным в задаче. Все. Тупик профессионального развития. 95% таких задач почти полностью автоматизируются. Причем велосипед изобретают все компании и потом продают его под видом "прорывного решения". Сделать это может аккуратный студент - стажер. Некоторое время назад, основным победителем ml - конкурсов (по содержанию похожих на такие кейсы) был офис менеджер, который просто автоматизировал основные этапы обработки данных и собирал по 100-500 моделей в композицию. Чтобы провести реально глубокую экспертизу и разработать хорошее решение нужна команда и время, а это дорого. И не везде это умеют. Особенно, когда "штат за год удваивать" надо.

12

Ну и где нормальные комментарии? Аналитика. Оценка последствий? Одни эмоции и бред. А Сбер при этом потихоньку становится самым технологичным банком мира и в активы соотвествующие инвестирует.

Молодцы, ребята! Дизайн крут) Жесткий индастриал, неубиваемый вечный пепелац на колесах. Могу только пожелать удачи.

1

Вся статья звучит как основание для возбуждения нескольких уголовных дел. Таких "предпренимателей" нам не надо. Куда человеческий капитал направляется . . .

Нельзя оценивать такие игры. Аудитория уже на пике, игра уже надоедает и через год потеряет половину (если не больше), кому она такая нужна? Это актив, который уже теряет стоимость.

У Яндекса, Гугла все алгоритмы расчитаны на высокую нагрузку. Максимально упрощены. Сети квантованы. Тот же поиск по картинкам у Гугла до недавнего времени вообще был на полносвязной сети построен. Небольшие компании предоставляют нишевые решения, с повышенным качеством. Гугл не может себе позволить обрабатывать запросы в том же DialogFlow чем-то тяжелым, а небольшая компания, ориентированная на запрос с высокой стоимостью ошибки, может. Не все так фатально. ИИ же развивают небольшие команды, университеты, стартапы.

1

Алексей, ИИ современный - это большой набор различных задач автоматизации, за которые раньше браться было нерентабельно или технологически невозможно. А кейс, в котором ИИ должен понять, когда передать управление человеку, вообще крайне сложен. Это целая отдельная область науки.

5

Мой тоже лепит и рисует с кайфом. А я его на шахматы, робототехнику, бассейн, карате . . .
Пусть все лепят и рисуют . . .
Это какая-то эпидемия лепления и рисования. Хотя, если посмотреть на современные материалы, приблуды, каналы на ютубе, то я тоже в детстве с таким набором бы лепил и рисовал.

Когда только 2 компании в мире получают прибыль от производства и продажи смартфонов, неудивительно, что Гугл отказывается от таких проектов.

1

Правильно все делают.
Сейчас полный расчет покажут и отложат идею до "лучших времен".
Частично реализуют. Часть трафика снимать будут.

2

И ведь не проверишь их прогнозы. Не докажешь и не опровергнешь. Причем выезжают на "научности". А заключение министра - еще один кирпичек из под стены его профессиональной компетенции.