Робохроники ИИ: нейросеть предсказывает структуру белков, TikTok ворует голос, а Tesla путает Луну со светофором

Ежемесячно команда RDL by red_mad_robot рассказывает про новости, кейсы и подходы в ИИ, которые можно переложить на нашу действительность и реально использовать. Главное за июль уже тут.

TikTok украл голос актрисы

TikTok в центре скандала — актриса озвучивания Беверли Стэндинг подала в суд на компанию. Она утверждает, что в приложении незаконно используется ее голос, который был синтезирован с помощью ИИ.

Что случилось? Несколько лет назад актриса озвучивала аудиофрагменты для Китайского государственного института акустики. В конце 2020-го она обнаружила свой голос в функции TikTok text-to-speech, с помощью которой озвучивается написанный в видео текст. Стэндинг заявила, что не давала согласия на синтез и использование своего голоса.

Беверли Стэндинг Beverly Standing, <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.telegraph.co.uk%2Ftechnology%2F2021%2F05%2F09%2Fvoice-tiktok-sues-company-emotional-distress%2F&postId=278538" rel="nofollow noreferrer noopener" target="_blank">The Telegraph</a>
Беверли Стэндинг Beverly Standing, The Telegraph

В иске утверждается, что TikTok не только не заплатил, но и не уведомил актрису об использовании ее голоса для функции преобразования текста в речь. Также в некоторых видеороликах, которые Стэндинг якобы «озвучивает», звучат «нецензурные и оскорбительные выражения», что наносит «непоправимый вред» ее репутации.

Более того, рекламы брендов в TikTok тоже пользовались голосовым преобразованием текста в речь. Это значит, что голосом актрисы могли пользоваться и в коммерческих целях.

Беверли Стэнлинг поддержали коллеги — актеры озвучивания пожертвовали около 7000 долларов на ее судебные расходы и под хэштегом #StandingWithBev опубликовали видео в TikTok, рассказывая пользователям об этом инциденте.

Почему это важно? Это серьезный прецедент — такое клонирование голоса может оставить актеров озвучивания без работы. Компании могут купить у актера 30 минут записи его голоса, а потом просто «забрать» его себе.

На сегодняшний день законы, защищающие людей от несанкционированного клонирования их голосов, находятся в зачаточном состоянии. В своем иске Стэндинг ссылается на право на гласность — оно дает людям возможность контролировать коммерческое использование своего образа и голоса.

Голосовые фейки могут привести и к серьёзному мошенничеству. В 2019 году в Великобритании злоумышленники использовали ПО на основе ИИ, чтобы сымитировать голос исполнительного директора британской энергетической компании и дать сотруднику этого предприятия поручение о переводе третьим лицам €220 тысяч. В таком случае применимо уголовное право, но основная проблема обычно заключается в том, что найти таких мошенников очень трудно.

На сегодняшний день технологии дипфейков развиваются быстрее, чем технологии их обнаружения и законодательство для регулирования их создания. Именно голосовые дипфейки представляют собой самую большую проблему, потому что на голос человека не распространяется право собственности ни в одной стране мира — если только имя человека не зарегистрировано как коммерческий бренд.

Законодательная инициатива движется в сторону закрепления ответственности за введение людей в заблуждение с помощью дипфейк-технологий. При этом возможность ее использования в художественных и пародийных произведениях должна быть сохранена.

В России использование чужой речи для создания голоса «как у другого человека» в явном виде не запрещено законодательством. Сама по себе имитация голоса, например, телефонными пранкерами, тоже не является нарушением и зависит от содержания, которое как раз может попасть под уголовную ответственность. Кроме этого, не до конца решен вопрос подпадают ли голосовые дипфейки под законодательство об авторских и смежных правах на фонограммы и актерское исполнение.

Правовая реальность в РФ — это отсутствие единого проработанного законодательного регулирования. В зависимости от случая применяться могут нормы разных уровней — от Конституции и Федеральных законов до правовых позиций Конституционного суда и писем Роскомнадзора

Юлия Синицына, руководитель юридического отдела red_mad_robot

AlphaFold снова в деле

После потрясающего научного прорыва в биологии (мы подробно писали об этом в итогах 2020-го), нейросеть AlphaFold, созданная DeepMind, спрогнозировала самую полную на сегодняшний день карту белков человека. Компания бесплатно опубликовала данные, которые ученые сравнивают с результатами «Генома человека» — международного проекта по картированию каждого человеческого гена.

The Verge
The Verge

Напомним, в чем суть. Белки — это длинные цепочки аминокислот, соединенные пептидной связью. Они выполняют множество задач в организме: от создания тканей до борьбы с болезнями.

Предназначение белка продиктовано его структурой, которая сворачивается в сложные неправильные формы. А понимание того, как он это делает, объясняет его функцию. Что, в свою очередь, помогает ученым в решении ряда задач: от проведения фундаментальных исследований работы организма до разработки новых лекарств и методов лечения.

Почему предсказать сворачивание белка трудно? В организме человека существуют 20 различных видов цепочек аминокислот. И поскольку любой белок может состоять из сотен отдельных аминокислот, каждая из которых может складываться и скручиваться в разных направлениях, конечная структура молекулы обладает невероятно большим количеством возможных конфигураций.

Считается, что, типичный белок можно свернуть десятью в трехсотой степени способами — это единица, за которой следует триста нулей.

Предсказание белковых структур с помощью ИИ действительно очень полезно. Определение структуры белка экспериментальными методами — дело весьма дорогое и трудоемкое. Так что даже маловероятный прогноз может сэкономить ученым годы работы, указав им правильное направление для исследований.

Что же сделал DeepMind? На сегодняшний день в открытом доступе около 180 тысяч белковых структур, каждая из которых создана экспериментальными методами. DeepMind спрогнозировал структуры около 350 тысяч белков 20 различных организмов, включая мышей и плодовых мушек, а также бактерии: например, кишечную палочку.

Что наиболее важно, в этом прогнозе есть 98% всех человеческих белков. А это около 20 тысяч различных структур, которые в совокупности известны как «Протеом человека». Это не первый общедоступный набор данных о человеческих белках, но его по праву считают наиболее полным и точным.

Спрогнозированные AlphaFold структуры белка The Verge
Спрогнозированные AlphaFold структуры белка The Verge

Все полученные данные DeepMind предоставляет бесплатно. При этом известно, что лаборатория ежегодно теряет немало денег. Из-за этого в прессе периодически всплывают сообщения о напряженности между ней и материнской компанией Google Alphabet, которая вкладывает огромные ресурсы в коммерческие проекты в области здравоохранения.

ИИ помогает следить за Олимпиадой

Omega, официальный хронометрист Олимпийских игр с 1932 года, теперь использует компьютерное зрение и датчики движения для отслеживания соревнований по плаванию, гимнастике и пляжному волейболу.

Так, четыре года Omega потратила на обучение собственного искусственного интеллекта по отслеживанию хода игры в пляжный волейбол.

С чего все началось? Еще в 1948 году на Олимпиаде в Лондоне Omega совместно с Race Finish Recording Company представила первую камеру с фотоэлементом Magic Eye. Но к этой технологии относились с осторожностью и даже в течение следующих 20 лет на Играх все еще пользовались механическими хронометрами.

Камера с фотоэлементом Magic Eye WIRED, OMEGA
Камера с фотоэлементом Magic Eye WIRED, OMEGA

С тех пор компания занимается разработкой способов мониторинга соревнований в режиме реального времени — в 2012 году на Олимпийских играх в Лондоне Omega представила квантовый таймер с разрешением в одну миллионную секунды, что в 100 раз больше, чем у устройств предыдущего поколения.

Компания Omega потратила четыре года на обучение собственного искусственного интеллекта «игре» в пляжный волейбол WIRED, GETTY IMAGES
Компания Omega потратила четыре года на обучение собственного искусственного интеллекта «игре» в пляжный волейбол WIRED, GETTY IMAGES

Как работает система на примере пляжного волейбола? «Мы используем камеры с технологиями компьютерного зрения, чтобы отслеживать не только спортсменов, но и мяч», — говорит Ален Зобрист, глава Omega Timing.

Разработчики обучили ИИ распознавать траекторию полета мяча и множество типов ударов — от пасов до блоков. Затем программа объединяет это с информацией, полученной с гироскопических датчиков на одежде игроков. Эти датчики позволяют системе узнать направление движения спортсменов, а также высоту их прыжка и скорость.

По словам Алена Зобриста, главная сложность для ИИ — отслеживание мяча в игре в моменты, когда тот пропадает из поля зрения камер. Алгоритм должен предсказать, куда летит мяч, а затем, когда он появится снова, пересчитать промежуток времени с момента, когда он потерял его, до возвращения в кадр. Потом заполнить недостающие данные и автоматически продолжить наблюдение.

Omega Timing утверждает, что благодаря датчикам и нескольким камерам, работающим со скоростью 250 кадров в секунду, ее система пляжного волейбола обладает точностью в 99%. При этом важно, чтобы во время работы на Олимпиаде программа одинаково точно различала пол и расу спортсменов.

Братцы-роботы

Голландская компания TechTics представила робота, который собирает окурки на пляже. Прототип BeachBot (сокращенно BB) использует ИИ, чтобы лучше искать использованные сигаретные фильтры, даже если они частично засыпаны песком.

Робохроники ИИ: нейросеть предсказывает структуру белков, TikTok ворует голос, а Tesla путает Луну со светофором

Окурки на пляже — это вредно? Очень! Фильтры сигарет заполнены микропластиком. Когда вода попадает на выброшенные окурки, фильтры выщелачивают более 30 химикатов, которые очень токсичны в том числе для водных организмов. При этом ежегодно в окружающую среду попадает около 4,5 триллионов окурков. Согласно исследованию бразильских ученых, проведенному в 2019 году, именно фильтры, разложение которых занимает около 14 лет, стали «наиболее частым типом личных вещей, обнаруживаемых на пляжах».

В итоге, Эдвин Бос и Мартин Лукарт, соучредители TechTics решили создать робота, который мог бы не только убирать окурки, но и самостоятельно их находить. Для этого компания привлекла к работе студентов Делфтского технологического университета в Нидерландах.

Как работает ВВ? Чтобы научить бота находить «добычу», требуются данные. Много данных. Нужно показать роботу, и, в частности, его системе ИИ, тысячи фотографий окурков в разных состояниях, чтобы он мог их распознать и запомнить.

Чтобы собрать эти фотографии, Бос и его команда обратились к приложению Microsoft Trove. Обычные люди отправляют фотографии окурков на пляже, получая по 25 центов за изображение. Так алгоритм и обучается.

Что еще произошло в области робототехники в июле?

  • Facebook AI, Калифорнийский университет в Беркли и Университет Карнеги-Меллона разработали новую модель передвижения роботов Rapid Motor Adaptation (RMA) — она позволяет им адаптироваться к любой местности и обстоятельствам в режиме реального времени.
Благодаря ИИ четвероногий робот Unitree Robotics может перемещаться по различным поверхностям Источник: WSJ
Благодаря ИИ четвероногий робот Unitree Robotics может перемещаться по различным поверхностям Источник: WSJ
  • Toyota Research Institute научил роботов делать домашние дела и управляться со стеклянными предметами. При этом у робопомощников нет лидаров и камер глубины — только пара самых обыкновенных камер. А модель, с помощью которой робот понимает пространство, обучена на синтетических данных. Кстати, в прошлом выпуске «Робохроник» Юрий Чайников, руководитель RDL by red_mad_robot, рассказал о преимуществах синтетических данных на примере Tesla.
  • На Олимпийских играх 2020 в Токио зажглась новая звезда — робот-баскетболист. Он бросает трехочковые лучше олимпийской сборной США.

Чтиво выходного дня

И вдогонку к новости об украденном голосе предлагаем изучить весьма любопытный материал МТИ о развитии рынка ИИ-голосов. Речь в нем идет о лицензированных синтетических голосах, которые практически невозможно отличить от реальных человеческих. А если читать уже не хочется, то на тему DeepFakes можно посмотреть (или послушать) один из вебинаров, в котором приняли участие юристы red_mad_robot и команда RDL by red_mad_robot.

Весьма интересную работу опубликовали исследователи из Франции и России — в ней говорится об использовании управляемых ИИ текстовых генераторов (например, GPT-3) и их «вкладе» в науку. Ученые пришли к выводу, что это создает так называемый «замученный язык» (англ. tortured language). Суть в том, что часто статьи, написанные ИИ, ссылаются на несуществующие источники и не несут в себе научной истины.

Источник: Unite.ai
Источник: Unite.ai

Что бы такого еще почитать? Например, свежий отчет CB Insights о гонке технологических компаний за доминирование на ИИ-рынке. Спойлер: Apple впереди планеты всей, а NLP, ретейл и медтех — наиболее популярные направления ИИ-стартапов в 2021-м.

Или колонку ведущего специалиста «Яндекса» Андрея Себранта о перспективах развития рынка беспилотников. Он уверен, что «мы раньше начнем обгонять беспилотные фуры на дальних трассах за рулем личного автомобиля, чем прокатимся по этим дорогам, развалившись на заднем сиденье беспилотной легковушки или беспилотного такси».

Одной строкой

  • Компания BytePlus («дочка» ByteDance) продает доступ к алгоритмам TikTok.
  • Tencent использует в своих играх технологии распознавания лиц для отслеживания геймеров-детей, играющих по ночам — в Китае лицам младше 18 лет запрещено играть в компьютерные игры с 22:00 до 8:00.
  • «Яндекс.Ровер» и GrubHub запускают доставку еды в 250 американских университетских кампусах.
  • Минздрав и «Ростех» создали федеральную ИИ-платформу, которая откроет ИТ-разработчикам доступ к обезличенным медицинским данным из электронных медицинских карт россиян.
  • Google впервые использовал представленную на Google I/O нейросеть MUM — с ее помощью «за несколько секунд» поисковик научился отвечать на запросы о вакцинах на 50 языках. «Ручное» обучение заняло бы сотни часов.
  • «Русал» внедрил ИИ-систему контроля на производстве — нейросеть автоматически проверяет качество поверхности малогабаритной алюминиевой чушки.
  • Sber AI зарегистрировала патент по распознаванию и анализу объектов в VR. С помощью технологии сотрудники «Сбера» обучили нейросеть писать программный код и создали первую зарегистрированную в России программу, написанную ИИ.
  • Nvidia представила новый генератор лиц Alias-Free GAN, который еще больше, чем StyleGAN2, подходит для создания видео и анимации.

Беспилотники (да-да, опять!)

  • В четырех регионах России до конца этого года запустят беспилотное такси.
  • «Яндекс» опубликовал крупнейший в мире массив данных беспилотников для исследований в области машинного обучения.
  • Ford запускает беспилотное такси в приложении Lyft в Майами и Остине в США.
  • Mobileye тестирует беспилотники на дорогах общего пользования в Нью-Йорке.
  • Hyundai в тестовом режиме запускает беспилотный общественный транспорт RoboShuttle в Южной Корее.
RoboShuttle Hyundai
RoboShuttle Hyundai
  • «Лаборатория Касперского» разработала систему видеоаналитики, распознающую объекты на изображениях с беспилотных дронов.

Fun AI

Tesla опять разочаровывает владельцев — если в прошлый раз автомобиль сошел с ума из-за фуры со светофорами, то теперь система автопилота спутала Луну с жёлтым сигналом светофора. И каждые несколько секунд снижала скорость.

Водители Tesla пожаловались на работу автопилота — бортовая система принимает луну за жёлтый свет светофора и автоматически снижает скорость

Восстание машин пока откладывается 🌚

Если понравилось или не понравилось, пишите в комментариях. Ведь без обратной связи робота не переобучить. Самые свежие новости про ИИ и не только в нашем Telegram-канале Redmadnews. Всем ИИ!

1919
3 комментария

Очень классный обзор! Спасибо. 

1

Хочу им голос не отличимый от настоящего для игры, чтобы он говорил с правильно проставленной интонацией, ударениями и дикцией на разных языках, можно разные для разных языков и чтобы бесплатно.