Презентация
серверов от Acer
До начала осталось:
Смотреть
Machine learning
red_mad_robot

Робохроники ИИ: нейросеть радует «хороших мальчиков», алгоритмы отслеживают эмоции, а у роботособак появились руки

Мы решили переквалифицироваться из дайджеста в робожурнал. Поэтому теперь ежемесячно команда Redmadrobot Data Lab будет рассказывать про новости, кейсы и подходы в ИИ, которые можно переложить на нашу действительность и реально использовать. В этом выпуске — главное за февраль.

Rolls-Royce, ИИ и реактивные двигатели

Немецкое подразделение Rolls-Royce Holdings PLC оснащает своих аэрокосмических инженеров инструментами ИИ, чтобы ускорить процесс проектирования и тестирования реактивных двигателей.

Аналитический отдел компании предложил эту инициативу, поскольку надеется, что модели машинного обучения смогут анализировать исторические данные и данные о реактивных двигателях в реальном времени.

Зачем? Подобная технология, созданная с помощью инструментария компании Altair Engineering Inc., повысит точность и скорость тестирования и в перспективе может принести весьма значительную выгоду. Ведь, по данным Rolls-Royce, разработка и испытание реактивного двигателя могут занять до 10 лет и стоить сотни миллионов долларов.

ИИ поможет «поиграть собой»

Исследователи из Китая разработали алгоритм MeInGame, с помощью которого можно создавать 3D-модели персонажа по фото.

А затем эти модели можно загрузить в ААА-игры (высокобюджетные компьютерные игры — прим.). То есть теперь вместо долгого и сложного перетаскивания ползунков можно просто использовать, например, свою фотографию.

Существующие системы создания персонажей обычно ограничены в возможностях: у игрока есть ряд готовых наборов лица и фигуры, а также несколько вариантов их кастомизации. Классические методы, основанные на 3D Morphable Face Model (3DMM), могут достаточно точно восстанавливать 3D-модели лица из изображений. Но эти методы требуют долгого обучения и серьёзных ресурсов.

В то время как MeInGame позволяет не только просто и недорого создавать ярких игровых персонажей, похожих на загруженное фото, и при этом и нивелировать влияние освещения.

ИИ знает, что вы чувствуете

Специалисты Лондонского университета Королевы Мэй научили нейросеть автоматически интерпретировать человеческие эмоции без распознавания лиц. Она сканирует людей с помощью радиосигналов и улавливает эмоциональные скачки, например, изменения в сердцебиении.

Алгоритм может обнаруживать страх, отвращение, радость и расслабление с точностью до 71%. Это, конечно же, далеко от идеала, но всё равно выглядит достаточно впечатляюще. Для сравнения: традиционные алгоритмы машинного обучения дают правильные предположения лишь в 40% случаев

Маленький, но гордый обучаемый объект от Google

Google Creative Lab представила проект под названием Alto — A Little Teachable Object. Он создан для того, чтобы пользователи могли получить базовые знания о машинном обучении, а работает он с помощью Coral USB Accelerator.

У Alto есть одна кнопка, «руки» и камера. Первая «рука» поднимается, когда распознает один вид объекта, а вторая — когда узнает другой. А вот распознавать объекты Alto учит пользователь.

По словам команды Google Creative Lab, Alto — это ИИ-эксперимент с открытым исходным кодом. Пользователи смогут поработать с платформой TensorFlow и Raspberry Pi. Стоить эта малютка будет 60 долларов, а код можно найти на Google Creative Lab.

Кто здесь «хороший мальчик»?

Исследователи из Университета Колорадо решили попробовать силы в дрессировке собак и разработали автоматический дозатор лакомств с алгоритмами машинного обучения.

Это нейронная сеть на NVIDIA Jetson Nano с камерой и механизмом выдачи лакомства. Модель обучена на изображениях собак, которые выполняют команды «сидеть», «стоять» и «лежать». Если собака все сделала правильно, аппарат это фиксирует и в режиме реального времени передает сигнал о «поощрении». Дозатор открывается, а пёсик получает лакомство.

Может ли эта система пригодиться где-то еще?

Есть такая книга «Не рычите на собаку». Одна из ключевых идей в ней — все живые существа подвержены дрессировке и, по сути, всю жизнь и занимаются дрессировкой. Как бы ни цинично прозвучало, технологии «большого брата» позволяют совершенствовать управление миллиардами индивидуумов. В частности, перейти от технологий массового применения к технологии воспитания человека мелкими поощрениями и наказаниями, что уменьшит риск тяжких преступлений.

Но это, конечно же, фантазии и размышления.

Юрий Чайников

руководитель Redmadrobot Data Lab

Легализация беспилотного автотранспорта

Россия, Франция, Бельгия, Финляндия, Люксембург, Португалия, Швейцария и Швеция инициировали пересмотр Конвенции о дорожном движении 1968 года.

Сейчас этот документ запрещает использовать беспилотники на дорогах, поскольку в нем сказано, что контроль над транспортным средством должен осуществлять человек. Искусственный интеллект, естественно, там не упоминается.

mag.auto.ru

Россия и европейские государства предлагают модифицировать документ таким образом, чтобы в него вошло понятие «автоматизированной системы вождения»: контроль за дорогой, управление автомобилем, планирование и оповещение о маневрах.

TensorFlow понимает 3D

Google выпустила фреймворк для обработки 3D-данных с помощью машинного обучения, TensorFlow 3D (TF 3D).

Эта технология может обрабатывать данные с любых 3D-датчиков, будь то лидары, камеры измерения глубины или радары. По сути, TF 3D — это набор операций, функций, инструментов обработки данных, моделей и показателей, которые позволят исследователям разрабатывать, обучать и развертывать модели понимания трехмёрных сцен.

В настоящее время Tensorflow 3D поддерживает Waymo Open, ScanNet и Rio. Но пользователи могут конвертировать и другие наборы данных, например, NuScenes и Kitti в аналогичный формат и использовать их в уже существующих конвейерах, а также могут использовать TF 3D для широкого спектра исследований и приложений глубокого обучения 3D.

Tensorflow 3D поможет системам машинного обучения работать в реальном мире и улучшать эффекты дополненной реальности на мобильных устройствах. А руководитель Redmadrobot Data Lab Юрий Чайников считает, что «Ключевая область, в которой прогресс популярного фреймворка Tensorflow в 3D направлении ускорит темпы разработки, — это создание полностью автономного транспорта. Это революция почище перехода с конной тяги к автотранспорту, на пороге которой мы стоим».

Наши руки не для скуки

Иногда кажется, что достижения в области ИИ неприменимы в жизни. Ну вот какая практическая польза от нейросети, которая может собирать пазлы? А такую нейронную сеть, JigsawGAN, недавно представили исследователи из Института инженеров электротехники и электроники (IEEE). Она основана на методе GAN.

Нейросеть не знает исходного изображения, она анализирует информацию о краях частей картинки и семантическую информацию о генерируемых изображениях, что помогает собирать пазлы более точно.

Так как же эта возможность может пригодиться в обычной жизни?

Эффективные алгоритмы стыковки соседних снимков очень полезны при массовом применении в картографических сервисах. От построения ортофотопланов местности на основе автоматической съемки с дронов и заканчивая автоматическим построением 3D-моделей местности в каждую миллисекунду при совершенствовании алгоритмов автоматического управления транспортом.

Юрий Чайников

руководитель Redmadrobot Data Lab

Со сборкой пазлов разобрались. На очереди нейросеть, имитирующая игру человека в шахматы, — Maia. Она использует алгоритмы, лежащие в основе лучших шахматных программ. Но вместо «уничтожения» противника на доске Maia пытается предсказать и повторить поведение человека в игре. Даже если ход заведомо ошибочен.

Джон Кляйнберг, профессор Корнельского университета, руководивший разработкой Maia, говорит, что это первый шаг к разработке ИИ, который постарается понять, почему люди совершают ошибки. Значит, в перспективе ИИ сможет лучше взаимодействовать с людьми, например, обучать их, помогать, или даже вести с ними переговоры.

По словам Кляйнберга, одно из возможных применений Maia — это система здравоохранения. ИИ, который предвидит ошибки, может быть использован для обучения врачей или помощи в обнаружении неточностей.

Maia была разработана с использованием кода, адаптированного из Leela Zero, клона Alpha Zero от DeepMind.

Во многих областях человеческой деятельности, особенно в антагонистических играх, связанных с конкуренцией, оптимальным поведением является не идеальное, которое направлено на совершенного противника, а такое поведение, которое учитывает несовершенство человеческой психики. Ярчайший пример — игра «Камень, ножницы, бумага».
В математическом смысле это игра с нулевой суммой, в которой лучшая стратегия — случайный ход. Но человек не может генерировать идеальные случайные ходы, и против любого конкретного человека можно подобрать выигрышную стратегию, учитывающую особенности его не совсем случайного поведения. В реальной жизни лучше учитывать слабости противника.

Юрий Чайников

руководитель Redmadrobot Data Lab

И последний в этом блоке — система Audeo, которая создает музыку из беззвучного видео с музыкантом, играющим на фортепиано. Достаточно лишь загрузить ролик в программу, а она выдаст готовый звук.

Как это работает? Сначала система преобразует видео с движениями рук музыканта по фортепиано в необработанное механическое музыкальное символическое представление Piano-Roll (Roll). Обрабатывается каждый кадр, на котором есть клавиши и нажатие на них.

Затем Roll, включая временные корреляции, адаптируется для аудиосинтеза. Это критически важный шаг для генерации звука.

На последнем этапе подключаются Midi-синтезаторы для создания реалистичной музыки. Audeo плавно конвертирует видео в аудио с несколькими ограничениями настройки.

В узком смысле, это полезно для улучшения качества звука. Если мы натренировали нашу нейросеть на примерах виртуозной игры со звуком и выразительностью, близкой к гениальному исполнению, то можем применить ее к менее совершенному исполнению музыки обычными людьми и повысить качество исполнения на слух.

Представьте, как здорово было бы, если подобный алгоритм на лету улучшал качество устной речи? Исключал бы всякие слова-паразиты, нелепые «э-э-э»? А авторы сделали шаг в этом направлении.

В широком смысле, исследователи, разрабатывая методы и подходы в попытках синтезировать один тип контента по другому типу контента, перекрестно «опыляют» друг друга. Придумали, как оформить концепцию внимания в NLP, немедленно получили прирост качества не только текстовых алгоритмов, но и в обработке звуков, фото и так далее. Так и тут. Придумают новые подходы к переводу с одного нечеткого языка «видео» на другой нечеткий язык «звук».

Юрий Чайников

руководитель Redmadrobot Data Lab

Одной строкой

  • Amazon планирует установить высокотехнологичные камеры в свои фургоны доставки;
  • Visa запустила сервис VisaNet + AI — ряд услуг на базе ИИ, которые решают некоторые проблемы банков;
  • «Россети» собирается мониторить состояние ЛЭП с помощью беспилотников;
  • Spotify хочет запатентовать технологию, которая сможет предлагать песни на основе анализа ваших эмоций, пола, возраста и даже акцента;
  • Huawei внедряет ИИ на свинофермы;
  • Законодательная комиссия Великобритании планирует регулировать использование дипфейков в связи с учащением случаев интернет-буллинга и порно-мести с лицами жертв;
  • Ученые из Эстонии обучили систему ИИ генерировать дипфейковые человеческие ДНК. Подробнее можно послушать в подкасте журнала «Код».

Чтиво выходного дня

Как российские спасатели, экологи и таможенники могут использовать ИИ? Нашли ответ на этот вопрос в лонгриде CNEWS.RU.

Что еще почитать? Например, совместный опрос MIT Technology Review Insights и Siemens Energy. Они пообщались с десятком CIO нефтегазовых компаний, чтобы понять, как ИИ влияет на корпоративные стратегии цифровой трансформации и кибербезопасности.

Внимание, спойлер: нефтегазовые компании вынуждены адаптироваться к резким изменениям, оптимизируя свою работу с помощью цифровых технологий. При этом по мере перехода к цифровым технологиям повышается риск киберугроз, что создаёт новые возможности для ИИ.

Fun AI

Есть ли руки у собак? Да, если это роботособака Spot от Boston Dynamics! Помотрите-ка на неё:

Благодарим аналитический центр Redmadrobot за помощь в подготовке материала.

Если понравилось или не понравилось, пишите в комментариях. Ведь без обратной связи робота не переобучить. Самые свежие новости про ИИ и не только в нашем Telegram-канале. Всем ИИ!

{ "author_name": "red_mad_robot", "author_type": "editor", "tags": ["\u0440\u043e\u0431\u043e\u0445\u0440\u043e\u043d\u0438\u043a\u0438","\u043d\u0435\u0439\u0440\u043e\u0441\u0435\u0442\u0438","\u0438\u0438","\u0431\u0435\u0441\u043f\u0438\u043b\u043e\u0442\u043d\u0438\u043a\u0438","\u0430\u043b\u0433\u043e\u0440\u0438\u0442\u043c\u044b","rollsroyce","redmadrobot","google","bostondynamics","ai"], "comments": 5, "likes": 22, "favorites": 24, "is_advertisement": false, "subsite_label": "ml", "id": 213857, "is_wide": true, "is_ugc": false, "date": "Fri, 26 Feb 2021 16:37:53 +0300", "is_special": false }
0
5 комментариев
Популярные
По порядку
8

Спасибо за подборки. Считаю их недооцененными.

Ответить
0

Спасибо, приятно слышать. Может есть какой-то секрет, который мы не знаем)

Ответить
3

Секрета нет. Подборки обычно хуже читают, чем материалы. Так как тратите ресурсы все равно, я бы предложил попробовать раскрывать конкретную тему и делать разные материалы. Нейросеть такая, продукт такой. 

Ответить
3

За гифку — лайк сразу 

Ответить
2

Но дома на колесах нравятся больше?

Ответить

Комментарии

null