Эксперимент инженеров: робот учится человеческой мимике, наблюдая за собой и за людьми

Роботы давно научились говорить, но по-прежнему плохо справляются с одной из самых важных частей человеческого общения — мимикой. Даже у продвинутых роботов с лицами движения губ выглядят неестественно, из-за чего речь воспринимается как «неживая». Команда инженеров из Columbia Engineering предложила другой подход: вместо жёсткого программирования они научили робота двигать лицом так же, как это делают люди — через наблюдение и подражание.

Эксперимент инженеров: робот учится человеческой мимике, наблюдая за собой и за людьми

Исследование, опубликованное в журнале Science Robotics, описывает робота с гибким лицом и 26 приводами, отвечающими за движения губ и мимики. Вместо того чтобы заранее задавать правила, какие моторы и как должны работать при произнесении звуков, исследователи позволили роботу сначала изучить собственное лицо.

На первом этапе робот наблюдал за своим отражением в зеркале. Он выполнял тысячи случайных движений губ и выражений лица и сопоставлял работу моторов с тем, как меняется его внешний вид. Таким образом система научилась понимать, какие движения приводят к каким визуальным результатам. Это дало базовое представление о собственном «лице» — аналог того, как человек в детстве учится управлять мимикой.

После этого робот начал смотреть видео с людьми, которые разговаривают и поют. Он не знал смысла слов и не понимал язык, но анализировал связь между звуками и движениями губ. Совместив модель собственного лица с наблюдением за человеческой речью, система научилась напрямую переводить аудиосигнал в движения моторов, синхронизируя звук и мимику.

Именно этот подход — обучение через наблюдение, а не через правила — и оказался ключевым. В отличие от традиционных систем, где движения лица заранее заданы и потому выглядят механическими, здесь робот сам находит соответствие между звуком и жестом. В результате движения становятся более плавными и близкими к человеческим, пусть пока и не идеальными. Исследователи отмечают, что сложные звуки, вроде «B» или «W», всё ещё даются хуже, но качество улучшается по мере обучения.

Руководитель проекта Ход Липсон подчёркивает, что мимика — это не второстепенная деталь, а важный канал коммуникации. Человек может простить роботу неловкую походку или странные движения рук, но ошибки в лице воспринимаются гораздо острее. Именно поэтому даже говорящие роботы часто кажутся неестественными.

По мнению исследователей, способность корректно двигать губами становится особенно важной в тех сферах, где роботы взаимодействуют с людьми напрямую: в образовании, медицине, уходе за пожилыми и сфере обслуживания. Без мимики такие устройства остаются функциональными, но плохо воспринимаются эмоционально.

Авторы работы подчёркивают, что технология требует осторожного применения. Более убедительная мимика делает взаимодействие с роботами приятнее, но одновременно усиливает эмоциональную вовлечённость. Поэтому, по их словам, важно развивать такие системы постепенно и осознанно, понимая, как именно они будут использоваться.

Тем не менее сам принцип уже обозначен достаточно чётко: чтобы робот выглядел и воспринимался как «живой», ему не нужно прописывать лицо по инструкции. Гораздо эффективнее дать ему возможность смотреть — на себя и на людей — и учиться так же, как учится человек.

Как вам такие функции первых человекоподобных роботов? Восхищает или вызывает отторжение?

3
Начать дискуссию