Новая ИИ-система переводит зрительные образы из мозга в текст — исследователи поднимают вопрос о ментальной приватности
Учёные разработали метод, позволяющий ИИ составлять подробные текстовые описания того, что человек видит или вспоминает — только по активности его мозга. Технология использует функциональную МРТ (fMRI) и работает без имплантов.
Метод получил неофициальное название ментальные субтитры (mind captioning). Он сочетает в себе языковые модели и нейровизуализацию и используется, чтобы расшифровывать то, как мозг человека воспринимает визуальные сцены — и превращать это восприятие в осмысленные предложения. Исследование опубликовано в журнале Science Advances.
Сначала ИИ обучают на базе видеороликов с текстовыми описаниями. Каждый ролик преобразуется в числовую смысловую подпись — своего рода цифровую выжимку его значения. Затем система сопоставляет эти сигнатуры с паттернами активности мозга у добровольцев, которые смотрят видео в МРТ-сканере.
Когда обучение завершено, система получает новое изображение мозга — и на его основе угадывает смысловую подпись, которую затем преобразует в текст.
Пример из эксперимента: человек смотрит видео, где кто-то прыгает с водопада. На десятой попытке ИИ предлагает фразу: “прыжок над бурным водопадом”, а на сотой — “человек прыгает с высокого водопада на горном хребте”.
Что особенно важно — ИИ смог описывать не только сцены, которые человек наблюдал в момент сканирования, но и те, которые он вспоминал. Это говорит о том, что мозг использует схожие механизмы для восприятия и памяти, и ИИ может их улавливать.
На практике такие технологии могут помочь людям с нарушениями речи или моторики — например, после инсульта. Неинвазивные нейроинтерфейсы могли бы переводить ментальные образы в текст и помогать в коммуникации.
В отличие от предыдущих методов, новая система способна улавливать не просто ключевые слова, а полноценные действия, объекты и связи между ними — вплоть до сложных смыслов. Это делает её шагом ближе к распознаванию внутреннего мышления.
Разработчики подчёркивают: текущее поколение технологий не может читать мысли без добровольного участия человека. Алгоритмы требуют индивидуальной настройки, и работать с “чужим” мозгом они не способны.
Тем не менее, как отмечают исследователи, по мере развития подобных систем встаёт вопрос: какие именно границы ментальной приватности должны быть защищены — и как? Речь не только о технологических ограничителях, но и об этических и юридических рамках.
Пока “чтение мыслей” остаётся научной метафорой, но направление уже задано: от внешних интерфейсов — к всё более глубокой интеграции с внутренним миром человека.
Как вы думаете, в каких областях найдут применение подобные технологии? И хотели ли бы вы, чтобы ваши мысли можно было так легко читать?