Может ли ИИ, не зная вкуса яблока, понять нашу тоску по детству?

Мы уже привыкли к мысли, что нейросети умеют писать как люди. Иногда лучше, иногда хуже. Но вот вопрос, которым задались ученые: роботы думают словами так же, как мы?

Может ли ИИ, не зная вкуса яблока, понять нашу тоску по детству?

Или нейросети просто красиво жонглируют символами, не подозревая, что за ними стоит мир, боль, запах кофе и странная тоска по детству?

«Яблоко» как вектор: нейросеть против человеческого опыта

Что мы с вами думаем о слове «яблоко»? Вспоминая его кисло-сладкий вкус, вес в ладони, восковой отблеск на кожуре. У нас вполне может возникнуть воспоминание из детства: яблоня у бабушки, каникулы, теплый летний воздух, мечты…

Для большой языковой модели слово «яблоко» — это вектор, точка в многомерном пространстве, соседствующая с «грушей», «плодом» и, с некоторой вероятностью, с Ньютоном и айфоном.

Учёные из Университета Осаки решили проверить это через цифры. Они взяли 695 слов, которые дети осваивают в раннем возрасте.
Примеры: «Мяч». «Мама». «Бежать».
И попросили людей и языковые модели оценить их по параметрам вроде: конкретность, образность, социальность, уровень восприятия, ощущения.

Результат? В целом — похоже. Модели угадывают, что яблоко — предмет, любовь — абстракция.

Да, ИИ, анализируя терабайты текста, может выявить, что слово «жужжать» часто соседствует с «пчела», «колебания», «приборы», он установит корреляцию.
Но ИИ недоступна магия образности и символичности. Для человека «жужжание» может вызвать целую палитру образов и чувств: вязкий зной, сонное марево над лугом, сладкая тяжесть в воздухе. Мы тонем в этом звуке, узнаём его, как тёплую густоту лета, как мёд, ещё не собранный, но уже сладкий в горле.

Пропасть в деталях: как ИИ не чувствует «но»

Но дальше ещё интереснее. Нейросети всегда ставят «низкую оценку» предлогам и союзам.

Для нас, людей, «из-за» — это целая драма, обида, причина неудачи. Для ИИ это служебный токен с низкой конкретностью, механика связи, лишенная травматического опыта.

Казалось бы, мелочь. Но какая огромная разница между «я люблю тебя» и «я люблю тебя, но»?

Почему ИИ всё равно похож на нас? Ответ в нашем языке

Да, нейросеть может: правильно оценить «яблоко» как конкретное, встроить в красивый абзац, и даже написать про детство в деревне у бабушки. Но она не знает, что яблоко бывает тёплым от солнца. Что иногда оно пахнет осенью. Что иногда — это первое, что ты съел после суток апатии и отчаяния.

Но даже без тела, ощущений и опыта, модели всё равно воспроизводят значительную часть человеческих семантических интуиций.

Почему?

Мы веками кодировали в язык телесность, социальность, страх, удовольствие, власть и любовь. ИИ, читая этот многотысячелетний «дневник человечества», учится не миру, а его отражению в наших словах.
Он блестяще воспроизводит карту, но не чувствует территории. И в этом — главная граница между искусственным интеллектом и живым разумом.
Источник вдохновения: Techcrunch.

1
Начать дискуссию