Может ли ИИ, не зная вкуса яблока, понять нашу тоску по детству?
Мы уже привыкли к мысли, что нейросети умеют писать как люди. Иногда лучше, иногда хуже. Но вот вопрос, которым задались ученые: роботы думают словами так же, как мы?
Или нейросети просто красиво жонглируют символами, не подозревая, что за ними стоит мир, боль, запах кофе и странная тоска по детству?
«Яблоко» как вектор: нейросеть против человеческого опыта
Что мы с вами думаем о слове «яблоко»? Вспоминая его кисло-сладкий вкус, вес в ладони, восковой отблеск на кожуре. У нас вполне может возникнуть воспоминание из детства: яблоня у бабушки, каникулы, теплый летний воздух, мечты…
Для большой языковой модели слово «яблоко» — это вектор, точка в многомерном пространстве, соседствующая с «грушей», «плодом» и, с некоторой вероятностью, с Ньютоном и айфоном.
Учёные из Университета Осаки решили проверить это через цифры. Они взяли 695 слов, которые дети осваивают в раннем возрасте.
Примеры: «Мяч». «Мама». «Бежать».
И попросили людей и языковые модели оценить их по параметрам вроде: конкретность, образность, социальность, уровень восприятия, ощущения.
Результат? В целом — похоже. Модели угадывают, что яблоко — предмет, любовь — абстракция.
Да, ИИ, анализируя терабайты текста, может выявить, что слово «жужжать» часто соседствует с «пчела», «колебания», «приборы», он установит корреляцию.
Но ИИ недоступна магия образности и символичности. Для человека «жужжание» может вызвать целую палитру образов и чувств: вязкий зной, сонное марево над лугом, сладкая тяжесть в воздухе. Мы тонем в этом звуке, узнаём его, как тёплую густоту лета, как мёд, ещё не собранный, но уже сладкий в горле.
Пропасть в деталях: как ИИ не чувствует «но»
Но дальше ещё интереснее. Нейросети всегда ставят «низкую оценку» предлогам и союзам.
Для нас, людей, «из-за» — это целая драма, обида, причина неудачи. Для ИИ это служебный токен с низкой конкретностью, механика связи, лишенная травматического опыта.
Казалось бы, мелочь. Но какая огромная разница между «я люблю тебя» и «я люблю тебя, но»?
Почему ИИ всё равно похож на нас? Ответ в нашем языке
Да, нейросеть может: правильно оценить «яблоко» как конкретное, встроить в красивый абзац, и даже написать про детство в деревне у бабушки. Но она не знает, что яблоко бывает тёплым от солнца. Что иногда оно пахнет осенью. Что иногда — это первое, что ты съел после суток апатии и отчаяния.
Но даже без тела, ощущений и опыта, модели всё равно воспроизводят значительную часть человеческих семантических интуиций.
Почему?
Мы веками кодировали в язык телесность, социальность, страх, удовольствие, власть и любовь. ИИ, читая этот многотысячелетний «дневник человечества», учится не миру, а его отражению в наших словах.
Он блестяще воспроизводит карту, но не чувствует территории. И в этом — главная граница между искусственным интеллектом и живым разумом.
Источник вдохновения: Techcrunch.