Даже если у нас есть данные, наш алгоритм все еще может извлечь ложные шаблоны и создать глупые рецепты. Представим, что у нас есть следующий учебный набор данных: Южная Африка — страна, бегемот — животное, лягушка — животное, Российская Федерация — страна, кошка — животное, Северная Ирландия — страна, енот — животное, Южная Корея — страна, Новая Зеландия — страна, бабочка — животное, жираф — животное.
"Давай сначала разберемся, откуда ты знаешь о том, что Канада — это страна. Кто-то в твоем детстве рассказал тебе данный факт, и ты его запомнил."
- не так, человеческий мозг провел ассоциации "Канада-СССР 0:0" или "Канада граничит с США" и классифировал это название как название страны.
ИИ сможет найти географический термин в строке "привет Андрей, берёза расцвела и порт в Португалии", но до ассоциативного ряда он никогда не разовьётся, это тупиковая ветвь.