Когда старший научный сотрудник Yahoo, защищал докторскую диссертацию, он прошел курсы лингвистики и машинного обучения. Сочетание этих двух факторов помогло ему разработать способы представления человеческого языка таким образом, чтобы его понимали сложные вычислительные системы. Цель проекта Yahoo News Annotated Comments Corpus - поощрять дальнейшие лингвистические и психосоциальные исследования онлайн-взаимодействий, а также разработку новых моделей взаимодействия с чат-ботами. В этих проектах задействовано невероятное количество технической смекалки, однако есть место для лингвистических навыков и человеческого взаимодействия. Некоторые задачи просто не подходят для машины и требуют тонкого понимания человеком. «Если мы хотим, чтобы компьютеры достигли того же уровня навыков для получения новой информации, то стоит начать с моделирования того, как люди общаются, от человека к человеку, и как они получают новую информацию, просто разговаривая. Итак, без каких-либо технических способностей, пока вы можете привнести в роль это тонкое человеческое понимание, вы можете добиться успеха», - говорит Аасиш Паппу, старший научный сотрудник в Yahoo.