Весь процесс обучения модели можно представить как малую долю, не более 1%, от общего процесса. Но именно эта последняя фаза, «дообучение на живых людях», является ключевым моментом, который придал последним моделям GPT удивительные возможности. Весьма интересно, что GPT-3 уже обладала всем необходимым знанием: понимание различных языков, знание исторических событий, умение распознавать стили разных авторов и т.д. Однако только благодаря обратной связи от людей модель научилась использовать эти знания именно так, как мы считаем правильным. В некотором смысле, GPT-3.5 - это модель, воспитанная обществом.