Но главный вопрос заключается в том, как системы искусственного интеллекта могут извлекать больше информации из меньшего количества данных, а не просто генерировать огромные объемы синтетических данных для обучения. Альтман говорит, что было бы "очень странно", если бы лучшим способом обучения модели было "сгенерировать примерно квадриллион токенов синтетических данных и ввести их обратно".
Я еще даже GPT-4 не опробовала