Тестирует ли OpenAI GPT-4.5? "gpt2-chatbot" пишет код лучше, чем GPT-4 и Клод от Илона Маска
Новая мощная модель ИИ под названием "gpt2-chatbot" демонстрирует возможности, которые, похоже, находятся на уровне GPT-4 или даже выше. Рассуждаем о недавнем ажиотаже вокруг этой модели.
Модель, названная "gpt2-chatbot", появилась без особой шумихи на LMSYS Org Chatbot Arena, сайте, где сравниваются языковые модели ИИ. Однако ее производительность быстро привлекла внимание тестировщиков.
Например, gpt2-chatbot с первой попытки решил задачу из престижной Международной математической олимпиады, которую он назвал "безумно сложной".
По словам Итана Моллика, профессора Уортонской школы, модель лучше, чем GPT-4 Turbo, справляется со сложными задачами, такими как написание кода. Чейз Маккой, инженер-основатель CodeGen, сказал, что gpt2-chatbot "определенно лучше справляется со сложными задачами по работе с кодом, чем Claude Opus или последний GPT4. Он лучше справился со всеми заданиями по кодированию, которые мы используем для тестирования новых моделей".
Ещё пример из Твиттера: Альваро Кинтас сгенерировал игру "Змейка" с первой попытки.
GPT-4.5 или что-то совершенно другое?
Высокая производительность и подсказки о токенизаторе, используемом OpenAI, позволяют предположить, что gpt2-chatbot может исходить от OpenAI и быть тестом GPT-4.5 или другой новой модели от компании. LMSYS подтвердила, что также позволяет поставщикам моделей тестировать их анонимно. Модель также описывает себя как ChatGPT и "основана на GPT-4".
Однако самоописания моделей ИИ не всегда достоверны, и некоторые тестеры сообщают о большем количестве галлюцинаций, чем GPT-4 Turbo. Генеральный директор OpenAI Сэм Альтман отреагировал на слухи постом на сайте X: "У меня есть слабое место для gpt2". В общем, хотя сходство с предыдущими творениями OpenAI наводит на мысль о возможной связи, убедительных доказательств пока нет.
Так что не исключено, что менее известная группа выпустила модель, чтобы продемонстрировать свои возможности и привлечь внимание.
Резюме
На арене чатботов LMSYS.org появилась новая мощная модель ИИ под названием "gpt2-chatbot". По словам пользователей, в некоторых областях она демонстрирует способности, превосходящие возможности GPT-4.
Модель решила сложную математическую задачу с первой попытки и, по мнению некоторых, показывает лучшие результаты, чем GPT-4 или Anthropics Claude в программировании.
Судя по сходству с предыдущими моделями OpenAI, есть предположение, что gpt2-chatbot может быть тестом для GPT-4.5 или новой моделью OpenAI.
ps. Комментируйте и лайкайте, пожалуйста! Это помогает продвижению статьи.
Ну и как положено, канал тг))) Канал и чатик
Там в закрепленном боты KolerskyAi для генерации видео в Stable Video, а так же для доступа в Chat GPT+4 и Dalle-3, Midjourney без VPN и другие нейросети.