{"id":14287,"url":"\/distributions\/14287\/click?bit=1&hash=1d1b6427c21936742162fc18778388fc58ebf8e17517414e1bfb1d3edd9b94c0","title":"\u0412\u044b\u0440\u0430\u0441\u0442\u0438 \u0438\u0437 \u0440\u0430\u0437\u0440\u0430\u0431\u043e\u0442\u0447\u0438\u043a\u0430 \u0434\u043e \u0440\u0443\u043a\u043e\u0432\u043e\u0434\u0438\u0442\u0435\u043b\u044f \u0437\u0430 \u0433\u043e\u0434","buttonText":"","imageUuid":""}

Евгений Вилков

8 мая в 20:27 8 мая

Тестирует ли OpenAI GPT-4.5? "gpt2-chatbot" пишет код лучше, чем GPT-4 и Клод от Илона Маска

Новая мощная модель ИИ под названием "gpt2-chatbot" демонстрирует возможности, которые, похоже, находятся на уровне GPT-4 или даже выше. Рассуждаем о недавнем ажиотаже вокруг этой модели.

Модель, названная "gpt2-chatbot", появилась без особой шумихи на LMSYS Org Chatbot Arena, сайте, где сравниваются языковые модели ИИ. Однако ее производительность быстро привлекла внимание тестировщиков.

Я бы согласился с оценками, что это как минимум уровень GPT-4

Эндрю Гао, исследователь ИИ из Стэнфордского университета

Например, gpt2-chatbot с первой попытки решил задачу из престижной Международной математической олимпиады, которую он назвал "безумно сложной".

По словам Итана Моллика, профессора Уортонской школы, модель лучше, чем GPT-4 Turbo, справляется со сложными задачами, такими как написание кода. Чейз Маккой, инженер-основатель CodeGen, сказал, что gpt2-chatbot "определенно лучше справляется со сложными задачами по работе с кодом, чем Claude Opus или последний GPT4. Он лучше справился со всеми заданиями по кодированию, которые мы используем для тестирования новых моделей".

Ещё пример из Твиттера: Альваро Кинтас сгенерировал игру "Змейка" с первой попытки.

GPT-4.5 или что-то совершенно другое?

Высокая производительность и подсказки о токенизаторе, используемом OpenAI, позволяют предположить, что gpt2-chatbot может исходить от OpenAI и быть тестом GPT-4.5 или другой новой модели от компании. LMSYS подтвердила, что также позволяет поставщикам моделей тестировать их анонимно. Модель также описывает себя как ChatGPT и "основана на GPT-4".

Однако самоописания моделей ИИ не всегда достоверны, и некоторые тестеры сообщают о большем количестве галлюцинаций, чем GPT-4 Turbo. Генеральный директор OpenAI Сэм Альтман отреагировал на слухи постом на сайте X: "У меня есть слабое место для gpt2". В общем, хотя сходство с предыдущими творениями OpenAI наводит на мысль о возможной связи, убедительных доказательств пока нет.

Так что не исключено, что менее известная группа выпустила модель, чтобы продемонстрировать свои возможности и привлечь внимание.

Резюме

На арене чатботов LMSYS.org появилась новая мощная модель ИИ под названием "gpt2-chatbot". По словам пользователей, в некоторых областях она демонстрирует способности, превосходящие возможности GPT-4.

Модель решила сложную математическую задачу с первой попытки и, по мнению некоторых, показывает лучшие результаты, чем GPT-4 или Anthropics Claude в программировании.

Судя по сходству с предыдущими моделями OpenAI, есть предположение, что gpt2-chatbot может быть тестом для GPT-4.5 или новой моделью OpenAI.

ps. Комментируйте и лайкайте, пожалуйста! Это помогает продвижению статьи.

Ну и как положено, канал тг))) Канал и чатик

Там в закрепленном боты KolerskyAi для генерации видео в Stable Video, а так же для доступа в Chat GPT+4 и Dalle-3, Midjourney без VPN и другие нейросети.

1.5K показов

287 открытий

Комментарии

Написать комментарий...

-3 комментариев

Раскрывать всегда