Код, графика и подсчёт букв в словах: как полная версия модели o1 от OpenAI справляется с запросами пользователей

Модель должна рисовать, работать с текстом и программировать «лучше», чем её предшественница GPT-4o. В заметке — несколько примеров.

Пользователь соцсети X рассказал, что загрузил в чат-бота ChatGPT схематичный рисунок дата-центра. Модель за десять секунд провела расчёты для его охлаждения в космосе, используя первый закон термодинамики.

Код, графика и подсчёт букв в словах: как полная версия модели o1 от OpenAI справляется с запросами пользователей

В другом примере o1 воссоздала композицию картины в ответ на запрос «Как можно точнее повтори изображение в [формате векторной графики]».

Для сравнения пользователь дал ту же задачу Claude и GPT-4o. Вот результаты:

Нейросеть также написала код для пользовательского интерфейса меньше чем за 15 минут — на основе рукописных инструкций из комикса.

Запрос из комикса: «Когда пользователь делает снимок, приложение должно проверить, находится ли он в национальном парке и изображена ли на фотографии птица». Источник: Ethan Mollick

Пользователь сказал o1, что не умеет программировать, и попросил дать «чёткие инструкции». Модель прислала код, рассказав, как писала его сама и как его можно запустить — пошагово. Claude не смог сразу выдать готовый код.

Другой пользователь предложил продвинутой модели o1-pro такой запрос: «Напиши стихотворение о количестве букв r в слове strawberry, но не используй слово strawberry или букву r».

Для обозначения клубники модель использовала метафоры — например, «поцелованное солнцем пьянящее наслаждение», — и правильно указала, что в английском слове три буквы r. GPT-4 отвечала, что их две.

Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fx.com%2F__nmca__%2Fstatus%2F1864739625140654469%3Fs%3D46&postId=1693943" rel="nofollow noreferrer noopener" target="_blank">Nat McAleese</a>

Исследователь из OpenAI Ноам Браун показал, как o1-pro написала эссе про клубнику на три абзаца, не используя слова с буквой e. Она заменила слово strawberry на латинское название fragaria ananassa.

GPT-4o не справилась с задачей и использовала слово strawberry в первой же строчке.

Автор блога Denis Sexy IT Денис Ширяев попросил o1-pro выполнить похожее задание, но на русском языке: «Напиши рассказ про букву "е", не используя букву "е"». Одна всё-таки «проскочила».

В другом примере модель смогла определить, какой вид белка описал пользователь — по параметрам его структуры.

OpenAI выпустила полную версию модели o1 5 декабря 2024 года (ограниченную представили в сентябре). Компания называет её «самой "умной"» из уже вышедших у неё. При тестировании OpenAI считала, что модель справилась с запросом, только если она давала правильный вариант «в четырёх из четырёх случаев».
о1 доступна подписчикам Plus за $20 в месяц и нового плана Pro за $200. Первым — с ограничениями по количеству запросов. Вторым — без. Доступ к продвинутой версии o1-pro дали только владельцам Pro.

Если уже протестировали o1 и o1-pro — поделитесь впечатлениями в комментариях.

#chatgpt #openai #новости

50 комментариев

High Stakes

6 дек

Посоветуйте хорошие курсы курьеров.

Ответить

Jack Brown

Не верь инфоцыганам, которые уверяют, что после полугодового курса, ты легко найдёшь работу курьером.
Самообразование — наше всё. И вообще надо было устраиваться на стажировку курьерскую с 3го курса.

Паувек-челух

Он и разрулить физику для четких пацанов может

Андрей

Вы все еще думаете, что это будет помощник в работе, а не ваша замена

Programmer

Да, это помощник

Denis Kiselev

Тестировали.

Лучшая схема ai SWE - это human-in-the-loop. Просто чем умнее модель, тем больше можно сделать этот круг.

Да, работа больше превращается в определение методологии и отслеживание архитектуры.

Alexey Bragin

Конечно, ИИ ещё не настолько совершенен, чтобы справляться с задачами без человеческого контроля. В кризисных ситуациях, когда нужно принимать нестандартные решения и учитывать множество факторов, он пока что не может заменить человека.