Код, графика и подсчёт букв в словах: как полная версия модели o1 от OpenAI справляется с запросами пользователей

Модель должна рисовать, работать с текстом и программировать «лучше», чем её предшественница GPT-4o. В заметке — несколько примеров.

Источник: Reuters
Источник: Reuters

Пользователь соцсети X рассказал, что загрузил в чат-бота ChatGPT схематичный рисунок дата-центра. Модель за десять секунд провела расчёты для его охлаждения в космосе, используя первый закон термодинамики.

В другом примере o1 воссоздала композицию картины в ответ на запрос «Как можно точнее повтори изображение в [формате векторной графики]».

Для сравнения пользователь дал ту же задачу Claude и GPT-4o. Вот результаты:

Нейросеть также написала код для пользовательского интерфейса меньше чем за 15 минут — на основе рукописных инструкций из комикса.

Пользователь сказал o1, что не умеет программировать, и попросил дать «чёткие инструкции». Модель прислала код, рассказав, как писала его сама и как его можно запустить — пошагово. Claude не смог сразу выдать готовый код.

Другой пользователь предложил продвинутой модели o1-pro такой запрос: «Напиши стихотворение о количестве букв r в слове strawberry, но не используй слово strawberry или букву r».

Для обозначения клубники модель использовала метафоры — например, «поцелованное солнцем пьянящее наслаждение», — и правильно указала, что в английском слове три буквы r. GPT-4 отвечала, что их две.

Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fx.com%2F__nmca__%2Fstatus%2F1864739625140654469%3Fs%3D46&postId=1693943" rel="nofollow noreferrer noopener" target="_blank">Nat McAleese</a>
Источник: Nat McAleese

Исследователь из OpenAI Ноам Браун показал, как o1-pro написала эссе про клубнику на три абзаца, не используя слова с буквой e. Она заменила слово strawberry на латинское название fragaria ananassa.

Источник: Noam Brown
Источник: Noam Brown

GPT-4o не справилась с задачей и использовала слово strawberry в первой же строчке.

Источник: Noam Brown
Источник: Noam Brown

Автор блога Denis Sexy IT Денис Ширяев попросил o1-pro выполнить похожее задание, но на русском языке: «Напиши рассказ про букву "е", не используя букву "е"». Одна всё-таки «проскочила».

Источник: Denis Sexy IT
Источник: Denis Sexy IT

В другом примере модель смогла определить, какой вид белка описал пользователь — по параметрам его структуры.

Источник: Nathan Benaich
Источник: Nathan Benaich
  • OpenAI выпустила полную версию модели o1 5 декабря 2024 года (ограниченную представили в сентябре). Компания называет её «самой "умной"» из уже вышедших у неё. При тестировании OpenAI считала, что модель справилась с запросом, только если она давала правильный вариант «в четырёх из четырёх случаев».
  • о1 доступна подписчикам Plus за $20 в месяц и нового плана Pro за $200. Первым — с ограничениями по количеству запросов. Вторым — без. Доступ к продвинутой версии o1-pro дали только владельцам Pro.

Если уже протестировали o1 и o1-pro — поделитесь впечатлениями в комментариях.

1313
44
11
11
11
50 комментариев

Посоветуйте хорошие курсы курьеров.

17
4

Не верь инфоцыганам, которые уверяют, что после полугодового курса, ты легко найдёшь работу курьером.
Самообразование — наше всё. И вообще надо было устраиваться на стажировку курьерскую с 3го курса.

4

Он и разрулить физику для четких пацанов может

18
1

Вы все еще думаете, что это будет помощник в работе, а не ваша замена

6

Да, это помощник

5

Тестировали.

Лучшая схема ai SWE - это human-in-the-loop. Просто чем умнее модель, тем больше можно сделать этот круг.

Да, работа больше превращается в определение методологии и отслеживание архитектуры.

2

Конечно, ИИ ещё не настолько совершенен, чтобы справляться с задачами без человеческого контроля. В кризисных ситуациях, когда нужно принимать нестандартные решения и учитывать множество факторов, он пока что не может заменить человека.