GPT-4o, o1 и Claude не смогли выполнить «большинство» реальных фриланс-задач на программирование — исследование OpenAI
Больше всех на платформе для фрилансеров Upwork «заработал» бы Claude 3.5 Sonnet.
- Исследователи отобрали более 1400 задач на программирование с американской фриланс-биржи Upwork. Выполнив их все, можно было бы заработать $1 млн.
- В тесте участвовали модели GPT-4o, o1 и Claude 3.5 Sonnet — они «заработали» $304 тысячи, $380 тысяч и $403 тысячи соответственно.
- Исследование включало разные инженерные задачи на исправление ошибок в коде и разработку функций стоимостью от $50 до $32 тысяч. Также были более сложные управленческие задачи, в которых нужно было выбрать наилучшие решения, представленные фрилансерами. Во втором случае все модели справились лучше.
- На основе исследования OpenAI представила бенчмарк SWE-Lancer для оценки навыков ИИ-моделей на реальных инженерных задачах. Компания предполагает, что такой подход позволит исследовать экономическое влияние искусственного интеллекта на рынок труда.
А быстрее всех «умерла» GPT-4o.
С каждым днем растут страхи и сомнения относительно законов масштабирования ИИ. Большинство предсказателей отрасли ИИ утверждают об окончании законов масштабирования, которые за последние несколько лет привели к мгновенному улучшению возможностей крупных языковых моделей (LLM). К ним присоединились журналисты, вооружившись неопределенной информацие…
Все мы понимаем, что сейчас идет трансформация рынка рекламы. Какие то источники трафика становятся неактуальными, что-то выходит из строя, а что-то вовсе блокируют или запрещают.
Claude 3.7 Sonnet, выпущенный в феврале 2025 года, представляет собой значительное обновление в линейке моделей Anthropic. Давайте рассмотрим его ключевые особенности и сравним с другими решениями на рынке.
Anthropic выпускает новую ИИ модель под названием Claude 3.7 Sonnet. Расскажу, зачем вообще модели думать (и особенно – долго).
Появление каждой новой модели вызывает огромный интерес и ожидания. Недавнее обновление для DeepSeek v3, предлагающее, ну мягко говоря, очень доступный API, стало поводом для пристального изучения его возможностей и сравнения с признанными лидерами отрасли. Последние представленные результаты тестирования MMUL-Pro, GPOA, AIME и LiveCodeBench, особе…
Сегодня OpenAI выпустили новую модель GPT-4.5, а вместе с ней и технический отчет. Давайте узнаем, что улучшилось в GPT-4.5 по сравнению с предыдущими моделями компании.
они «заработали» $304 000, $380 000 и $403 000 соответственноРазработчики Авито и Сбера
Для замены Вадима не нужна нейросеть, достаточно Акинатора.
Заголовок как будто негативит на ИИ, но если вдуматься - лучший ИИ заработал 400к$ из миллиона, то есть можно считать, что рынок программирования на фрилансе уже отрубился почти в 2(!) раза, а нейронки еще могут потенциально развиваться в дальнейшем...
отрубился почти в 2(!) разаТак как все теперь используют ИИ, стоимость заказов падает, а их количество растёт, как при любом падении цены
Думаю, что в деньгах общий рынок вырастет, но теперь без ИИ выполнять заказы конкурентно будет невозможно.
раньше легкие заказы перехватывали индусы, сейчас будут перехватывать индусы с чатгпт. Какая разница?