Исследование: оценка автоматизации удалённой работы с помощью ИИ
Современные ИИ-агенты обеспечивают уровень автоматизации не более 2,5%. Некоторых такой заголовок вводит в заблуждение...))
Тут как раз речь о доле проектов, которые ИИ-агенты смогли выполнить под ключ на уровне человека или лучше!
Про отчёт:
✦ Бенчмарк RLI включает 240 проектов с фриланс-платформ (Upwork) для оценки эффективности ИИ
✦ В основном задачи по дизайну, документации, анимации, анализу данных, разработке и т.п.
✦ ИИ заработали $1810 из возможных $143 991 (общая оценка проектов)
✦ Проанализировано более 6000 часов реальной работы
✦ Для оценки использовалось ручное сравнение с эталонными работами людей
Рейтинг агентов по % автоматизации:
✦ Manus: 2.5%
✦ Grok 4: 2.1%
✦ Claude Sonnet 4.5: 2.1%
✦ GPT-5 (CLI): 1.7%
✦ ChatGPT agent: 1.3%
✦ Gemini 2.5 Pro: 0.8%
Подписывайтесь на Telegram EFEMERA: AI news.