Исследование: оценка автоматизации удалённой работы с помощью ИИ

Современные ИИ-агенты обеспечивают уровень автоматизации не более 2,5%. Некоторых такой заголовок вводит в заблуждение...))

Тут как раз речь о доле проектов, которые ИИ-агенты смогли выполнить под ключ на уровне человека или лучше!

Про отчёт:

✦ Бенчмарк RLI включает 240 проектов с фриланс-платформ (Upwork) для оценки эффективности ИИ

✦ В основном задачи по дизайну, документации, анимации, анализу данных, разработке и т.п.

✦ ИИ заработали $1810 из возможных $143 991 (общая оценка проектов)

✦ Проанализировано более 6000 часов реальной работы

✦ Для оценки использовалось ручное сравнение с эталонными работами людей

Рейтинг агентов по % автоматизации:

✦ Manus: 2.5%

✦ Grok 4: 2.1%

✦ Claude Sonnet 4.5: 2.1%

✦ GPT-5 (CLI): 1.7%

✦ ChatGPT agent: 1.3%

✦ Gemini 2.5 Pro: 0.8%

Подписывайтесь на Telegram EFEMERA: AI news.