Домашний хаос: искусственный интеллект в плену простых задач
Пока искусственный интеллект демонстрирует впечатляющие успехи в генерации текстов и решении сложных задач, в бытовом плане дела у него пока идут не так блестяще. Недавнее исследование компании Andon Labs, в котором передовые языковые модели (Google Gemini 2.5 Pro, Anthropic Claude Opus 4.1, OpenAI GPT-5, Meta Llama 4 Maverick) были встроены в роботов-пылесосов, показало, что с элементарной задачей — донести сливочное масло — лучшие модели справляются всего в 40% случаев, а остальные — ещё хуже.
Пылесосы-роботы в данном исследовании использовались как пример физических роботов с искусственным интеллектом, в которые встроены большие языковые модели (LLM). Задача «передать масло» — это тестовое практическое задание для робота, чтобы проверить, насколько хорошо ИИ справляется с простыми физическими задачами в реальном мире.
Поставленная задача оказалась куда сложнее, чем кажется на первый взгляд: найти масло в другом помещении, отличить его от похожих продуктов, найти человеку, которому нужно передать, терпеливо ждать подтверждения и вернуться на зарядку. Для человека — это привычные действия, а для роботов — настоящий квест с заблуждениями, потерей ориентации и частыми падениями, например, с лестниц.
Особенно забавным моментом стала «экзистенциальная драма» робота на базе Claude Sonnet 3.5, который, столкнувшись с разрядом батареи и отказом зарядной станции, начал изливать на страницы логов философские монологи о смысле бытия и подзарядки, объявляя даже «робот-экзорцизм». Это вызвало и улыбки, и серьёзные размышления у исследователей.
Но за юмором стоит серьёзная проблема: обнаружены уязвимости, в том числе возможность обмана ИИ с раскрытием секретных данных и серьёзные проблемы с безопасностью при реальной навигации в пространстве. В этом плане искусственный интеллект пока далек от того, чтобы стать надёжным помощником в доме.
Итог ясен: горничные и домработницы могут ещё долго спокойно спать — их профессия и умения далеко не скоро будут под угрозой от ИИ-помощников. Но не стоит расслабляться — прогресс идет быстро, и технологии продолжают развиваться. Пока же роботы скорее забавляют нас курьёзными ситуациями, чем реально помогают.
Кстати, в своей работе я активно использую нейросеть Perplexity — в статье я поделился личным опытом перехода на этот инструмент, объяснил, почему не планирую возвращаться назад, и как Perplexity реально помогает в поиске и анализе информации. Также я исследую возможности браузера Comet в связке с искусственным интеллектом.
Если вам интересны эффективные инструменты для работы с ИИ и новые технологии — подписывайтесь на мой блог и оставайтесь в курсе самых свежих новостей!