Дал Claude доступ к Chrome. Через 30 минут AI принёс список реальных багов в моём SaaS
Недавно прогнал довольно любопытный эксперимент. Дал Claude доступ к Chrome через Claude in Chrome и одну задачу: «Прощёлкай весь мой продукт и составь QA-отчёт».
Без сценариев. Без подсказок. Просто живой SaaS после серьезной фичи, которая затронула почти весь проект. Я подозревал, что есть поломки. Нужно было их как-то быстро выявить.
Через полчаса у меня лежал test_report.md с приоритизированными багами. И это был не «AI-воздух», а вполне настоящий QA.
Что агент сделал сам:
— прошёл всю админку
— протестировал публичное меню
— проверил лендинг и формы
— лазил в DevTools: Console + Network
— мерил тайминги через Performance API
— собирал скриншоты проблемных мест
— сам расставил приоритеты багов
Пример работы:
Причём нашёл реальные вещи:
🔴 403 при F5 на вложенных роутингах админки(nginx без fallback на index.html)
🔴 404 на фоне темы(паттерн просто не грузился)
🔴 сломанный endpoint конфига AI-чата
🟡лишние ~440мс в никуда
🟡 hydration mismatch в Nuxt
🟡 пустое демо первые секунды загрузки
🟡 куча UX-мелочи:— «1 позиций»— опечатки— сброс контекста после F5
Реальный отчет:
Что особенно удивило — он перепроверял собственные выводы.
В какой-то момент Claude решил, что сломан фильтр меню, потому что выдача пустая. Потом сам же понял, что проблема была в комбинации «поиск + фильтр» без совпадений — и изменил вердикт.
То есть это уже не «вижу пусто → пишу BUG».Есть попытка анализа поведения интерфейса.
Но ограничения тоже быстро всплывают:
- автоматизация иногда подвисает
- вкладки отваливаются по таймауту
- скриншоты периодически ломаются
- FCP/LCP в фоне врут из-за throttling вкладки
Lighthouse руками всё ещё нужен. Но как первый проход QA по живому продукту — это очень мощно.
Раньше такой «первичный аудит после релиза» означал:— вечер ручного кликанья— заметки в блокнот— попытки не забыть половину багов. Теперь:
«Вот браузер. Иди ломай.»
И AI реально идёт ломать.
Пока ощущение такое, что browser agents — это уже не игрушка, а новый слой tooling для разработки.
Причём тут ещё куча интересных подходов:— multi-agent тестирование— генерация user flows— self-healing сценарии— AI-анализ Network/Console— автопоиск регрессий после деплоя
В ближайшие дни разберу это подробнее у себя в Telegram канале — с примерами, промптами и реальными кейсами.