{"id":14286,"url":"\/distributions\/14286\/click?bit=1&hash=d1e315456c2550b969eff5276b8894057db7c9f3635d69a38d108a0d3b909097","hash":"d1e315456c2550b969eff5276b8894057db7c9f3635d69a38d108a0d3b909097","title":"\u041f\u043e\u0440\u0430\u0431\u043e\u0442\u0430\u0442\u044c \u043d\u0430\u0434 \u043a\u0440\u0443\u043f\u043d\u0435\u0439\u0448\u0438\u043c\u0438 \u0418\u0422-\u043f\u0440\u043e\u0435\u043a\u0442\u0430\u043c\u0438 \u0441\u0442\u0440\u0430\u043d\u044b","buttonText":"","imageUuid":""}

4 июн 2021 4.06.2021

Почему капча эволюционирует?

Я не робот, но мой компьютер так не считает. Когда я заказываю гантели или еду в интернете, записываюсь к врачу или ошибаюсь с паролем, я ввожу капчу. И что самое неприятное, я не всегда прохожу тест с первого раза — капча стала сложнее.

Согласно своему определению, captcha — это автоматизированный публичный тест Тьюринга (тест который может пройти человек, но не компьютер). Изобретатель капчи Луис фон Ан (он же основатель Duolingo, кстати) в 2000 году пришел на открытую лекцию инженера из Yahoo! в свой родной университет Карнеги Меллон. В 2000 году Yahoo! была ведущей IT-компанией, а фон Ан был на первом курсе PhD-программы. Инженер рассказывал студентам о десяти проблемах, которые компания не может решить. Одна из них заключалась в бесконтрольных спам-ботах, захватывавших адреса электронной почты Yahoo!, и нужна была система распознавания роботов и людей.

В итоге был предложен автоматизированный тест Тьюринга. Тест должен пройти любой человек, независимо от расы, пола, образования или языка. Программисты поняли, что люди — эксперты в оптическом распознавании символов — в чтении. Мы читаем текст под разными углами, при разном освещении, из разных шрифтов и на любых поверхностях, и даже когда он написан рукой врача. Компьютеры той эпохи действительно уступали людям в чтении искаженного текста, поэтому первая капча использовала изогнутые символы и отлично справлялась с работой. Как это работало на практике? Программисты давали компьютеру правильный текст, чтобы он знал ответ. Затем они растягивали и деформировали символы. Компьютер, получивший ответ, сможет его оценить. Но сторонний компьютер изогнутые символы не различал.

Через пару недель после внедрения капчи на странице регистрации в Yahoo! число использований дошло до нескольких миллионов в неделю. Тест сработал: он различал людей и компьютеры и останавливал ботов. Но процесс внедрения капчи со временем сделал компьютеры умнее.

В 2005 году вышла новая версия теста — reCaptcha — с использованием двух слов. Одно слово было сгенерировано и доступно компьютеру, второе было отрывком из книги или статьи из «Нью-Йорк Таймс» и оставалось для компьютера неизвестным.

Затем в 2009 году Google приобрел reCaptcha и начал использовать эту технологию для оцифровки отсканированных книг и архива новостей, чтобы создать надежную библиотеку изображений с искаженными символами. И, в конце концов, с достаточным количеством изображений в этом наборе данных компьютер становится достаточно умным, чтобы различать буквы и слова в новых изображениях.

Исследование Google 2014 года показывает: человек может читать сложные капчи с точностью около 33%. ИИ читает их с точностью 99,8%. Как только компьютеры стали справляться лучше людей, тест пришлось изменить. Так появилась reCaptcha V2 с изображениями вместо текста, которые выполняли ту же задачу — не пускать ботов. Тесты V2 часто заставляют нас выбирать фотографии транспорта: пожарные гидранты, светофоры, пешеходные переходы. Google использует эти данные для улучшения карт, и чтобы обучать свои беспилотные автомобили.

Но точно так же, как компьютеры превзошли нас в чтении, они превзошли нас и в картинках. Тест и методы его оценки пришлось снова менять. Nocaptcha и его последний аналог reCaptcha V3 подтверждают, что вы человек, только на основании вашего поведения. В фоновом режиме всегда выполняется секретный и почти невидимый тест. Если вы похожи на бота — например, если вы слишком быстро щелкаете мышью или набираете текст за секунды — они заставят вас пройти стандартный тест с картинками или попросят провести двухфакторную аутентификацию.

Теперь, если вы пользуетесь интернетом, за вами всегда приглядывают. Кто-то возразит, что это жутко, но это лучше, чем отмечать на картинках гидранты. Всегда заранее известно, робот ты или человек. Но, в отличие от предыдущих версий теста, не совсем ясно, чему наши клики могут обучать компьютеры. И неясно, сколько времени потребуется компьютерам, чтобы обойти последнее поколение тестов.

Шпильман Вадим Игоревич

Национальный образовательный ресурс IQ Vector

99 показов

85 открытий

1 репост

Комментарии

Комментарий удален модератором

Развернуть ветку

Написать комментарий...

-3 комментариев

Раскрывать всегда