Занимательная история Капчи — Как мы учим ИИ и как доказать что ты не робот?

Привет VC, я Артур Ткаченко, основатель и арт-директор веб-студии Alt Design. Мы дизайним бренды и создаем впечатляющие сайты основанные на маркетинговой аналитике. Наши проекты получают награды, а клиенты бизнес-результаты. Очень сильны в недвижке, eCommerce, производстве, сфере услуг. Умеем работать с большим бизнесом и госсектором.

А еще недавно я завел свой личный Telegram канал - пишу про бизнес, маркетинг, развитие своего агентства и личный бренд, подписывайтесь, буду рад всех видеть)

Уже более двух десятилетий капча используется в качестве ключевой стратегии борьбы со спамом и нежелательным онлайн-трафиком. Эти привычные задачи, часто включающие в себя определение простых слов или изображений, служат базовым тестом, позволяющим отличить человека от компьютера.

Оригинальный термин CAPTCHA расшифровывается как Completely Automated Public Turing Test to tell Computers and Humans Apart — «полностью автоматизированный тест Тьюринга для отличия компьютера от человека». Первоначально тест Тьюринга проверял, способна ли машина обмануть человека, заставив того поверить, что перед ним человек. Если машина проходит этот тест, то, по мнению математика Алана Тьюринга, она разумна.

Теперь же капча используется для того, чтобы не допустить рассылки спама или нежелательной активности пользователей. Разоблачение машины означает ее недопуск на тот или иной сайт или к определенным активностям. Изучая эволюцию и нюансы технологии капчи, можно получить новое представление о развивающихся взаимодействиях между людьми и компьютерами и о том, как эта динамика интегрируется в цифровые и интернет-системы.

Возникнув на основе непатентованных криптографических разработок со спорными претензиями на авторство, она превратилась в оживленную экосистему исследователей безопасности и хакеров, которые постоянно расширяют границы технологий распознавания изображений и анализа документов. В конце концов эти инновации были объединены под контролем компании Alphabet, ранее известной как Google.

Короткая статья Луиса фон Ана и его коллег Мануэля Блюма и Джона Лэнгфорда «Отличие человека от компьютера (автоматически), или Как ленивые криптографы создают ИИ» дает классификацию существовавших тогда типов капчи и завершается перспективными предложениями. В начале документа рассматриваются четыре основные конструкции, которые воплощают подход, где определенная информация либо скрыта, либо рандомизирована, чтобы отличить пользователей-людей от автоматизированных ботов. Всего они выделили четыре вида капчи.

GIMPY выбирает семь слов из словаря и выводит на экран искаженное изображение с этими словами. Затем GIMPY предлагает пользователю тест, состоящий из искаженной картинки и указания ввести три слова, появившиеся на изображении. Учитывая типы деформаций, которые использует GIMPY, большинство людей могут прочитать слова, в то время как компьютерные программы этого сделать не могут.

Просит пользователя решить задачу по визуальному распознаванию образов. В частности, она отображает две серии блоков — левую и правую. Блоки в левой серии отличаются от блоков в правой, и пользователь должен найти характеристику, которая их отличает.

Еще один пример капчи — программа, имеющая большую базу данных помеченных изображений. Все эти изображения должны быть картинками конкретных объектов (лошадь, стол, дом, цветок и т. д.). Программа выбирает объект случайным образом, находит шесть изображений этого объекта из своей базы данных, предъявляет их пользователю и задает вопрос: «Что изображено на этих картинках?».

Это звуковая капча. Программа выбирает слово или случайную последовательность цифр, преобразует их в звуковой файл и искажает его. Затем она представляет искаженный звук пользователю и просит его ввести звучащие знаки.

В отчете Луиса фон Ана предлагаются две идеи, наводящие на размышления. Во-первых, в нем утверждается, что успешное решение проблем капчи может быть приравнено к преодолению сложных, нерешенных проблем в ИИ. Тем самым эффективность капчи связывается с прогрессом в области искусственного разума. Чем сложнее капча, тем более разумным должен быть бот, разгадывающий головоломки.

Например, reCAPTCHA, один из самых распространенных современных типов капчи, использует задачи классификации изображений или текста, которые помогают в обучении алгоритмов ИИ Google. Когда пользователи определяют и классифицируют изображения (светофоры, пешеходные переходы или витрины магазинов), они непреднамеренно предоставляют маркированные данные, которые могут быть использованы при обучении моделей машинного обучения для задач распознавания изображений.

Во-вторых, авторы черпали вдохновение в проекте SETI@home. Этот проект использует незадействованные вычислительные мощности персональных компьютеров по всему миру для анализа астрономических данных. SETI@home, как считал Луис фон Ан и соавторы, предлагает краудсорсинговую модель, в которой пользователи интернета вносят вклад в значимые проекты, такие как оцифровка коллекции библиотеки Конгресса, используя свои вычислительные ресурсы, и на добровольных началах. Это предложение могло расширить полезность капчи за пределы обеспечения безопасности, представляя ее как средство использования человеческих вычислительных усилий для более масштабных научных и культурных начинаний.

Даже такая простая технология, как капча, имеет сложную нелинейную историю. Возникнув как препятствие атакам ботов, эта технология стала важным инструментом в оцифровке текстовых архивов самых разных направлений.

Постепенное расширение функционала капчи связано не только с приумножением ее разновидностей (от GIMPY, BONGO, PIX и ECO до reCAPTCHA), но и с привлечением вычислительных мощностей рядовых пользователей. Так технология интернет-безопасности вовлекает людей и машин в совместную работу.

Спасибо за внимание, если статья оказалась для вас полезна

Подписывайтесь на мой авторский Telegram-канал, там море полезностей для предпринимателей, в удобном для изучения формате
А если у вас есть задача для нашей студии, заходите на наш сайт и свяжитесь любым удобным способом. Проведем консультацию и поможем найти лучшее решение для вашей компании.