ReСaptcha существует уже довольно давно. Если посмотреть на ее развитие, например, как появлялись новые решения: капчи v1, v2, то можно заметить интересные детали, которые, кстати, были подтверждены официальными представителями.
Мало кто помнит версию v1, но суть ее было простой: вам нужно было написать, какой текст указан на картинке. Примечательно, что сами картинки брались из книг, которые не были оцифрованы. Да, вы верно подметили, таким образом сервис reCaptcha занимался оцифровкой старых газет, книг и не только.
Нет, вы не задумывались, почему reCaptcha была бесплатной? Ведь представьте насколько невыгодно содержать капчу за свой счёт, учитывая что там огромные расходы на сервера и не только. Не кажется это странным?
С первой версией разобрались, по факту — она приносила прибыль (потенциально с оцифровки книг и газет).
Вторая версия отличалась от первой, было предложено отмечать картинки. Например, "выберите все изображения, где есть машины*. Тут такая же схема. Google занимается разработкой собственных машин (кстати, они уже начали работать в этом плане, есть работающие прототипы), но все мы понимаем: чтобы машина ездила сама (а это и есть их идея, машины без водителя), она должна быть умной: никто не хочет остаться без лишнего гидранта на улице и затопить целый район. А ремонт машины, которая врезалась в дерево на большой скорости — тоже не дешевле развлечение.
Дисклаймер: но как Tesla смогла без капч научить машины ездить автономно? Хм! Тут не все так просто. Да, Теслы могут ездить по дорогам, которые относительно свободные. В таком случае ей остаётся следить только за разметкой и препятствиями (люди, машины). Даже при этом водитель должен находиться за рулём и следить за автопилотом.
Google же озадачены разработать комплексное решение. Ведь, чтобы автопилот смог работать на безопасном уровне без человека — он должен учитывать любые ситуации.
Так мы с вами и помогли Google собрать датасет. Кстати, датасеты и их разметка — на самом деле очень дорогая штука. Представьте, сколько займет времени разметить человеку миллион картинок. И, это не все! Те, кто работал с машинным обучением меня уже должны были понять.
Приз за самый безграмотный текст в виде учебника русского языка этому господину
Комментарий недоступен
Комментарий недоступен
Комментарий недоступен
Ну, недавно reCaptcha от Google стала платной :) 1$ за 1к запросов, тоже может быть отталкивающим фактором, после этого, такие компании как Discord, CloudFlare переехали на hCaptcha.
Все для нашей кондефициальности!
Статья хорошая, на слежку лично мне пофигу...