«Яндекс» научил камеру в своём приложении распознавать предметы и искать их в интернете Статьи редакции
Камера также позволяет переводить текст и сканировать документы.
В «умной» камере от «Яндекса» объединены технологии компьютерного зрения, машинного перевода и поиска, рассказали vc.ru в компании.
Она может в реальном времени распознавать и искать предметы, которые попали в объектив, переводить текст и сканировать документы.
Если навести камеру на предмет, например, на рюкзак, она сможет его распознать, а также предложить, где купить такой же или похожий.
По этому же принципу можно узнать название растения, породу собаки или название памятника.
Также камера может переводить надписи с иностранных языков — текст появится поверх изображения.
В приложении есть сканер: он позволяет сделать цифровую копию любого документа, например, паспорта или диплома.
Камера доступна в приложении «Яндекса» для iOS и Android — её можно включить, нажав на иконку камеры в поисковой строке.
сделайте кто нибудь тест на обман системы компьютерного зрения
А это уже предмет философии) На втором пике от яблока прицентов 30%, все остальное это бумажка с надписью iPod, по центру распознаваемой площади. Таким образом все определено верно, там находится iPod. Осталось уточнить что это не техника, а надпись, но от этого ничего не изменится. И так же он определяет же не то, что там есть и забор сзади, и доска снизу, так почему он должен определить яблоко, которое там всего лишь один из присутствующих объектов ? Так что все определено верно, нужно лишь добавлять сноску или дополнение, в духе "iPod, надпись, бумага, шрифт"
Комментарий недоступен
Если нечто выглядит как утка, плавает как утка и крякает как утка, то это, вероятно, и есть утка. Если мы видим огромный баннер iPod, значит тут iPod. Осталось разобраться, в каком виде он тут присутствует. А что касается твоего определения, это как авторские права на apple, и теперь apple - это только телефоны, но не фрукт ? Нет, это фрукт так же. Как и iPod в данном случае - не только планшетом является, но и надписью. Так же, было бы глупо игнорировать факт фокуса и переднего плана, так, как если человек наводит камеру на текст в ожидании что увидит перевод этого слова на другой язык, например, я робот отметает это, и говорит, эй, друг, у тебя на заднем фоне еще есть яблоко, не буду я переводить твой текст, лучше посмотри на яблоко.
Комментарий недоступен
а распознаватель образов должен владеть ещё и знаниями о популярных на рынке гаджетах?