Компьютерное зрение: разбираемся с мифами и заблуждениями

Компьютерное зрение: разбираемся с мифами и заблуждениями

Сейчас многие знают, что такое нейросети и приблизительно понимают, как они работают. Позволю себе ещё раз напомнить об основных заблуждениях, связанных с этой технологией.

Далеко не безграничные возможности

Главный миф – это вера в невероятные возможности нейронных сетей. Это заблуждение активно подпитывается новостями и современной поп-культурой. С экранов часто транслируют мысль, что нейронные сети вот-вот начнут (если уже не начали) самостоятельно мыслить. К сожалению, пока это не соответствует действительности.

Давайте немного разберёмся в терминах: чаще всего, когда пишут об ИИ, подразумевают Artificial Narrow Intelligence, ANI – ИИ узкого назначения, который никогда не сможет осознать себя и научиться думать в отличие от настоящего или сильного искусственного интеллекта (Artificial General Intelligence, AGI – ИИ общего назначения). Однако, как создать такую нейросеть, пока никто не придумал.

Даже генеративный ИИ, который многим кажется очень умным и дающим чуть ли не осмысленные ответы, контекст не понимает. Получается, такая нейросеть просто выдает ответ, максимально похожий на тот, который от неё ждут. Её головокружительные успехи основаны только на гигантском объёме датасета для обучения и на миллиардах параметров, используемых для формирования ответа.

Не тоже самое, что обучение ребёнка

Но перейдем к компьютерному зрению. Для объяснения того, как нейронные сети учатся распознавать объекты, часто приводят аналогию с обучением ребенка: мы показываем примеры – и вот сеть научилась их распознавать. Но тут кроется серьёзная ошибка, которая приводит людей к переоценке возможностей ИИ.

Судите сами. Когда мы говорим ребенку: вот стул – на нём сидят, вот стол – на нём едят, малыш быстро схватывает идею. Уже после двух-трёх примеров он легко узнает стол и стул, даже если вы приводили ему в пример столы и стулья на четырех ножках, а потом показали на одной. В головах детей есть механизм аналогий, интуиция и фантазия.

С нейронкой так не получится. Чтобы научить её узнавать столы и стулья вы должны показать ей тысячи примеров столов и стульев. Если в них будут только предметы на четырёх ножках, то стол на одной большой ножке нейронная сеть не узнает. Даже если в датасете объект будет снят под другим углом, он может стать неузнаваемым для ИИ.

На текущий момент нейросети в компьютерном зрении могут только приблизиться к тому, чтобы различать объекты так же, как человек. Но ИИ не может увидеть больше, чем есть на изображении, не может догадаться и дофантазировать то, чего нет. Это особенно актуально, когда речь идёт об изображении низкого качества, где человек руководствуется интуицией, догадывается о параметрах объекта.

Условия эффективной работы ИИ

Компьютерное зрение и нейронные сети не обладают магией и несмотря на громкие успехи, имеют определённые ограничения. Понимание реальных возможностей нейросетей позволяет нам корректно оценивать их эффективность и возможности применения в различных условиях.

Чтобы нейросеть для компьютерного зрения работала эффективно – необходимо создать для неё наиболее «комфортные» условия:

зона видимости должна быть хорошо освещена;

видеокамера должна поддерживать необходимое разрешение;

датасет должен быть объёмным и разнообразным;

…ещё есть методики обучения на синтетическом датасете, но об этом в будущих статьях.

11
Начать дискуссию