Искусственный интеллект будущего — не всесильный мегамозг, а шустрый паренёк на подхвате
«ИИ или человек?», «человек против ИИ» — на vc.ru регулярно мелькают заголовки, противопоставляющие людей и машин. В этой статье хочется отойти от демонизации искусственного интеллекта и посмотреть на него трезво, через призму экономической целесообразности и с легким погружением в технические детали. В частности, в такие штуки, как edge computing и оптимизация нейронных сетей. Меня зовут Владимир Дюбанов, CEO компании Expasoft. Мы создаём и внедряем технологии на базе ИИ и верим, что скоро они станут неотъемлемой частью повседневной жизни.
Для начала крохотный терминологический ликбез. Искусственный интеллект, машинное обучение, нейронные сети — неподготовленный читатель эти термины частенько путает. Расставим все по своим местам:
Говоря об абстрактном ИИ, люди часто подразумевают технологии, основанные на нейронных сетях. С ними наша компания и работает. Но дальше по тексту я использую термин ИИ просто потому, что многим так привычнее. По факту, речь про машинное обучение и, в частности, нейронные сети.
С терминами разобрались, переходим к основной мысли — почему не надо демонизировать ИИ и как сделать его своим помощником.
«Искусственный интеллект — это не инопланетное вторжение с Марса, это результат человеческой изобретательности»Рэй Курцвейл, технический директор Google
Наше общество инерционно и зачастую оказывается не готово к очередному технологическому прорыву. В своё время люди демонизировали многие технологии: телевизор зомбирует, ГМО вызывает мутации, интернет разжижает мозг всякими тиктоками. Теперь вот: ИИ следит за каждым нашим шагом, крадет наши рабочие места и прочие страшилки. Для этого явления даже придумали название — «техно-паранойя».
И если увеличивается производительность труда, значит, становится больше благ, общий уровень жизни растет. Искусственный интеллект помогает нам двигаться именно в этом направлении, иначе бы он не стал новой глобальной технологией.
Наверняка техно-паранойя вокруг ИИ стихнет еще нескоро, этому способствует и масскультура (вспомнить хотя бы сериал «Черное зеркало»). Образ зеркала очень меткий: новая технология воспринимается негативно, когда она отражает общественный негатив. К примеру, первые умные чат-боты учились на соцсетях и переписках с людьми — и скоро стали материться и хамить.
Возможно, общество станет легче принимать технологические прорывы, когда мы внимательнее посмотрим на самих себя и перестанем приписывать технологиям собственные недостатки?
Думаю, когда всем станет очевидна реальная польза ИИ, техно-паранойя стихнет, искусственный интеллект перестанет быть «плохим» в глазах общества и прочно войдет в нашу жизнь.
Что такое edge computing и как оно сделает ИИ «хорошим»
Edge computing, или, говоря по-русски, граничные вычисления — один из ожидаемых технопрорывов в области ИИ. Например, тут новую технологию ждут уже в 2030 году наряду с биочипами и нанороботами.
Например, когда батарея автоматически изменяет режим отопления, постоянно самообучается и адаптируется под внешние условия и потребности пользователя. И все это самостоятельно, без связи с облаком. Такую батарею не нужно хардкодить, она работает по принципу «купил, включил и забыл», всю работу делает встроенный чип с хитрой ИИ-начинкой.
Именно такие приборы можно назвать по-настоящему умными. В отличие от современных «умных» домов, в которых устройства требуют сложной настройки и квалифицированного инженера в придачу (если говорить не о розетках, а о приборах посложнее).
Почему я считаю, что будущее ИИ именно за граничными вычислениями? Напрашивается аналогия с предыдущими технологическими прорывами.
К примеру, с электричеством повсюду появилась дешевая энергия, а вместе с ней тепло, свет, движение. С интернетом мы получили единое информационное пространство с ответами на все вопросы. Оставь современного человека без всего этого — и для него это будет уже неестественная среда обитания. Кажется, что edge computing это такой же сдвиг парадигмы.
Представьте: почти любая вещь адаптируется под вас и дает то, что надо именно вам и именно в данный момент. К примеру, сегодня мы настраиваем сиденье в автомобиле рычагами или кнопками, а в будущем достаточно будет просто сесть в него — датчики сами считают напряжение тела и изменят конфигурацию кресла. Такая среда станет по-настоящему интерактивной и одновременно очень доступной, без сложных интерфейсов и хардкода.
Мы в Expasoft стараемся приблизить эру edge computing и для этого оптимизируем (сжимаем и ускоряем) нейронные сети
Граничные вычисления станут полноценным технологическим прорывом, когда умные устройства появятся повсюду, станут обязательным атрибутом повседневной жизни. Для этого условный умный обогреватель должен стоить как обогреватель, а не как самолет. Пока edge computing остается игрушкой для богачей: тот же умный холодильник от Amazon будет явно не по карману массовому обывателю со средней зарплатой.
Когда edge computing станет по карману каждому, тогда и случится полноценный технологический прорыв. А чтобы сохранить приемлемую цену, нужно:
либо вставить в прибор дешевый и очень производительный чип, сравнимый по инференсу с современными серверами;
- либо сжать и ускорить нейронную сеть — такая оптимизированная модель требует в разы меньше вычислительных мощностей, и её можно запустить на любом приборе со стандартным чипом.
Наша компания идет по второму пути: одна из наших разработок — ENOT, фреймворк для оптимизации нейронных сетей. Кажется, что с его помощью мы сожмем и ускорим нейросети быстрее, чем производители электроники разработают дешевые суперчипы и начнут массово их производить.
Раздел ниже — для тех, кто хочет узнать чуть больше про оптимизацию. Всем остальным его можно пролистать, на понимание основной мысли это никак не повлияет.
Оптимизация нейронных сетей на пальцах
Знаковым событием в развитии ИИ стало появление глубинных нейронных сетей со множеством внутренних (скрытых) слоев. В них выходные данные от предыдущего слоя были входными данными для следующего, и так далее, вплоть до последнего (выходного) слоя, который и выдавал конечный результат вычислений.
Такая сеть оказалась вместительной моделью — она смогла переварить большие объемы сырой входящей информации. «Толстым» сетям стали скармливать самые разные датасеты. В результате появились предобученные нейросети: для распознавания картинок, текстов, аудио, видео.
Между нейронами такой сети формируются определённые связи, появляется некоторая абстрактная когнитивная функция — например, распознавать на фотографиях объекты по их характерным признакам. Какие именно объекты — не так важно, принцип один.
Предобученную сеть сравнительно быстро и дешево дообучить под конкретные объекты. Например, котов. После этого нейросеть становится избыточной, так как используются только те связи между нейронами, которые помогают распознавать котов. Остальные связи больше не нужны и зря съедают вычислительные мощности.
Тяжеловесную модель пускают под нож, убирают все лишнее и превращают ее в того самого шустрого паренька — легкого на подъем и очень функционального.
Это и есть оптимизация нейронных сетей. Естественно, на деле этот процесс намного сложнее и включает не только «лоботомию», но и оптимизацию под конкретные аппаратные платформы и прочие технические хитрости. Но сама суть именно в этом: убрать лишнее и оставить только необходимое для решения конкретной задачи.
Хорошая новость: нам есть что оптимизировать
Интерактивная умная среда, шустрые легкие нейронные сети, полезный и «добрый» искусственный интеллект — чтобы всё это появилось в ближайшем будущем, нужно уже сегодня иметь какую-то отправную точку. Хорошо, что она есть: ИИ уже используется в повседневной жизни, нам есть с чем работать. Но так было не всегда.
Вообще, суть машинного обучения – обощение данных и автоматическое извлечение из них некоторого знания. Человек делает это двумя способами: рационально и интуитивно. Например, для оценки рынка трейдер происходит курсы, анализирует финансовые отчеты и новости, что-то считает и только потом делает выводы. А вот кота от собаки тот же трейдер отличает интуитивно: это настолько базовое знание, что человек не задумывается о том, как получил его.
Машине формулы намного понятнее, чем интуиция. Поэтому долгое время искусственному интеллекту было проще предсказать поведение рынка, чем отличить кота от собаки. Собственно, первые алгоритмы искусственного интеллекта и применялись для решения сложных математических задач: анализа геномов или той же оценки фондового рынка.
Это были очень дорогие игрушки, рискованные авантюры, за которые платили государства и крупные корпорации. Рядовому бизнесу из реального сектора экономики они были не по карману. Но самое главное — такие модели были далеки от обычной жизни. Какой прок от анализа генома в быту?
Прорыв в нейронных сетях случился тогда, когда на базе ИИ-технологий удалось автоматизировать простые, интуитивные, базовые когнитивные функции человеческого мозга. И прорыв этот был абсолютно целесообразен экономически — даже по двум причинам.
Во-первых, для обучения нейросети нужно много размеченных данных. И именно в области базовых знаний люди годами генерировали огромные массивы данных. Например, миллионы фотографий Тома Круза с подписью «Том Круз». Именно поэтому в области распознавания лиц были первые прорывные нейросети, которые позже всех удивили.
Во-вторых, нейросеть с базовыми функциями быстрее окупается и легче внедряется. Разработать робота-охранника для системы видеонаблюдения так же дорого, как и робота-директора. Только охранников на предприятиях десятки, а директоров единицы.
Кроме того, цена ошибочного действия охранника все-таки меньше, чем директора. Вот и получается, что для видеонаблюдения дешевле взять робота, а для топ-менеджмента дешевле человек.
Безграничный потенциал граничных вычислений
Мы в Expasoft прошли те же шаги, что и вся ИИ-отрасль. Ядро нашей компании — бывшие и действующие ученые, которые создавали узкоспециализированные нейросети для научных и оборонных проектов (еще до всего этого хайпа вокруг ИИ). Еще в далеком 2010-м нам захотелось перенести свои сложные научные разработки на бытовой уровень, сделать их общедоступными.
На сегодняшний день на нашем счету больше десятка проектов, для которых мы оптимизировали нейронные сети с помощью фреймворка ENOT. Вот некоторые из них (ссылки на LinkedIn):
В экосистеме Сбера часть рутины (например, транспортировку грузов или клининг помещений) доверяют передвижным роботам от Sber Robotics Laboratory.
Система помощи водителю (ADAS) от LG защищает водителя от аварийных ситуаций.
- Более 150 миллионов пользователей каждый день редактирует фото и видео в приложении PicsArt.
Сейчас уже нет никаких сомнений в том, что будущее умных алгоритмов не в сложных узкоспециализированных областях, а в простейших бытовых задачах. И чем шире будут применяться технологии ИИ в повседневной рутине, тем ближе очередной громкий технологический прорыв.
Пока неясно, во что это в итоге выльется. Но есть чувство, что edge computing изменит нашу среду обитания не меньше, чем электричество и интернет в свое время. Хочется верить, что уже лет через 5-10 образ ИИ в массовом сознании окончательно эволюционирует от злого Скайнета и армии терминаторов до команды незаметных бытовых помощников, которые всегда на подхвате.
Спасибо за внимание!
Буду рад обсудить будущее ИИ в комментариях: )