Ищем команды для разработки визуальной системы как у Терминатора. У нас есть технология

Нам нужны спецы в области CV/AI/ML/DL. Мы разработали теорию активного восприятия, TAPe (Theory of Active Perception), которая, как мы считаем, моделирует врожденные механизмы восприятия человека. Говоря по-простому, мы описали «математические» законы, которыми, по всей видимости, и оперирует человеческий мозг, когда обрабатывает информацию. Слово «математические» в кавычках, потому что, строго говоря, это никакая не математика или далеко не только математика.

С точки зрения технологий это может дать нам, например, принципиально иной уровень распознавания изображений – и мы уже используем эти технологии в наших коммерческих проектах. Сейчас мы занимаемся перспективными исследованиями TAPe, которые, как мы думаем, позволят создавать и принципиально другие архитектуры нейронных сетей. Поэтому сейчас мы ищем людей, которые хотят поучаствовать в наших разработках, либо на основе наших технологий самостоятельно работать над своими проектами.

Comexp — российская компания, на рынке более десяти лет. Последние годы мы сосредоточились на НИОКР, успешно прошли совместный акселератор Сбера и 500 Startups, получали инвестиции от Фонда Бортника и т. д. Мы ориентированы на иностранные рынки, наш новый сайт в разработке, вот его английская версия.

TAPe моделирует то, что можно назвать Языком Мышления, то есть работу врожденных механизмов восприятия человека. Термин “язык мышления” впервые предложил Джерри Фодор, а что это такое можно почитать на сайте Стэнфорда, например.

TAPe применима далеко за пределами CV. Как мы уже говорили, с помощью технологий на базе TAPe можно строить другие архитектуры нейронных сетей. И даже не можно, а нужно: ни одна из существующих архитектур и ни один из существующих методов не позволяет раскрываться TAPe, поскольку TAPe работает с более сложными единицами информации — с образами (об этом см. ниже).

Технологии так называемого искусственного интеллекта ограничены, они могут решать довольно узкий класс задач. Их сложно подготовить для решения какой-то одной конкретной задачи, а для решения другой нужно обучать уже другую нейронку. Улучшение результатов хотя бы на 1% требует много ресурсов, как финансовых, так и временных.

Мы считаем, что TAPe позволяет создать такую технологию, которая может решать любые задачи распознавания, без необходимости каждый раз обучать нейросеть распознаванию нового класса объектов.

В основе TAPe — математическая модель, основанная на теории групп. TAPe оперирует образами, а не массивами структурно несвязных чисел (например, нулями и единицами, как это делают современные компьютеры). Это позволяет в единице информации — бит — передавать намного больше значимой информации. Мы даже ввели новую единицу или новый термин t-бит — бит информации, полученный с помощью TAPe.

Что такое образ и зачем он нужен

Образ — это описание на подмножестве максимально информативных связанных элементов информации. Образы не различаются по типам информации, то есть один и тот же образ может описывать совершенно разные типы информации: изображения, текст, видео, звук. Из-за этого для любого класса задач объемы вычислительных операции сокращаются на порядки.

Можно это показать на простой схеме. Компьютерному зрению, прежде чем "увидеть” стол и "понять”, что перед ним именно стол, нужно преобразовать картинку в нули и единицы, соотнести эти нули и единицы со своей базой данных, и потом уже “понять”, что это стол. Наш мозг обходится без таких операций. Он сразу видит и сразу понимает, что перед ним стол. TAPe, моделирующее человеческое восприятие, тоже сразу "видит” и "понимает”, что перед ним стол.

Внутри t-бита уже зашита возможность распознавать (воспринимать) любой класс информации. Если так, то не нужно будет под каждую задачу распознавания разных классов объектов писать и обучать отдельную нейронную сеть. TAPe будет способна распознавать любые классы объектов без предварительного обучения.

Повторимся, что компьютерное зрение — лишь малая часть, где может быть эффективно применима TAPe. Как мы уже говорили, с точки зрения TAPe информация не различается на классы, информацию можно передавать готовыми значимыми образами, а не просто 0 и 1. Это открывает принципиально новые возможности. Уже сейчас мы знаем об изоморфизме между технологиями компьютерного зрения и естественным языком, текстами. Для нас очевидно, что информация через другие органы чувств — уши, язык, нос кожа и тд — также передается в мозг с помощью тех же “образов”. Эти образы мы и научились математически описывать.

Сейчас мы изучаем и другие возможности TAPe, и параллельно реализуем задачи, которые возможно решать с помощью технологий на базе TAPe. Мы разработали поиск видео по видео (повторяем: именно видео по видео, а не по мета-данным, хэш-функциям, фингерпринтам и вотермаркам и т. д. и т. п. как в других системах — эти методы далеко не всегда достаточны для поиска нужного видео).

Такой поиск позволяет, например, быстро находить нужное видео, искать дубликаты, готовить отчеты (наборы видео) на заданную тему и т. д. — зависит от задач. В том числе мы разрабатываем функции поиска конкретных объектов в массиве видео. Ну и уже больше десяти лет работает коммерческий проект по мониторингу ТВ-рекламы (и любого другого видео) в режиме реального времени.

В более или менее обозримом будущем мы видим перспективы по разработке технологий не только ИИ, но и в области моделирования именно естественного интеллекта (ЕИ), а также машинного обучения для различных задач на принципах ТАРе. Здесь же можно упомянуть хранение, передачу и управление информацией на принципах ТАРе, которые, по нашему мнению, должны быть на порядки эффективней современных систем.

Поскольку мы считаем, что TAPe позволяет говорить об эмуляции или моделировании естественного интеллекта, то можно говорить и о решении принципиально иных с точки зрения сложности задач. В отличии от ИИ в новых типах алгоритмов благодаря TAPe одни и те же первичные данные будут позволять решать различные задачи. Ведь существующие системы ИИ этого не могут: любая новая задача требует новой выборки, нового обучения, новой настройки. С TAPe возможно готовить первичные данные таким образом, чтобы на основе их решать абсолютно разные задачи. Матаппарат, выборка, обучение, настройка по TAPe идентичны для любого класса задач.

Мы считаем, что так как TAPe моделирует восприятие информации человеческим мозгом, то нет никаких ограничений, чтобы разработать продукты и технологии, которые максимально приближаются по эффективности восприятия к естественному интеллекту.

Мы продолжаем работать над развитием TAPe, над проектами на базе TAPe, над изучением возможностей TAPe. И мы приглашаем к сотрудничеству проектные команды, компании, которых заинтересовало то, чем мы занимаемся.

Мы понимаем, что не можем придумать все возможные сценарии использования TAPe, и потому готовы делиться нашими знаниями. Представьте, что мы открыли электричество и с помощью него изобрели пока что только лампу накаливания. Но мы готовы работать дальше и мы готовы делиться нашими знаниями и технологиями с вами, если у вас появятся идеи, как можно применить наши знания, технологии и возможности. Если вы захотите создать какой-то проект на базе TAPe, мы будем только рады: на определенных условиях мы раскроем нашу теорию и, например, одну из построенных на её базе технологий (работа с видео), а вы сможете сделать с этим всё, на что хватит вам сил, умений, времени, энергии, фантазии. При необходимости, мы поможем вам сделать то, что вы хотите. При этом мы не будем претендовать на блокирующие доли, лезть в ваш бизнес и т. п.

Хорошо, если в вашей команде есть специалисты Data Scientist, Machine Learning Engineer, Developer. Кроме перечисленных специальностей хорошо, если они не боятся писать на питоне и/или использовать питоновские библиотеки. Прекрасно – если они на практике знакомы с теорией групп хотя бы на уровне вуза. А если знакомы еще и с алгеброй Ли, а также вкладывают какой-то смысл в понятие "алгебры гармонии", то вам точно понравится то, чем мы занимаемся. Поверьте, мы здесь не рассказали и десятой доли того, чем мы занимаемся. У нас интересно. Если хотите изучить технологию и/или вас раззадорило то, что мы заявляем, или у вас есть вопросы – пишите нам на почту tape@comexp. net.

Ищем команды для разработки визуальной системы как у Терминатора. У нас есть технология

Кто мы

Подробней о теории активного восприятия

Еще немного самых общих подробностей о TAPe

Что TAPe умеет делать уже сейчас

Каким мы видим развитие технологии

Кого мы ищем (честно говоря, мы ищем новаторов, предпринимателей, создателей, творцов)