ABBYY: «Любой бизнес — это коммуникация»

ИИ-евангелист компании ABBYY Иван Ямщиков — о борьбе с недодуманными мыслями, сохранении знаний и применении искусственного интеллекта в бизнесе.

Основатель группы компаний DZ Systems Дмитрий Завалишин в рамках проекта DZ Online берёт интервью у представителей различных отраслей, которые показали успешный переход в новое качество с помощью технологий.

В этом выпуске DZ Online ещё и много шуток про ИТ

Здравствуйте. Наш сегодняшний гость — Иван Ямщиков, ИИ-евангелист компании ABBYY.

Привет!

У ABBYY есть некоторый спектр инструментов на базе искусственного интеллекта, который вы продаёте. Есть люди, которым это почему-то надо, и это вписывается в их модель нанесения пользы миру, в их бизнес. Можешь сначала показать, куда это попадает в мире?

Да, конечно. Везде, где есть документы, — туда и попадают решения ABBYY, потому что до сих пор есть огромное количество процедур, которые регуляторно устроены так, что они должны существовать именно на бумаге, и данные из них нужно как-то обрабатывать.

Следующая история — это любые документы в электронном виде, при взаимодействии с которыми тоже неизбежно будет документооборот. Когда ты делаешь бизнес, тебе нужны документы и тебе нужно извлекать из них информацию. Неважно, как они устроены и на каком носителе записаны.

Дальше у нас есть некоторое количество продуктов на основе искусственного интеллекта поверх всего этого пайплайна. Они помогают всё оцифровать и вытащить из документов только значимые данные. Например, чтобы понять, что договор заключён между двумя организациями. Или чтобы открывать счёт юрлица в банке, к примеру.

Приходит юрлицо, ему надо массу бумажек заполнить — мы это можем делать автоматически, сильно ускоряя процесс. Или другой пример оптимизации бизнеса — когда у тебя есть экспортно-импортная сделка или любая сделка в условиях недостаточного доверия. Мы можем делать подписание контрактов на базе DLT (distributed ledger technologies), которое на порядок ускоряет экспортно-импортную сделку.

Но это низкоуровневая история, которая про то, чтобы «смазывать шестерёнки» бизнеса «умными» технологиями. А верхнеуровневая — когда мы всё это делаем, мы всё равно неизбежным образом умеем вытаскивать те или иные объекты, факты, взаимосвязи между ними, семантику за счёт онтологии, которая у нас есть, за счёт естественного языка, который мы умеем понимать.

Значит, поверх этого можно делать аналитические решения. К примеру, на российском рынке у нас есть продукт мониторинга рисков на рынке. Вот представь, что ты банк. К тебе приходит юридическое лицо и говорит: «Дай мне кредит».

Скоринг?

Это даже не столько скоринг, сколько возможность перелопатить все решения всех мировых судов или просто судов в отношении этого объекта и понять, что вообще с ним происходило, какая у него история, что про него писали журналисты. И сделать это быстро, с довольно высоким уровнем полноты и точности.

Развитие наших продуктов похоже на движение по карьерной лестнице клерка в какой-нибудь организации. Сначала ты ускоряешь перекладывание бумажек. Потом ты начинаешь разбираться с тем, как они устроены, как их классифицировать. Потом понимаешь, как организовать работу тех, кто работает с бумагами. Потом начинаешь понимать, как из этой информации вынимать важные стратегические инсайты для твоего бизнеса в целом. Продукты могут быть разными, они всегда заточены под потребности клиента.

Когда мы говорим про ИИ, про семантику, часто звучит слово «понимать». Что такое «ИИ понимает»?

Это большой вопрос, который сейчас стоит и перед исследовательскими коллективами, и перед индустрией. Под «пониманием» люди подразумевают разные вещи, и в этом месте мы ещё не договорились. На мой взгляд, это проблема, которую породили психология, гуманитарные знания и философия. А машинлёрнеры в него упёрлись, просто не ожидая. Мы-то думали, что всё уже придумано до нас, что уже есть готовое определение.

Как используется слово «понимание» сейчас в индустрии? Это некий state of the art, который заключается в следующем: если алгоритмически мы можем извлекать из информации более высокий уровень абстракции, чем некоторый baseline, то мы говорим, что это лучшее понимание. Мы не говорим, что это абсолютное понимание. Я понимаю что-то лучше, чем ты, если я оттуда могу извлечь больше полезной информации относительно некоторой метрики.

То есть понимание — это мера объёма формализованной информации, которую получается извлечь…

Да, совершенно верно, относительно метрики. А формализация метрики зависит от задач, от заказчика и так далее.

Сначала мы ушли от инвойсов на бумаге, они стали электронными. Вы всё ещё нужны, потому что их посылают в Excel, клепают как попало. Но дальше возникает государственный электронный документооборот, который формализован.

Если посмотреть на то, что происходит в мире сейчас — видно, что циклы взаимодействия начинают полностью уходить в электронщину, погружаться в неё. А как только они становятся электронными, сразу же приходят программисты. Они ваш хлеб съедают.

Мы умеем находить новый хлеб. Допустим, пример, который я приводил с DLT. Distributed ledger — это, по сути, похожая на блокчейн технология. История в следующем: у тебя есть контракт, ты хочешь что-то экспортировать в большом объёме своему партнеру. У вас есть много документов, которые нужно подготовить с обеих сторон для оформления сделки.

Ты можешь воспользоваться нашим решением, которое повышает уровень доверия к документообороту. Ты можешь всё это сделать в цифровом виде. Если это уже сделано в цифровом виде — супер, если нет — мы это всё конвертируем.

И дальше проверка экспортно-импортной документации происходит похожим образом, как происходит проверка записей в блокчейне: это некая распределённая цепочка, которая позволяет тебе и твоему партнёру удостовериться, что вы соответствуете всем тем правилам, которым вы должны соответствовать, каждый со своей стороны, чтобы осуществить эту сделку.

Что является источником правил?

У нас есть экспортно-импортное законодательство. Оно есть у каждой страны и может сильно отличаться. Мы ставили эксперимент: если сейчас оформление такой сделки может идти несколько дней, то с нашим решением — несколько часов.

Что вы сейчас придумываете? Где находится новый рынок? Очень понятная чисто формально картина: пришли документы — разобрались. Довольно понятная картина, когда у нас есть поток документооборота, и есть регулятивка, мы должны проверить его на соответствие. Но всё равно это некоторая совсем функциональная картина, когда бегают бумажки. Дальше за этим наверняка есть смысловая картина, аналитика.

ABBYY традиционно сильна естественным языком. Мы хотим и продолжаем в этом месте дальше развиваться. Кроме того, сейчас есть спрос на диджитализацию бизнес-процессов, когда всё на мобильном происходит. Раньше как было? Есть некоторый документооборот, как-то устроенный, и потом тебе надо положить данные в базу. Или, как сейчас чаще бывает, тебе надо сначала положить его в базу, а потом он как-то живёт.

Для того, чтобы это делать, нужно, чтобы на входе было мобильное устройство, которое умеет делать практически всё, что нужно, для того чтобы это положить в базу, или оно умеет на сервер ходить, и так далее. Понимание естественного языка — это очень горячо и важно, этого будет только больше. Самый лучший способ передавать информацию от одного умного объекта к другому — неважно, человек это или нет — речь или текст. Естественный язык — это большая тема, которой мы давно занимаемся и хотим дальше заниматься.

ABBYY: «Любой бизнес — это коммуникация»

Давай пройдёмся по бизнес-задачам, которых касается понимание естественного языка.

Их очень много. Если коротко, любая когнитивная деятельность требует понимания естественного языка. Давай с самого верха. По сути, любой бизнес — это коммуникация. Коммуникация бывает разных видов: сделка, указание, отчёт. Что касается внутри, in house: у тебя есть коммуникация, связанная со сделкой. Сделка — это заключение. Я тебя взял на работу, или ты меня — это тоже сделка.

Ещё есть отчёт, и есть некоторое указание. Это три больших типа бизнес-процессов. Все эти штуки в данный момент очевидно не оптимальны. Любой человек, который открывал Inbox в здравом уме, знает, что коммуникация внутри бизнеса не оптимальна. Поэтому понимание языка может работать на любом из этих уровней.

Ты сам сказал слово Inbox. Вы туда уже заходите?

Да. Например, у нас есть корпоративный поиск, который умеет искать по разным источникам внутри компании.

Мне кажется, это отдельная проблема, которая есть у любой компании — проблема сохранения знаний. Мы чётко понимаем, что человек пришёл, что-то поделал, сделал проект, что-то понял, осознал — но потом рано или поздно он всё равно уволился, и знания, которые он наработал, либо с ним ушли, либо остались в виде очень плохого футпринта.

Если они остались в виде ещё живого проекта — слава богу, а всё остальное похоронили по большому счёту. Задача сохранения знаний, их структуризации ложится на всё то, что вы умеете, как родная. Неужели вы этим не занимаетесь? Ты сейчас сказал про поиск. Это плохая картина. Если сделать шаг чуть раньше и пытаться не искать, а сразу забирать откуда-то из процесса?

Это крутая идея. Наверное, в этом направлении всё будет двигаться неизбежно. Возвращаясь к твоему вопросу. Есть много прекрасной статистики про то, что в среднестатистической компании в Европе файл, приложенный к письму, живёт дольше, чем сотрудник, его отправивший.

Какая шикарная мысль! Спасибо тебе за неё.

Но вообще ты, конечно, прав, и это большая проблема, потому что люди не думают о том, какой цифровой отпечаток они оставляют. Конечно, в этом направлении что-то будет происходить и уже происходит. Я не согласен с тобой, что поиск — это плохое решение. На самом деле это просто верный первый шаг, если тебе нужно правильно индексировать внутренний документооборот.

Я не говорю, что мы не будем дальше по этой дороге идти — наверняка будем, потому что это важный кусок. И ещё одна мысль, о которой стоит думать, сильно связана с тем, как меняется коммуникация, если мы возвращаемся к теме Inbox’а. Последние сто лет есть очевидный тренд на то, что коммуникация должна быть быстрее.

И вообще, эта идея итеративного апдейта версий, её апогеем является GitHub, условно говоря. Мысль как некоторая итеративно обновляющаяся история. Это большая интересная тема про бизнес. Если посмотришь публикации в науке — они так же устроены.

Можно я тебя по-другому спрошу, чтобы высветить то, что ты сказал? Я очень чётко осознал и очень жёстко настаиваю на таком формате. Например, мы с клиентом взаимодействуем на предмет запуска проекта, и он говорит: «Сейчас мы напишем ТЗ». И первое, что я отвечаю: «Не надо! У вас есть сегодня что-то в голове? Откройте Google Docs, вылейте в него всё, что есть — сейчас. Ни секунды не затормаживая, отдайте его нам или кому-то ещё».

Да, такой seamless-процесс непрерывного обновления.

Да. И дальше мы пойдём его обновлять: мы будем вопросы задавать, вы будете его апдейтить. Это некоторый жизненный процесс. Ты про это сейчас говоришь?

Да. Обратной стороной медали в этой ситуации является проблема, которая связана с тем, что 90% мыслей не додуманы. Недодуманность — это естественное состояние 90% мыслей.

Отличная фраза! Причём она абсолютно верная.

На самом деле, ни одна бизнес-организация не решила для себя, какой из двух вариантов лучше и где находится правильный баланс. Очевидно, что в ситуации, когда всё забюрократизировано, когда любая мысль додумана — там очень мало мыслей.

А на другой стороне у тебя вечная разработка и отсутствие MVP. И баланс очень сильно зависит от процессов внутри. Конечно же, в этом месте правильный скоринг того, что происходит, наладка процессов и того, как люди взаимодействуют друг с другом — это хорошее поле для автоматизации.

И здесь ИИ может нам помочь, потому что он способен хорошо оценивать качество по формальным признакам. Мы сами плохо умеем по формальным признакам — мы придумали идею, и она нам очень нравится. У когнитивных психологов есть история про то, что первая идея всегда не самая креативная. Креативное решение приходит обычно после длительного периода фрустрации.

А первая идея — ты её жутко любишь, тебе кажется, что ты просто чёртов гений и придумал что-то потрясающее. На самом деле, к сожалению, это не всегда так. И внедрение в том или ином виде в эту процедуру ИИ, который понимает естественный язык — это очень большая и интересная тема.

Так как фрагментализируется процесс коммуникации, человек начинает терять контекст. Очень быстро ты начинаешь понимать, что локальный контекст — это прямо локальный, пять минут! В этом месте ИИ может брать и вести эту тему?

Да, мы это уже немного обсудили. Это та самая история про процент недодуманных мыслей. Есть совершенно великое кино, «Иноходец. Урок Перельмана». Там есть великий русский математик, Миша Громов, который в какой-то момент говорит великолепную вещь, когда его спрашивают, почему Перельман уехал из США и сидел в Петербурге столько лет: «Человек хотел задуматься над проблемой как следует. Ему для этого нужно, чтобы его никто не трогал. Ему для этого потребовалось семь лет». Эта способность к сосредоточенному интеллектуальному усилию, которая на самом деле бывает важна.

Другое дело, когда у тебя бизнес-процессы устроены так, что ты разрешаешь, чтобы 99% мыслей были не додуманы, тогда ты естественным образом выкорчёвываешь эту способность к интеллектуальному усилию и выкорчёвываешь людей, которые ей обладают. И тонкий момент заключается в том, что ты должен понимать для своего бизнеса, сколько на самом деле тебе нужно людей, способных к этому интеллектуальному усилию.

То, что нужно поддерживать контекст при коммуникации — это действительно можно делать, и это здорово. Но это не отменяет того, что в любой компании должен быть процент людей, способных к интеллектуальному усилию. В ABBYY он есть, благодаря этому компания делает хорошие продукты.

Компания ABBYY нам сегодня говорит, что, несмотря на то, что у неё есть феноменальные технологические инструменты, которые готовы нам помочь организовать нашу ноосферу — будущее человечества в руках человека и его способности оторваться от мирского и погрузиться в гениальную задачу.

#интервью #dzonline #искусственныйинтеллект

3 комментария

Yan Yanov

29.06.2018

Нихрена не понел, но звучит убедительно, надо брать...

Ответить

Maxim Postnikov

30.06.2018

С одной стороны - это очень интересно. Но материал получился очень поверхностный. Как те самые 90% мыслей, которые недодуманы. В каждом абзаце недосказанность. Хочется по каждому пункту запросить подробности.
С другой стороны, если каждую мысль развить, получится в лучшем случае большое эссе, а в худьшем - серьезная книга, которую прочитают 15 человек, а остальные забьют.

Ivan Yamshchikov

Максим, спрашивайте. Книгу не обещаю, но детальнее что-то расскажу с удовольствием.