«Не слушайте друзей, слушайте рынок»: команда Dbrain о том, как стартапу найти свое призвание

В прошлый раз Дима Мацкевич, Леша Хахунов и Леша Цишевский рассказали, как попасть в YC. Сегодня — как сделать нужный клиенту продукт и заработать на этом. Спойлер — вероятно, получится не сразу.

Choose your fighter: CEO Дима Мацкевич, СTO Леша Хахунов и СOO Леша Цишевский 
Choose your fighter: CEO Дима Мацкевич, СTO Леша Хахунов и СOO Леша Цишевский 

Коротко о Dbrain:

  • Сделали продукт извлечения данных из документов по API.
  • За последний год достигли $1 млн ARR в России — Dbrain пользуются в «Яндексе», Россетях, крупных банках и страховых.
  • Прошли в акселератор Y Combinator и на днях подписали первого клиента в Америке.

C чего все начиналось: ИИ, пицца и коровы

Леша Хахунов: Три года назад в мире уже активно развивались решения на базе машинного обучения — они вышли из лабораторий и начали разбираться с реальными задачами в индустриях. В России спрос на deeptech тоже начал расти, и мы с Димой решили зайти на рынок, сделав Dbrain.

Я раньше создавал роботов и нейросети для сельского хозяйства, а Дима запустил ИТ-стартап и продал его Qiwi за $20 млн. Позже к нам присоединился Леша — он запускал Uber в регионах России. Получилось классическое трио — технарь, стратег и операционист.

Мы сфокусировались на компьютерном зрении — для этого сделали платформу для быстрого создания индустриальных решений и брались за любые задачи, в которых человеческий глаз можно заменить камерой и нейросетью.

Выглядело это так: платформа по разметке данных готовила датасеты, а дата-сайентисты обучали модели. DS нанимали в штат и параллельно отдавали работу на аутсорс — в зависимости от сложности.

В итоге область реализованных кейсов получилась максимально широкой: наши нейросети проверяли качество румяных бортов пиццы, отслеживали движения работников на птицефабриках, следили за здоровьем коров и улучшали компьютерную графику. Работали с крупными компаниями: Mercedes-Benz, Nestle, Nvidia и «Додо пиццей».

Московский офис Dbrain c корпоративным слоганом на стене
Московский офис Dbrain c корпоративным слоганом на стене

Первый блин — комом

Леша Цишевский: Когда я пришел в компанию, Dbrain был фабрикой по производству ИИ, выпускающей рабочие решения для индустрий.

Главный плюс многопрофильного подхода был в том, что ребята тестировали продуктовые гипотезы и получили широкий кругозор о реальных потребностях рынка. Однако минусов было больше — некоторые сразу бросались в глаза, другие появлялись в процессе работы. Спустя год после основания компании стало понятно — от первоначальной бизнес-модели надо отказаться. И вот почему:

  • Продукт невозможно масштабировать: каждое решение заточено под конкретного клиента.
  • Разработка теряла мотивацию: их выматывало каждый раз создавать технологию под новую задачу и поддерживать работу текущих.
  • Слишком широкий кастдев не позволял получить глубокую экспертизу внутри отрасли, из которой приходил клиент.
  • Цикл b2b-продаж затягивался на годы.

Стартап без кастдева — деньги на ветер

Дима Мацкевич: Построить космолет, который будет успешен для всех кейсов, невозможно — у вас не хватит ресурсов. Еще на старте нам нужно было отказаться от многих направлений и идти кастдевить глубже в одну-две области, где мы нащупали наиболее острую потребность в решении.

В итоге мы так и сделали, но потратили почти год на то, чтобы это осознать. Не совершайте наших ошибок — ищите свой фокус как можно раньше.

Пройдитесь по рынку и узнайте, у кого что болит. Слушайте клиентов: не надо уговаривать их, что ваша идея выстрелит, дайте им поделиться своими проблемами — это подтолкнет к созданию продукта, на который будет спрос.

Леша Цишевский: Одна из задач кастдева — найти правильного человека для интервью. Поначалу мы заходили в компании и шли прямиком к Chief Innovation Officer, человеку, ответственному за инновации. Казалось, мы идеально друг другу подходим — ИИ и инновации. И в принципе это правда, CIO — хорошая и нужная роль для понимания карты потребностей.

Но если задача — оценить силу потребности, надо идти в operations, где люди глубоко понимают процессы и связанные с ними метрики. Именно на основе интервью с операционистами мы в итоге принимали решения — стоит ли делать продукт и сколько за него готовы платить.

Документы — мои документы

Дима: Пообщавшись с десятками компаний, мы нашли запрос, повторяющийся сразу в нескольких индустриях — обработка бумажных документов. С ними имеют дело банки, страховые компании, МФО, авиакомпании, клиники и многие другие.

Они каждый день обрабатывают тысячи документов — переводят их в цифровой формат и перебивают данные во внутренние системы. Эта работа требует больших вложений: надо нанять штат сотрудников, снять офис и собрать управляющий персонал.

Леша Хахунов: Когда мы пришли на рынок, там уже были решения по распознаванию — OCR, шаблонизаторы и другое ПО. Мы изучали их, пытаясь понять, почему, несмотря на их количество, клиенты не могут избавиться от головной боли. В итоге сделали следующие выводы: распознаваний — много, но нет полной автоматизации процесса. OCR распознает текст, но с ограничениями. Например, он не способен прочитать рукописный текст, который по-прежнему встречается во многих документах, и его результат сильно зависит от качества исходного изображения.

Леша Цишевский: Из глубинных интервью мы поняли, что клиенты не хотят возиться с документами, но им приходится. ПО на рынке закрывают только несколько задач из цепочки, все остальное, что решения не покрывают, необходимо делать руками сотрудников. Из-за этого страдает бизнес: клиент отвлекается на непрофильный процесс, не может масштабироваться и тратит деньги.

Помните, клиент хочет вылечить болезнь, а не глушить симптомы таблетками.

Леша Хахунов: Мы решили — раз запрос есть, а полноценного решения на рынке нет, сделаем первую по-настоящему автоматизированную систему обработки документов. К тому моменту у нас были все ресурсы для решения: своя платформа по разметке данных, сильная команда дата-сайентистов и потенциальные клиенты, готовые помочь с датасетом.

Леша тестирует новый стендап на участниках Сколково — как видно, заходит не всем
Леша тестирует новый стендап на участниках Сколково — как видно, заходит не всем

Сколько нужно нейросетей, чтобы распознать один паспорт

Леша Хахунов: Начали с паспорта — самого важного и нужного документа. Разметили тысячу паспортов, собрали первые архитектуры моделей и обернули это в серверное решение. Получили качество распознавания чуть выше 60%. Мало, но цифры были близки к тому, как работают альтернативные решения. Мы хотели улучшить работу системы, поэтому пошли искать косяки. В итоге обнаружили кучу подводных камней, о которых на начальном этапе не подозревали.

Для того, чтобы нейросеть без ошибок извлекла данные из документа, нужно сделать несколько вещей. Во-первых, убедиться, что перед ней действительно паспорт — мало ли что попало в пачку файлов. Во-вторых, пользователи клиентов часто фотографируют документы с искаженной перспективой, вверх ногами, на фоне ковра или кота. Поэтому, чтобы нейросеть справилась со своей работой, изображение нужно привести в нужный вид.

Так мы сделали еще несколько нейросетей, чья работа — прогонять файл через конвейер. Одна классифицирует, вторая выравнивает, третья вырезает фон у документа. В итоге получилось поднять качество распознавания на высокий уровень — за 90%.

Дима: Мы отталкивались от нужд клиентов, что потребовало от нас гибкости в плане добавления новых видов документов. Набравшись опыта на паспортах, мы стали дальше обучать нейросети: добавили ИНН, водительские права, СТС, ПТС, СНИЛС. Всего около 25 типов документов за полгода.

Продукт с самого начала делали так, чтобы клиент мог им пользоваться без привлечения штата разработки. Наша задача — срезать его косты и оптимизировать процессы, а не создать дополнительные расходы. Поэтому извлечение данных можно использовать через простой API, а система легко интегрируется в сервисы клиентов.

Рашн курсив мейкс ми край

Леша Хахунов: Я уже сказал, что камень преткновения существующих решений — рукописный текст, который достойно не берет ни один OCR. Поэтому что делают некоторые конкуренты — они нанимают в штат людей, которые перебивают рукописный текст в системы.

Мы ИТ-стартап, нанимать операторов в штат для ручного труда как-то не по-стартаперски. Поэтому пошли искать более изящное решение. Первой мыслью было натаскать для этого нейросети, но довольно быстро мы спустились с небес на землю.

Ни один ИИ пока не в силах обеспечить стопроцентное качество распознавания. Почерк — вещь индивидуальная, да и качество съемки вносит свои коррективы. Но все-таки 20% кейсов удалось закрыть нейросетью: она правильно извлекает информацию, если перед ней, например, анкета, где в каждую клеточку человек аккуратно вписал по букве.

Чтобы решить остальные 80%, нам все же нужны были люди. Силами своей платформы по разметке закрыть проблему не получилось — там нет необходимой инфраструктуры для того, чтобы в режиме реального времени отдавать задачи и получать результат без ошибок. На помощь пришел «Яндекс» и его краудсорсинговая платформа «Толока», где разметчики в режиме реального времени выполняют твои задачки за вознаграждение.

Теперь, когда в систему приходит документ, который нейросети не по силам распознать, мы отправляем его в «Толоку». Вырезаем поля из документов, анонимизируем их, а толокеры мгновенно выполняют работу. Помимо рукописного текста отдаем им и печатный текст — в тех случаях, когда качество снимка слишком плохое.

Для высокого качества и скорости разметки мы используем dadata для интеграции со справочниками адресов ФИАС, чтобы разметчики не перебивали данные целиком, а выбирали готовый вариант

Объединить работу людей и машин оказалось трудной задачей — чуть ли не сложнее, чем обучить нейросети. Для этого нам пришлось разработать собственный интерфейс и внедрить его в «Толоку», чтобы разметчики могли прочитать текст, вписать его в поле и сохранить аккуратность. А еще нам нужно было идеальное качество, поэтому каждая задача сначала выполняется одной группой человек, а потом перепроверяется другой.

Приятный бонус — результаты разметки в «Толоке» мы используем для дальнейшего обучения ИИ. 20% не предел, пусть дальше учится читать беспощадный русский курсив.

Дима: Дружба человека с ИИ позволила полностью взять задачу по извлечению документов на себя. Об этом мы и мечтали: клиент занимается любимым делом и не думает о документах.

Три вывода, если лень читать статью

Инструкция по применению: распечатать, заламинировать и носить с собой на каждую встречу с инвесторами
Инструкция по применению: распечатать, заламинировать и носить с собой на каждую встречу с инвесторами

Леша Хахунов: ИТ-стартапы любят строить космические корабли, которые и на Марс полетят, и коня на скаку остановят. Это заметно по YC-заявкам соотечественников: молодые предприниматели с горящими глазами рассказывают, что готовы делать абсолютно всё.

Мы тоже так думали — не ставили себе никаких рамок и создавали совершенно разные продукты. Но если вы стартап, который только начинает свой путь в бизнесе, не спешите строить весь корабль (он вряд ли полетит), сначала сделайте одну деталь и попробуйте продать ее другим производителям кораблей.

Леша Цишевский: Самое ценное, что может сделать стартап, — это совершить максимальное количество ошибок при запуске, сделать выводы и пойти дальше. Мы поняли со временем: нельзя идти в поход, захватив с собой весь дом. Надо взять рюкзак и положить в него только самое необходимое, в том числе — фонарик кастдева, чтобы найти верную тропинку.

Дима: Если после кастдева становится понятно, что идея не окупится, — откажитесь от нее. Я знаю, что это сложно: вы вложили туда кучу времени, энергии и друзья говорили, что она по-любому выстрелит. Но если вы хотите сделать продукт, который будет приносить прибыль, надо идти не к друзьям — надо слушать рынок. Поиск продуктовой ниши в стартапе как поиск себя — никогда не прекращается.

4 июня Леша Хахунов выступит на онлайн-митапе «Яндекс.Толоки», где расскажет о разметке рукописного текста и ответит на вопросы зрителей. Если интересно — присоединяйтесь, инвайт на канале.

Канал Димы Мацкевича — о мозге, полезных привычках, ментальном Кунг-Фу, энергии и предпринимательстве.

Канал Леши Хахунова — об искусственном интеллекте, ИТ-компаниях и технологиях.

Канал Леши Цишевского — про построение ИТ-компании и поиски психического равновесия.

7575
22 комментария

Почему у всех стартапов все истории одинаковы? Нет чтобы: переспал с дочкой депутата, стыбрил ключ от хаты, я, Диман и Леха на след день обнесли хату и пошли тусить по компьютерным клубам, набухались, с няшкой познакомились, она на конференцию нас какую-то привела, там программист Славик, ботан ботаном, но, сука, гениальный, прогу какую-то написал, мы его уговорили показать, прога оказалсь офигенная, дата, саенс, все дела, ну мы Славика связали и комп забрали, сделали пару звонков депутату, навели на Славика, типа он хату обнес. Дали Славику 5 лет, а депутат нас в какой-то комбинатор запихал, рассказал о нас, как о перспективных технарях, а мы, гы-гы, ваще ни тоси боси, через знакомых инвестиции, доделали продукт и сразу контракт с Яндексом получили, теперь снимаем профит. Слава, привет тебе от пацанов! 

21
Ответить

Когда все вокруг успешные Диман и Леха, а ты — тот Славик, которому 5 лет дали 

4
Ответить

Молодцы, хуле

13
Ответить

звучит намного лучше чем корпоративный слоган

10
Ответить

Почему все Дима и Леша и Леша? Во сколько лет станут полные имена, а во сколько с отчеством? )))

5
Ответить

Анатолий, когда фаундеры будут выглядеть так: 

5
Ответить