Продолжение истории уже в подписке на Кинопоиске
Продолжение истории уже в подписке на Кинопоиске
Условия подписки: clck.ru/rfS2r
16+
Далее автопродление — 299 ₽/мес. Предложение до 31.07.2022 г. Подробнее: clck.ru/rfS2r
Личный опыт
Dbrain

«Не слушайте друзей, слушайте рынок»: команда Dbrain о том, как стартапу найти свое призвание

В прошлый раз Дима Мацкевич, Леша Хахунов и Леша Цишевский рассказали, как попасть в YC. Сегодня — как сделать нужный клиенту продукт и заработать на этом. Спойлер — вероятно, получится не сразу.

Choose your fighter: CEO Дима Мацкевич, СTO Леша Хахунов и СOO Леша Цишевский 

Коротко о Dbrain:

  • Сделали продукт извлечения данных из документов по API.
  • За последний год достигли $1 млн ARR в России — Dbrain пользуются в «Яндексе», Россетях, крупных банках и страховых.
  • Прошли в акселератор Y Combinator и на днях подписали первого клиента в Америке.

C чего все начиналось: ИИ, пицца и коровы

Леша Хахунов: Три года назад в мире уже активно развивались решения на базе машинного обучения — они вышли из лабораторий и начали разбираться с реальными задачами в индустриях. В России спрос на deeptech тоже начал расти, и мы с Димой решили зайти на рынок, сделав Dbrain.

Я раньше создавал роботов и нейросети для сельского хозяйства, а Дима запустил ИТ-стартап и продал его Qiwi за $20 млн. Позже к нам присоединился Леша — он запускал Uber в регионах России. Получилось классическое трио — технарь, стратег и операционист.

Мы сфокусировались на компьютерном зрении — для этого сделали платформу для быстрого создания индустриальных решений и брались за любые задачи, в которых человеческий глаз можно заменить камерой и нейросетью.

Выглядело это так: платформа по разметке данных готовила датасеты, а дата-сайентисты обучали модели. DS нанимали в штат и параллельно отдавали работу на аутсорс — в зависимости от сложности.

В итоге область реализованных кейсов получилась максимально широкой: наши нейросети проверяли качество румяных бортов пиццы, отслеживали движения работников на птицефабриках, следили за здоровьем коров и улучшали компьютерную графику. Работали с крупными компаниями: Mercedes-Benz, Nestle, Nvidia и «Додо пиццей».

Московский офис Dbrain c корпоративным слоганом на стене

Первый блин — комом

Леша Цишевский: Когда я пришел в компанию, Dbrain был фабрикой по производству ИИ, выпускающей рабочие решения для индустрий.

Главный плюс многопрофильного подхода был в том, что ребята тестировали продуктовые гипотезы и получили широкий кругозор о реальных потребностях рынка. Однако минусов было больше — некоторые сразу бросались в глаза, другие появлялись в процессе работы. Спустя год после основания компании стало понятно — от первоначальной бизнес-модели надо отказаться. И вот почему:

  • Продукт невозможно масштабировать: каждое решение заточено под конкретного клиента.
  • Разработка теряла мотивацию: их выматывало каждый раз создавать технологию под новую задачу и поддерживать работу текущих.
  • Слишком широкий кастдев не позволял получить глубокую экспертизу внутри отрасли, из которой приходил клиент.
  • Цикл b2b-продаж затягивался на годы.

Стартап без кастдева — деньги на ветер

Дима Мацкевич: Построить космолет, который будет успешен для всех кейсов, невозможно — у вас не хватит ресурсов. Еще на старте нам нужно было отказаться от многих направлений и идти кастдевить глубже в одну-две области, где мы нащупали наиболее острую потребность в решении.

В итоге мы так и сделали, но потратили почти год на то, чтобы это осознать. Не совершайте наших ошибок — ищите свой фокус как можно раньше.

Пройдитесь по рынку и узнайте, у кого что болит. Слушайте клиентов: не надо уговаривать их, что ваша идея выстрелит, дайте им поделиться своими проблемами — это подтолкнет к созданию продукта, на который будет спрос.

Леша Цишевский: Одна из задач кастдева — найти правильного человека для интервью. Поначалу мы заходили в компании и шли прямиком к Chief Innovation Officer, человеку, ответственному за инновации. Казалось, мы идеально друг другу подходим — ИИ и инновации. И в принципе это правда, CIO — хорошая и нужная роль для понимания карты потребностей.

Но если задача — оценить силу потребности, надо идти в operations, где люди глубоко понимают процессы и связанные с ними метрики. Именно на основе интервью с операционистами мы в итоге принимали решения — стоит ли делать продукт и сколько за него готовы платить.

Документы — мои документы

Дима: Пообщавшись с десятками компаний, мы нашли запрос, повторяющийся сразу в нескольких индустриях — обработка бумажных документов. С ними имеют дело банки, страховые компании, МФО, авиакомпании, клиники и многие другие.

Они каждый день обрабатывают тысячи документов — переводят их в цифровой формат и перебивают данные во внутренние системы. Эта работа требует больших вложений: надо нанять штат сотрудников, снять офис и собрать управляющий персонал.

Леша Хахунов: Когда мы пришли на рынок, там уже были решения по распознаванию — OCR, шаблонизаторы и другое ПО. Мы изучали их, пытаясь понять, почему, несмотря на их количество, клиенты не могут избавиться от головной боли. В итоге сделали следующие выводы: распознаваний — много, но нет полной автоматизации процесса. OCR распознает текст, но с ограничениями. Например, он не способен прочитать рукописный текст, который по-прежнему встречается во многих документах, и его результат сильно зависит от качества исходного изображения.

Леша Цишевский: Из глубинных интервью мы поняли, что клиенты не хотят возиться с документами, но им приходится. ПО на рынке закрывают только несколько задач из цепочки, все остальное, что решения не покрывают, необходимо делать руками сотрудников. Из-за этого страдает бизнес: клиент отвлекается на непрофильный процесс, не может масштабироваться и тратит деньги.

Помните, клиент хочет вылечить болезнь, а не глушить симптомы таблетками.

Леша Хахунов: Мы решили — раз запрос есть, а полноценного решения на рынке нет, сделаем первую по-настоящему автоматизированную систему обработки документов. К тому моменту у нас были все ресурсы для решения: своя платформа по разметке данных, сильная команда дата-сайентистов и потенциальные клиенты, готовые помочь с датасетом.

Леша тестирует новый стендап на участниках Сколково — как видно, заходит не всем

Сколько нужно нейросетей, чтобы распознать один паспорт

Леша Хахунов: Начали с паспорта — самого важного и нужного документа. Разметили тысячу паспортов, собрали первые архитектуры моделей и обернули это в серверное решение. Получили качество распознавания чуть выше 60%. Мало, но цифры были близки к тому, как работают альтернативные решения. Мы хотели улучшить работу системы, поэтому пошли искать косяки. В итоге обнаружили кучу подводных камней, о которых на начальном этапе не подозревали.

Для того, чтобы нейросеть без ошибок извлекла данные из документа, нужно сделать несколько вещей. Во-первых, убедиться, что перед ней действительно паспорт — мало ли что попало в пачку файлов. Во-вторых, пользователи клиентов часто фотографируют документы с искаженной перспективой, вверх ногами, на фоне ковра или кота. Поэтому, чтобы нейросеть справилась со своей работой, изображение нужно привести в нужный вид.

Так мы сделали еще несколько нейросетей, чья работа — прогонять файл через конвейер. Одна классифицирует, вторая выравнивает, третья вырезает фон у документа. В итоге получилось поднять качество распознавания на высокий уровень — за 90%.

Дима: Мы отталкивались от нужд клиентов, что потребовало от нас гибкости в плане добавления новых видов документов. Набравшись опыта на паспортах, мы стали дальше обучать нейросети: добавили ИНН, водительские права, СТС, ПТС, СНИЛС. Всего около 25 типов документов за полгода.

Продукт с самого начала делали так, чтобы клиент мог им пользоваться без привлечения штата разработки. Наша задача — срезать его косты и оптимизировать процессы, а не создать дополнительные расходы. Поэтому извлечение данных можно использовать через простой API, а система легко интегрируется в сервисы клиентов.

Рашн курсив мейкс ми край

Леша Хахунов: Я уже сказал, что камень преткновения существующих решений — рукописный текст, который достойно не берет ни один OCR. Поэтому что делают некоторые конкуренты — они нанимают в штат людей, которые перебивают рукописный текст в системы.

Мы ИТ-стартап, нанимать операторов в штат для ручного труда как-то не по-стартаперски. Поэтому пошли искать более изящное решение. Первой мыслью было натаскать для этого нейросети, но довольно быстро мы спустились с небес на землю.

Ни один ИИ пока не в силах обеспечить стопроцентное качество распознавания. Почерк — вещь индивидуальная, да и качество съемки вносит свои коррективы. Но все-таки 20% кейсов удалось закрыть нейросетью: она правильно извлекает информацию, если перед ней, например, анкета, где в каждую клеточку человек аккуратно вписал по букве.

Чтобы решить остальные 80%, нам все же нужны были люди. Силами своей платформы по разметке закрыть проблему не получилось — там нет необходимой инфраструктуры для того, чтобы в режиме реального времени отдавать задачи и получать результат без ошибок. На помощь пришел «Яндекс» и его краудсорсинговая платформа «Толока», где разметчики в режиме реального времени выполняют твои задачки за вознаграждение.

Теперь, когда в систему приходит документ, который нейросети не по силам распознать, мы отправляем его в «Толоку». Вырезаем поля из документов, анонимизируем их, а толокеры мгновенно выполняют работу. Помимо рукописного текста отдаем им и печатный текст — в тех случаях, когда качество снимка слишком плохое.

Для высокого качества и скорости разметки мы используем dadata для интеграции со справочниками адресов ФИАС, чтобы разметчики не перебивали данные целиком, а выбирали готовый вариант

Объединить работу людей и машин оказалось трудной задачей — чуть ли не сложнее, чем обучить нейросети. Для этого нам пришлось разработать собственный интерфейс и внедрить его в «Толоку», чтобы разметчики могли прочитать текст, вписать его в поле и сохранить аккуратность. А еще нам нужно было идеальное качество, поэтому каждая задача сначала выполняется одной группой человек, а потом перепроверяется другой.

Приятный бонус — результаты разметки в «Толоке» мы используем для дальнейшего обучения ИИ. 20% не предел, пусть дальше учится читать беспощадный русский курсив.

Дима: Дружба человека с ИИ позволила полностью взять задачу по извлечению документов на себя. Об этом мы и мечтали: клиент занимается любимым делом и не думает о документах.

Три вывода, если лень читать статью

Инструкция по применению: распечатать, заламинировать и носить с собой на каждую встречу с инвесторами

Леша Хахунов: ИТ-стартапы любят строить космические корабли, которые и на Марс полетят, и коня на скаку остановят. Это заметно по YC-заявкам соотечественников: молодые предприниматели с горящими глазами рассказывают, что готовы делать абсолютно всё.

Мы тоже так думали — не ставили себе никаких рамок и создавали совершенно разные продукты. Но если вы стартап, который только начинает свой путь в бизнесе, не спешите строить весь корабль (он вряд ли полетит), сначала сделайте одну деталь и попробуйте продать ее другим производителям кораблей.

Леша Цишевский: Самое ценное, что может сделать стартап, — это совершить максимальное количество ошибок при запуске, сделать выводы и пойти дальше. Мы поняли со временем: нельзя идти в поход, захватив с собой весь дом. Надо взять рюкзак и положить в него только самое необходимое, в том числе — фонарик кастдева, чтобы найти верную тропинку.

Дима: Если после кастдева становится понятно, что идея не окупится, — откажитесь от нее. Я знаю, что это сложно: вы вложили туда кучу времени, энергии и друзья говорили, что она по-любому выстрелит. Но если вы хотите сделать продукт, который будет приносить прибыль, надо идти не к друзьям — надо слушать рынок. Поиск продуктовой ниши в стартапе как поиск себя — никогда не прекращается.

4 июня Леша Хахунов выступит на онлайн-митапе «Яндекс.Толоки», где расскажет о разметке рукописного текста и ответит на вопросы зрителей. Если интересно — присоединяйтесь, инвайт на канале.

Канал Димы Мацкевича — о мозге, полезных привычках, ментальном Кунг-Фу, энергии и предпринимательстве.

Канал Леши Хахунова — об искусственном интеллекте, ИТ-компаниях и технологиях.

Канал Леши Цишевского — про построение ИТ-компании и поиски психического равновесия.

0
22 комментария
Написать комментарий...
Аарон Малис

Почему у всех стартапов все истории одинаковы? Нет чтобы: переспал с дочкой депутата, стыбрил ключ от хаты, я, Диман и Леха на след день обнесли хату и пошли тусить по компьютерным клубам, набухались, с няшкой познакомились, она на конференцию нас какую-то привела, там программист Славик, ботан ботаном, но, сука, гениальный, прогу какую-то написал, мы его уговорили показать, прога оказалсь офигенная, дата, саенс, все дела, ну мы Славика связали и комп забрали, сделали пару звонков депутату, навели на Славика, типа он хату обнес. Дали Славику 5 лет, а депутат нас в какой-то комбинатор запихал, рассказал о нас, как о перспективных технарях, а мы, гы-гы, ваще ни тоси боси, через знакомых инвестиции, доделали продукт и сразу контракт с Яндексом получили, теперь снимаем профит. Слава, привет тебе от пацанов! 

Ответить
Развернуть ветку
Kate Khoshabova

Когда все вокруг успешные Диман и Леха, а ты — тот Славик, которому 5 лет дали 

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Sakari Sauso

Молодцы, хуле

Ответить
Развернуть ветку
Vsevolod Nesterenk

звучит намного лучше чем корпоративный слоган

Ответить
Развернуть ветку
Dbrain
Автор

А кому-то нравится 🙂

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Anatoly

Почему все Дима и Леша и Леша? Во сколько лет станут полные имена, а во сколько с отчеством? )))

Ответить
Развернуть ветку
Dbrain
Автор

Анатолий, когда фаундеры будут выглядеть так: 

Ответить
Развернуть ветку
Миша Магадан

Не расстанусь с комсомолом, буду вечно молодым!

Ответить
Развернуть ветку
Alexey Smirnov

Статья про успешных людей, которые стали ещё успешнее =)

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
David Akopyan

Вот здесь очень хорошо и подробно это объясняется: 

https://rb.ru/opinion/kto-etot-chelovek/

– В современном маркетинге существует интересный метод проведения таких исследований, который хорошо себя зарекомендовал – customer development или сокращенно CusDev

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Vlad Romanchenko

Противоположное jack-of-all-trades. Не решать все понемногу, а углубиться. Хотя как и везде работает везение + "50% запросов идут с первых 2 ссылок первой страницы".

Ответить
Развернуть ветку
vic buynoff

Так что такое  jack-of-all-trades?

Ответить
Развернуть ветку
Polina Bacho

Ясно, одной Славика не уделать)

Ответить
Развернуть ветку
vic buynoff

Одной нет. Потребуются минимум две близняшки-блондинки

Ответить
Развернуть ветку
vic buynoff
 Мы решили — раз запрос есть, а полноценного решения на рынке нет, сделаем первую по-настоящему автоматизированную систему обработки документов.

Лол што? Таких систем на рынке дополна. Еще один велосипед?

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Kirill

Достаточно странно читать про историю "успеха" проекта или компании, которая не платит деньги своим подрядчикам.
У нас в телеграмме есть чат (https://t.me/Handl_info), где исполнители Handl уже месяцами просят выплатить им заработанные деньги.

Handl раз в месяц пишет что-то невнятное и кормит завтраками, рассказывая при этом, что платформа для вывода денег не работает.

Хотя у компании наверняка есть куча других способов и возможностей заплатить деньги и выполнить наконец-то свои обязательства.

Но вместо этого "фаундеры" предпочитают рассказывать всем какие они классные.

По-моему им должно быть как минимум стыдно.

Ответить
Развернуть ветку
Читать все 22 комментария
null