Dim Dimych

+6
с 2023
2 подписчика
12 подписок

Это все классно, конечно. Но, подозреваю, что проблема не в интервью, а в катастрофически низкой зарплате. По статистике у вас она (если мы берём официальные данные, разумеется) 55 тыс.
Выглядит грустно(

Зато, наверное, печеньки бесплатно))

Вы не отвечаете, а это скучно. А я потратил ещё минут 15 и думаю понял почему в ООО Дибрейн в 2021 году было 3 человека, а в 2022 году стало 9.

Нашёл вот это https://reestr.digital.gov.ru/reestr/566747/?sphrase_id=2885191

Получается, что в декабре 2021 года вы получили 20 млн руб от Фонда Содействия Инновациям на 1 год. По этому проекту вы должны были не почти всю сумму потратить на зарплаты сотрудников в штате. Для этого пришлось включить ещё ребят в ООО.

А вот почему в 2021 году в компании было только 3 человека есть только догадка. Наверное, так интересней показывать финансовые показатели инвесторам. Тут могу ошибаться.

И разработчики Dbrain работают в 4 или нескольких юрлицах? Вроде одно дело делают. Зачем такая непрозрачность?

Я на вас подписан. И текст хороший) но когда читаю, то предпочитаю думать и проверять информацию. Если 4 юрлица, то нужно давать больше информации. Укажите их и тогда будет понятна хоть немного задача. Иначе это выглядит как треш. На сайте есть ещё AVX COLLECTION LTD, но это какая-то не российская история.

Конечно, можно. Но по тексту создаётся ощущение масштаба, так как если кто-то из этих 5 человек боится быть уволенным, то о здоровом микроклимате думать не приходится.

Яна, вы конечно пишите, что у вас небольшая команда, но вас 9 человек всего в сервисе статистики https://navigator.sk.ru/orn/1123449 . Из них видимо 2 основателя, вы и наверное есть ещё и секретарь. С кем вы так усердно работаете на мотивацию? С 5-ю сотрудниками? Или вы уже к следующему месту работы готовитесь

Алексей, проверка Яндексом на риск звучит не очень. У них у самих менее чем за год 3 крупные утечки данных (в том числе у них утекли персданные клиентов и программный код).

А Илья, да, мог бы предоставить скриншот ситуации с которой столкнулся и тогда не было бы вопросов про рекламу и про риск использования вашего деперсонализатора.

Илья, здравствуйте! Дублирую в вашу свежую статью вопросы про ваше решение по распознаванию документов из другой темы.

1) вы писали, что у вас 93-97% качество распознавания. Скажите это качество по полям или по символам? На чем измеряли (фото, сканы)? Были ли в выборке пережатые сканы с МФУ? На каком количестве страниц вы делали замеры?

2) Вы писали что используете для распознавания символов OCR от Google - Tesseract и другие открытые OCR. По моему мнению именно технология OCR это 95% всего процесса распознавания. Я имею в виду что именно OCR это основной элемент системы распознавания. Например, сколько вложено в Tesseract разработчиками и потом Google даже сложно сказать. Может 10+ млн долларов, а может и сильно больше. Думаю вы понимаете, что именно поэтому в мире работающих OCR всего штук 10, а может и меньше. Поэтому когда в ПО чужая OCR говорить что нет зависимости странно. Сегодня открытые, а завтра в текущих реалиях закрытые.

Можете рассказать сколько человеко-лет вы вложили в разработку? Кто из учёных курирует разработку?

Спасибо за ответ. Но он вызывает ещё больше вопросов.

1) 93-97% это качество по полям или по символам? На чем измеряли (фото, сканы)? Были ли в выборке пережатые сканы с МФУ? На каком количестве страниц вы делали замеры?

2) Когда я писал про 95% всего процесса, я имел в виду что именно OCR это основной элемент системы распознавания. Например, сколько вложено в Tesseract разработчиками и потом Google даже сложно сказать. Может 10+ млн долларов, а может и сильно больше. Думаю вы понимаете, что именно поэтому в мире работающих OCR всего штук 10, а может и меньше. Поэтому когда в ПО чужая OCR говорить что нет зависимости странно. Сегодня открытые, а завтра в текущих реалиях закрытые.

Можете рассказать сколько человеко-лет вы вложили в разработку? Кто из учёных курирует разработку?

1

Илья, ваш ответ очень расстраивает.
1) 100% получится и вообще без вашего решения...
2) OCR это самая технически сложная часть распознавания документов. Это 95% всего процесса. А может и больше по трудоемкости. По сути у вас получается ничего своего нет... Кроме того, так как российских открытых OCR вроде нет, то у вас просто технологическая зависимость. А вы в реестр подавались со своим решением?

1

Да, спасибо! А вот у вас на сайте написано 100% распознавание. Это при каком варианте? И что у вас используется на уровне OCR? Tesseract?

1

С Dbrain конструктивное общение что-то не пошло) Илья, а у вас вроде тоже сервис распознавания. А кто у вас верификаторы?

1

Вопрос не про ответственность сервиса. Какая может быть ответственность если в компании работает официально 3 человека. Я про алгоритм деперсонализации. Это в данном случае ключевой элемент процесса, который критически важен для безопасности. Если есть стандарт, то ОК, если стандарта нет, то в какой то момент к заказчикам может придти и ответственность.

1

Я думаю, что персональные данные вообще не надо отправлять в Толоку. Посмотрите копирайт Толоки на сайте.

Если выполнив всего несколько заданий был такой инцидент, то возникают вопросы к алгоритму деперсонализации. Было бы интересно спецов из инфобеза послушать. Может есть стандарт на эту тему? Ибо если его нет, то это волшебство для вашего заказчика может стать совсем не волшебным, а "оборотным" и может быть в этом году ещё и уголовным.

1

Хорошо вы "элементы персональных данных" называете случайно ошибкой и передаёте верификаторам в Толоку. И очень интересно, что у вас на сайте Сколково указано 3 человека в штате на 2021 год.