Создаю приложение с нейросетью — но кому оно нужно?

Дисклеймер: к своим 30+ годам программированием не занимался никогда (не считая написания модов для пары игрушек, когда мне было 16 лет), но интересовался, но не сильно:) В тексте я сознательно буду избегать упоминания некоторых точных деталей и нюансов, потому как я тот еще параноик.

Год назад устроился на работу по проверке фотоотчётов (удалёнка) в компанию, весьма крупную. Суть работы: захожу на корпоративный портал, смотрю фотографии, отмечаю в эксельке, какие есть по категориям в каждом отчете, пишу комментарии. Рутины в процессе много: критериев оценки около 10; фотографий, в среднем, 15 на отчет(но бывает и 30, и 40), с некоторых из них нужно еще и информацию перенести в эксельку (текст).

Первое, до чего дошли руки - VBA-скрипты. При помощи гугла достаточно быстро набросал несколько нужных, ускорив работу примерно в полтора раза (правда, еще и второй монитор помог, но это обстоятельство, которое дальше влияния не оказывало - он просто стал не нужен). Стало быстрее (а оплата по выработке, так что да, время - деньги), но всё так-же рутинно.

Далее была попытка сделать девайс, на подобии мини-клавиатуры, на ардуинке, забиндив на клавиши сочетания клавиш для VBA-функций. НО, так и не реализовал, так как нашел вариант в виде приложения на андроиде, передающего скриптовые команды на ПК. В нем можно было подредактировать интерфейс под свои нужды, записать весьма интересные скрипты (передвинуть курсор туда, кликнуть, передвинуть сюда, нажать правую кнопку, нажать сочетание клавиш...). Стало еще быстрее. Но всё еще медленно...

И вот в декабре я добрался до Python. Главное и первое, что я вынес из него - эксельку можно заполнять в фоне! Это уже снимало кучу лишний телодвижений, экономя кучу времени. Тут же началось изучение средств написания графических интерфейсов. Сначала примитивы на pyautogui, потом tkinter, буквально месяц назад "дорос" до Qt.

Одновременно с этим шла работа с комментариями в фотоотчётах (да, там есть и обычный текст). Их считать было не сложно, но нужно было "извлечь" из них значимое, и сформировать то, что нужно внести в эксельку. Но это всё нюансы...

На протяжении всего пути с Пайтоном, не покидала мысль подключить к процессу нейросеть. Не имея никакого опыта, гуглом и костылями, абсолютно без понимания, что-то изредка городил с марта по май, не особо веря в успех (потому как результата не было совсем). Пока не наткнулся на он-лайн сервис, где прям вот фоточки грузишь - а оно тебе модель обученную. Решил попробовать (датасеты уже к тому времени формировались автоматом в процессе работы), и, о чудо!, оно заработало. Да, криво, да, косо, да, пришлось перекраивать, но результат был! Это вселило надежду, что затея не бесполезна, и я начал изучать нейросети.

Что есть сейчас? Программа, которая худо-бедно раскидывает примерно 30% фоток правильно (это на старой модели, сделанной на сайте, но откорректированной), считывает текст с примерно 70% фоток (с которых нужно считывать, это около 10% от всех), при том, что не весь текст нужен, а несколько строго определенных фрагментов. Текст комментария из фотоотчета распознает в 98% случаев, оставшиеся 2% - это настолько исключения, что человеку порой сложно понять, что, зачем, и в каком бреду там написано. Насчет распознавания фоток по категориям я особых иллюзий не строю, понимая, что контроль корректности работы программы должен оставаться на условном операторе, все же фотографии в своей массе очень разные. Но цель довести корректность (именно корректность, а не точность) распознавания до 90%(для чего я и самообучаюсь сейчас). Всё же есть большая разница в том, чтобы просмотреть на предмет соответствия категории условные 800 фотографий в папке (понимая, что все они относятся к одной категории), чем те же 800 фоток распихивать по 10 папкам(категориям) руками. Также есть мысль добавить генетический алгоритм обучения (может, и лишнее, но очень хочу попробовать). Уже сейчас, при 30%, я за 2-3 ленивых дня выполняю объем работы больше, чем коллеги успевают за неделю. "Умничка"-, скажете вы, но... А что дальше?

Вот самый главный вопрос: что дальше? Востребована ли вообще подобная программа у бизнеса? Может ли это начинание стать каким-никаким стартапом? Или проще довести ее до ума, и попытаться продать текущему работодателю за хоть какие-то деньги (опять же, насколько можно обнаглеть)? Или я просто страдаю фигнёй, которой меня никто не просил заниматься, и максимум, что я из этого вынесу - это опыт и возможность получать какое-то время деньги(не известно, сколько времени еще эти проверки будут нужны), прилагая минимум усилий на работу, и уделяя больше времени саморазвитию?

С интересом выслушаю любые точки зрения.

0
79 комментариев
Написать комментарий...
Михаил Золотов

Самим со своими наработками к начальству лучше не суйтесь, судя по описанию они все равно не оценят. Максимум выпишут Вам премию, эти наработки распространят на всех менеджеров и часть сократят, увеличив нагрузку на оставшихся. 
Какие варианты на поверхности:
1. Оформить в виде "продукта" и продавать подписку своим коллегам, далее уже смотреть на Ваших конкурентов и кому еще может понадобится  подобная штука.
2. Нанять "мамочку в декрете" на которую слить всю оставшуюся рутину, чтобы высвободить время на развивитие своих наработок и повышение процентов
3. Попробовать зайти к Вашему руководству через 3-х лиц и попробовать продать свои наработки

Ответить
Развернуть ветку
Uranus In Fire
Автор

Спасибо за советы!
Наиболее вероятным вижу вариант 3, так как, к сожалению, коллеги зарабатывают скромно, и по их выполняемым объемам складывается ощущение, что это как раз "мамочки в декрете". Но, учитывая, что их целую армию наняли (зачем?), фотоотчетов стало резко не хватать на всех, и начинается грызня. Поэтому да, идеально было бы продать продукт, и двигаться дальше. Ну, или на подряд уйти, с развитием-поддержкой за n-ную сумму в месяц.

Ответить
Развернуть ветку
10 комментариев
Alexey Ivanov

Вариант 3: надо учитывать, что могут сделать сами продукт. Нанять аутсорсера и готово.

Ответить
Развернуть ветку
1 комментарий
Pavel Osadchuk

собери в портфолио и иди джуном дата-саентистом. будет и профитнее и проще

Ответить
Развернуть ветку
Nikolay Vavilov

"иди джуном сантистом" -  с чем он туда пойдет? с одним пет- проектом на openCV, который пилится за 1-2 вечера?)) не смешите

Ответить
Развернуть ветку
1 комментарий
Sergei Zotov
 Суть работы: захожу на корпоративный портал, смотрю фотографии, отмечаю в эксельке, какие есть по категориям в каждом отчете, пишу комментарии.

лол, может, вы размечаете датасет для более крутой нейросетки, а теперь хотите этот процесс автоматизировать своей?)

Ответить
Развернуть ветку
Vladimir Goncharov
Востребована ли вообще подобная программа у бизнеса

Проверять расстановку товаров по полкам скоро пустят роботов, 2-3 года и вы пойдете на улицу.

Ответить
Развернуть ветку
Alex Dzenin

Этот аргумент всплывает в любых темах на vc минимум раз в пару месяцев.

Далеко не каждый бизнес потянет глобальную роботизацию. Нередко даже не из-за денег, а из-за чугунных голов ЛПР, мыслящих критериями прошлого века. 

Ответить
Развернуть ветку
2 комментария
Uranus In Fire
Автор

Я в этом и не сомневаюсь, насчет роботов. только вот у нас не "товары на полках", у нас сложнее немного. Но тоже вопрос времени, о чем я сам и указал: "не известно, сколько времени еще эти проверки будут нужны".
На счёт улицы - далеко не так, к счастью. 

Ответить
Развернуть ветку
3 комментария

Комментарий удален модератором

Развернуть ветку
Warfare Designer

...по штрихкодам или RFID уже даже не новость

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
1 комментарий
Nikolay Vavilov

Человек открыл для себя программирование и 1 раз использовал библиотеку питончика (openCV?) и начинает понимать, почему в РФ рабочая сила дешевая, а многие бизнесы не эффективные. 
Продавать работодателю смысла нет, а вот приобретенные навыки можно использовать как старт для обучения и будущего смены работы. 
Высвободившееся время можно как раз на это дело тратить. 

НУ либо можешь работодателю показать, если коллеги прям бесят - как раз сократят одного человека, а часть задач на тебя перекинут.

Ответить
Развернуть ветку
Warfare Designer

Обычно сотрудник, который "внезапно" открыл для себя возможности "питончика" начинает совать этого питончика куда не попадя с целью пригодиться. А любое изменение устоявшихся процессов воспринимается руководством как риск убытков. Никого не сократят, но мудаком на производстве прослыть можно)))

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
19 комментариев
Tabani Timur

Напомнило эту историю:

Ответить
Развернуть ветку
Денис Обрезков

Утащил статью в группу по изучению питона. Эта статья - крутой пример о том, как обычному человеку может помочь программирование.

Ответить
Развернуть ветку
Warfare Designer

Ищу подработку, знаю стандартные либы Python и еще к этому: pandas, aiogram, acyncio, gepy, selenium, plotly, bottle, flask, folium...ну и так по мелочи.
Чего хочу: 10 000 рублей в месяц за работу по ночам и выходным.
Смысл: программирование поможет когда проблема есть,  а когда проблемы нет или она размыта - программирование только отвлекает. Мне НИЧЕГО  из этого не пригодилось пока)

Ответить
Развернуть ветку
Лев Щенин

Да, присоединяюсь к Алексею.
Что за фото?
Определение раковых опухолей на снимках из флюрографии?
Подсчёт количества турецких танков на спутниковых снимках из Сирии ?
Поиск алиментщиков по фото из московского метро ?
Очень интересно !

Ответить
Развернуть ветку
Uranus In Fire
Автор

Ответил Алексею под его комментарием. Дублирую:

> Примеров не будет. Но дам описание, в общих чертах: процесс установки оборудования, само оборудование, нюансы установки (крепежи, коннекторы, укладка кабелей), контрольные замеры параметров оборудования, документы (акты, договора), демонстрация работы оборудования. Классификация изображений подходит лишь частично, как способ реализации, ввиду того, что в некоторых случаях допускается наличие более одного "критерия оценки", скажем так, на фото. Но и распознание объектов, как мне видится, не лучшее решение. Пока что в реализации планирую прийти к такой схеме: сначала грубая классификация - затем тонкая проверка отдельными моделями в каждой категории(object detection) + OCR в одной категории (где нужно текст вытащить).
>Если бы можно было "протолкнуть" идею "одно фото-один критерий оценки", это бы сильно упростило жизнь. Но я, признаюсь честно, побаиваюсь вот так с ходу объявить о своих наработках работодателю. Боюсь реакции. Тут и "3-и лица", и "использование стороннего ПО"...
Ответить
Развернуть ветку
Вера Ковалева

Если отдадите по работодателю- он понизит за и увеличит нагрузку,плюс поувольняет лишних,если другим товарищам- опять же проболтаются и работодатель сделает то же самое. Зачем платить,если прога все делает?
Только если другим предприятиям продавать,тогда может есть смысл.

Ответить
Развернуть ветку
Вася Михеев

В яндекс.толоку загляните - там много рутинных задач, которые они еще на автоматизировали. Заработок - ссущие копейки, но работа по нескольким фронтам, да еще и не вашими руками, а скриптами  будет вам приработок и стимул дальше развиваться. Вот хотя бы 2 у.е. в день можно делать на фото неба и указании облачности/осадков. Ну, не много, да, компьютер со смартфоном больше денег сожрут, но вы же не только это можете автоматизировать ;)

А к начальству не ходите - официально вы впахиваете в поте лица. Не надо рушить легенду )))

Ответить
Развернуть ветку
Алексей из LOADING.express

Очень интересно, но ничего не понятно. Какие картинки хоть распознает, пример хотя бы вставили бы в статью.

Ответить
Развернуть ветку
Uranus In Fire
Автор

Примеров не будет. Но дам описание, в общих чертах: процесс установки оборудования, само оборудование, нюансы установки (крепежи, коннекторы, укладка кабелей), контрольные замеры параметров оборудования, документы (акты, договора), демонстрация работы оборудования. Классификация изображений подходит лишь частично, как способ реализации, ввиду того, что в некоторых случаях допускается наличие более одного "критерия оценки", скажем так, на фото. Но и распознание объектов, как мне видится, не лучшее решение. Пока что в реализации планирую прийти к такой схеме: сначала грубая классификация - затем тонкая проверка отдельными моделями в каждой категории(image detection) + OCR в одной категории (где нужно текст вытащить).
Если бы можно было "протолкнуть" идею "одно фото-один критерий оценки", это бы сильно упростило жизнь. Но я, признаюсь честно, побаиваюсь вот так с ходу объявить о своих наработках работодателю. Боюсь реакции. Тут и "3-и лица", и "использование стороннего ПО"...

Ответить
Развернуть ветку
3 комментария
Анон Плиз

Стартапом логично это называть, когда есть (потенциальный) рынок сбыта. А он есть? 

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Uranus In Fire
Автор

Здесь мне видится либо вариант "сделал-передал-научил пользоваться", если продать именно готовый продукт, и забыть о нём. Либо подписочная модель, с сопровождением, развитием, и индивидуальным обслуживанием. Понятно, что даже в таком формате решение вряд ли будет универсальным и легко масштабируемым, но такой вариант тоже имеет право на существование.

Ответить
Развернуть ветку
1 комментарий
Константин Рогов

ничего не понятно

Ответить
Развернуть ветку
Alexey Ivanov

CV это модная тема, не думаю, что вы там сделаете стартап. Да и советы идти в программисты тоже так себе, хотя попробовать сходить на собеседования стоит.

Ответить
Развернуть ветку
Georgy Uvarov

Хочешь идею для стартапа? Смотри. Напиши нейросеть для дизайнеров интерьера. Чтобы я взял кусок текстуры на сайте производителя, а она мне достроила большое полотно на основе куска. Например на сайте есть кусок плитки мраморной или кусок паркета. А я на выходе получаю кусок побольше, чтобы смог нарезать дальше. А оо приходится часто мучаться в ручную в Фотошопе чтобы получить бесшовную текстуру

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Руслан Ніколаєнко

хм, как ИТ рекрутер в прошлом, могу сказать что вам уже стоит сменить специальность и идти в ИТ, денег точно будет больше, да и вариантов работы тоже

Ответить
Развернуть ветку
Кирилл Макеев

Иди работать в Толоку, если уже не там.

Ответить
Развернуть ветку
kova7ev

Не удивлюсь если контора потом использует результат тоже для обучения сетки.

Ответить
Развернуть ветку
Uranus In Fire
Автор

Комментарий удалён

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Сильвестр Иванов
нашел вариант в виде приложения на андроиде, передающего скриптовые команды на ПК

Что за приложение?

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Wonabeez Doratie

Ваша программа нафиг кому не нужна, а ваши скиллы да. Идите в джуны или мидлы увольняйтесь со своей конторки

Ответить
Развернуть ветку
Андрей Ма

А смысл, предлагать руководству? Работы на всех не хватает. Автоматизация не нужна.
И тут ещё , может быть , что вы дублируйте друг друга, может даже единожды.
Скорее всего, важны разные оценки, проверки друг друга. Поэтому и нанимают много людей, а не одного робота.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Андрей М.

Давайте попробуем раскруть проект. Сейчас актуальна тема rpa интеграцией. Запустим сайт, продумаем монетизацию. Посмотрим что из этого выйдет :) 

Ответить
Развернуть ветку
Warfare Designer

По работе стояла такая же задача, каждый день разгребать входящие материалы по 1000-2000 фоток в день. Начальство предложило написать нейросеть, но у нас уже была своя, Сережа. Так вот Сережа написал на VBNET вьювер, который делал следующее:
1. Открывал папку с картинками и список категорий.
2. Каждая картинка открывалась и можно было ей присвоить категорию из списка. Категория прописывалась в EXIF
3. Когда все картинки были прочеканы, нажималась волшебная кнопка и вся эта куча раскидывалась по папкам.
То есть по сути, нейросети Сереже надо было только просмотреть эти фотки и все.

Ответить
Развернуть ветку
Влад Бад

Очень даже нужная разработка. С её помощью можно принципиально поменять "подачу товара" в интернет-магазине (чем, собственно, мы и озадачились уже лет так с пяток назад) и ещё много "где".

Ответить
Развернуть ветку
76 комментариев
Раскрывать всегда