{"id":14278,"url":"\/distributions\/14278\/click?bit=1&hash=7bc8e2136891e57274bce79f3bfab82773b2810563794a524a98ce6dacee7a9c","title":"\u041f\u044f\u0442\u044c \u043a\u0435\u0439\u0441\u043e\u0432 \u0443\u0441\u043f\u0435\u0448\u043d\u043e\u0433\u043e \u0432\u043d\u0435\u0434\u0440\u0435\u043d\u0438\u044f \u0418\u0418 ","buttonText":"","imageUuid":""}

Создаю приложение с нейросетью — но кому оно нужно?

Дисклеймер: к своим 30+ годам программированием не занимался никогда (не считая написания модов для пары игрушек, когда мне было 16 лет), но интересовался, но не сильно:) В тексте я сознательно буду избегать упоминания некоторых точных деталей и нюансов, потому как я тот еще параноик.

Год назад устроился на работу по проверке фотоотчётов (удалёнка) в компанию, весьма крупную. Суть работы: захожу на корпоративный портал, смотрю фотографии, отмечаю в эксельке, какие есть по категориям в каждом отчете, пишу комментарии. Рутины в процессе много: критериев оценки около 10; фотографий, в среднем, 15 на отчет(но бывает и 30, и 40), с некоторых из них нужно еще и информацию перенести в эксельку (текст).

Первое, до чего дошли руки - VBA-скрипты. При помощи гугла достаточно быстро набросал несколько нужных, ускорив работу примерно в полтора раза (правда, еще и второй монитор помог, но это обстоятельство, которое дальше влияния не оказывало - он просто стал не нужен). Стало быстрее (а оплата по выработке, так что да, время - деньги), но всё так-же рутинно.

Далее была попытка сделать девайс, на подобии мини-клавиатуры, на ардуинке, забиндив на клавиши сочетания клавиш для VBA-функций. НО, так и не реализовал, так как нашел вариант в виде приложения на андроиде, передающего скриптовые команды на ПК. В нем можно было подредактировать интерфейс под свои нужды, записать весьма интересные скрипты (передвинуть курсор туда, кликнуть, передвинуть сюда, нажать правую кнопку, нажать сочетание клавиш...). Стало еще быстрее. Но всё еще медленно...

И вот в декабре я добрался до Python. Главное и первое, что я вынес из него - эксельку можно заполнять в фоне! Это уже снимало кучу лишний телодвижений, экономя кучу времени. Тут же началось изучение средств написания графических интерфейсов. Сначала примитивы на pyautogui, потом tkinter, буквально месяц назад "дорос" до Qt.

Одновременно с этим шла работа с комментариями в фотоотчётах (да, там есть и обычный текст). Их считать было не сложно, но нужно было "извлечь" из них значимое, и сформировать то, что нужно внести в эксельку. Но это всё нюансы...

На протяжении всего пути с Пайтоном, не покидала мысль подключить к процессу нейросеть. Не имея никакого опыта, гуглом и костылями, абсолютно без понимания, что-то изредка городил с марта по май, не особо веря в успех (потому как результата не было совсем). Пока не наткнулся на он-лайн сервис, где прям вот фоточки грузишь - а оно тебе модель обученную. Решил попробовать (датасеты уже к тому времени формировались автоматом в процессе работы), и, о чудо!, оно заработало. Да, криво, да, косо, да, пришлось перекраивать, но результат был! Это вселило надежду, что затея не бесполезна, и я начал изучать нейросети.

Что есть сейчас? Программа, которая худо-бедно раскидывает примерно 30% фоток правильно (это на старой модели, сделанной на сайте, но откорректированной), считывает текст с примерно 70% фоток (с которых нужно считывать, это около 10% от всех), при том, что не весь текст нужен, а несколько строго определенных фрагментов. Текст комментария из фотоотчета распознает в 98% случаев, оставшиеся 2% - это настолько исключения, что человеку порой сложно понять, что, зачем, и в каком бреду там написано. Насчет распознавания фоток по категориям я особых иллюзий не строю, понимая, что контроль корректности работы программы должен оставаться на условном операторе, все же фотографии в своей массе очень разные. Но цель довести корректность (именно корректность, а не точность) распознавания до 90%(для чего я и самообучаюсь сейчас). Всё же есть большая разница в том, чтобы просмотреть на предмет соответствия категории условные 800 фотографий в папке (понимая, что все они относятся к одной категории), чем те же 800 фоток распихивать по 10 папкам(категориям) руками. Также есть мысль добавить генетический алгоритм обучения (может, и лишнее, но очень хочу попробовать). Уже сейчас, при 30%, я за 2-3 ленивых дня выполняю объем работы больше, чем коллеги успевают за неделю. "Умничка"-, скажете вы, но... А что дальше?

Вот самый главный вопрос: что дальше? Востребована ли вообще подобная программа у бизнеса? Может ли это начинание стать каким-никаким стартапом? Или проще довести ее до ума, и попытаться продать текущему работодателю за хоть какие-то деньги (опять же, насколько можно обнаглеть)? Или я просто страдаю фигнёй, которой меня никто не просил заниматься, и максимум, что я из этого вынесу - это опыт и возможность получать какое-то время деньги(не известно, сколько времени еще эти проверки будут нужны), прилагая минимум усилий на работу, и уделяя больше времени саморазвитию?

С интересом выслушаю любые точки зрения.

0
79 комментариев
Написать комментарий...
Михаил Золотов

Самим со своими наработками к начальству лучше не суйтесь, судя по описанию они все равно не оценят. Максимум выпишут Вам премию, эти наработки распространят на всех менеджеров и часть сократят, увеличив нагрузку на оставшихся. 
Какие варианты на поверхности:
1. Оформить в виде "продукта" и продавать подписку своим коллегам, далее уже смотреть на Ваших конкурентов и кому еще может понадобится  подобная штука.
2. Нанять "мамочку в декрете" на которую слить всю оставшуюся рутину, чтобы высвободить время на развивитие своих наработок и повышение процентов
3. Попробовать зайти к Вашему руководству через 3-х лиц и попробовать продать свои наработки

Ответить
Развернуть ветку
Uranus In Fire
Автор

Спасибо за советы!
Наиболее вероятным вижу вариант 3, так как, к сожалению, коллеги зарабатывают скромно, и по их выполняемым объемам складывается ощущение, что это как раз "мамочки в декрете". Но, учитывая, что их целую армию наняли (зачем?), фотоотчетов стало резко не хватать на всех, и начинается грызня. Поэтому да, идеально было бы продать продукт, и двигаться дальше. Ну, или на подряд уйти, с развитием-поддержкой за n-ную сумму в месяц.

Ответить
Развернуть ветку
Artem Gn

Ты конечно молодец, крутая работа. А теперь по существу:
1) компания платит "Х" руб за отчёт Ей не важно кто выполняет эту работу, хоть пылесос, если качество работы устраивает. Только при одном условии, если ты скажешь, что заберёшь все отчёты по цене, например "0.7Х" за отчёт, т.к. остальные не готовы будут работать за такие деньги. Способен забрать? Месячный доход тебя устроит?

2) Чтобы отдать тебе все отчёты наверняка компания должна будет провести тендер или твое руководство должно пойти к более высокому руководству. Ну как показывает практика, средние и относительно высокие руководители крупных федеральных компаний стараются делать минимальное возможное количество действий, а если короче, то им пофиг на всё, лишь бы меньше трогали, не уволили и платили зарплату. За инновации обычно топит высшее руководство. Поэтому твоя цель добраться именно до них. Как? Вижу один способ, показываешь своему руководителю и говоришь можно ли, чтобы ты показал это его руководителю, если он не имеет полномочий для принятия решений, и т.д. вверх пока не дойдешь до принимающего решение. 

3) Сам по себе твой опыт интересен, но не думаю что много аналогов такой работы в других компаниях, чтобы это стало бизнесом. Поэтому вижу эту историю просто для описание опыта, и того как ты можешь искать решения, при поставленных задачах. Это в том случае когда начал искать другую работу.

4) Учитывая, как ты сам сказал, ты программист любитель, и даже у тебя получилось, почему руководство вообще изначально не поставило само себе задачу об автоматизации? Значит их устраивает текущее положение вещей, это отсылка ко 2 пункту. 

А вообще попробуй продвинуться с идеей в ближайшие 2-3 недели и отпиши здесь, получилось или нет)) и как отреагировали руководители.

Ответить
Развернуть ветку
76 комментариев
Раскрывать всегда