Прибыльный ларек с Шаурмой VS небольшое приложение с Chat GPT?

Прибыльный ларек с Шаурмой VS небольшое приложение с Chat GPT?

Размышления ниже навеяны после прочтения нескольких описаний открытий бизнесов в сфере общепита. В частности, правдоподнобной историей https://journal.tinkoff.ru/shaurma/ и не очень правдоподобной https://pikabu.ru/story/otkryitie_shaurmichnoy_s_nulya_10516759

Некоторые виды бизнеса могут выглядеть простыми на первый взгляд. Например, открытие точки с шаурмой или кофе. На рынке к тому же полно предложений от людей, которые вам за условные 500 т.р. продадут этот бизнес “под ключ” и вы начнете “рубить бабки”.

Прибыльный ларек с Шаурмой VS небольшое приложение с Chat GPT?

На Авито огромное количество предложений о продаже готового бизнеса по Шаурме с разбросом цен от 300 т.р. до 7 млн рублей. Продавцы, если с ними пообщаться, будут сознательно или неосознанно завышать ожидаемый доход и скрывать или “забывать” какие-то значительные расходы.

Прибыльный ларек с Шаурмой VS небольшое приложение с Chat GPT?

Дело в том, что на деле, даже такие, казалось бы, простые бизнесы, заставляют решать предпринимателя десятки вопросов, в результате которых, построение этого бизнеса по схеме “сделал и получаешь пассивный доход”, удается лишь единицам. Подавляющее большинство предпринимателей прогорают, или же оказываются вынужденными сами вкалывают в графике с 6 до 23 без выходных.

Там надо решать кучу вопросов:

  • рецепты;
  • технологии производства;
  • оборудование;
  • мебель;
  • расходники;
  • место размещения и отношения с арендодателями;
  • ремонт;
  • касса и прием оплаты;
  • налоги;
  • поиск и выстраивание отношений с поставщиками сырья;
  • сотрудники;
  • выполнения требований регуляторов (медкнижки, разрешения и т.п.);
  • привлечение клиентов;
  • брендбук;
  • обеспечение качества;
  • отношения с представителями надзорных органов;

Многие не понимают, что все это может навалиться одновременно и “сыпятся” на том, что очень дохрена чего может пойти не так. А оно, как правило, так и случается.

Как результат, прибыли нет, или же она копеечная, а “бизнесмен” бегает как лошадь. И наградой для него “предпринимательское пособие” в 50..100 т.р. за все труды.

После записи последнего ролика в рамках курса Программирование для НЕ программистов*, я сделал довольно большую паузу. Причина проста - было ощущение, что из простого, я дал в курсе, достаточно, чтобы на базе уже того, что есть, можно было бы создавать вполне себе работающие приложения и начать набирать свой собственный опыт.

*Речь идет о серии роликов на YouTube, на которых я показываю, как без глубоких знаний программирования учиться писать приложения с помощью Chat GPT.

Ведь такой доход можно относительно просто получить за счет куда более простых манипуляций с помощью доступных IT технологий. Ниже показываю выкладки по созданию аналогичной по уровню "подработки", но которая строится с куда мЕньшими затратами и рисками.

Все, описанное далее, построено на базе удачно полученного крупного клиента. Но чтобы его получить, я должен был понимать, что потяну по требованиям качества для большого объема.

"Моя IT Шаурма"

Некоторое время назад обратился клиент, для которого нужно было выстроить систему транскрибации аудио. Клиент присылает довольно большие объемы аудио или видеозаписей. В день от 5 до 15 часов аудио в разных форматах mp3, wav, mp4, а на выходе он желает получить оформленный расшифрованный без ошибок (это важно) текст, в котором есть временные метки и указание ФИО спикеров.

Особенность задачи в том, что управлять большим количеством разных исполнителей в ручном режиме сложно в том плане, что требуется соблюдать стандарты качества выходного результата. А с объемами этого клиента, нужно управлять не менее, чем 7.. 8 исполнителями.

Люди, которые профессионально этим занимаются и обладают высокой скоростью печати, берут за ручную расшифровку довольно дорого. А цель всего этого мероприятия, получить систему, которая позволит в едином стандарте получать большие объемы расшифрованного текста.

Прибыльный ларек с Шаурмой VS небольшое приложение с Chat GPT?

Очевидное решение для снижение цены - предварительно обработать аудио с помощью ИИ.

Однако, большинство современных сервисов на базе ИИ, которые предлагают расшифровку аудио на русском языке, будут обладать одним или сразу несколькими недостатками:

  • низкое качество распознавание, большое число ошибок
  • отсутствуют временные метки или же они лепятся куда попало
  • невозможность обработать файлы большого объема. Например, максимум - 5 минут записи. Вам придется руками “расклеивать” свой входной четырехчасовой файл на куски по 5..10 минут, отправлять его туда по одному, ждать ответа, а затем еще руками “склеивать” полученный текст обратно. По трудозатратам это тот еще треш
  • нет возможности пакетного управления большими файлами
  • нет разбиения на спикеров
  • регулярно возникающие “глюки” расшифровки, где на выходе получается абракадабра.

Но тем не менее, на выходе они выдают результат, который по уровню качества расшифровки вполне годится для личного использования. Для коммерческого использования с жесткими требованиями по качеству придется проделать модерацию такого автоматически распознанного текста. А именно, прослушать запись и исправить ошибки, расставить временные метки, обозначить спикеров.

Идея в том, что для этой работы подойдет вообще кто угодно, обладающий грамотным русским языком. И вот вам уже не нужны профессиональные транскрибаторы, которые набирают текст с очень высокой скоростью.

Оставалось написать документ инструкцию с описанием требований к модерации и правил приемки качества. Далее научиться быстро находить и обучать таких людей, а также осуществлять приемку работы.

Для обеспечения таких объемов нужен один супермодератор: человек, который будет управлять подготовкой авторасшифровок и приемкой работ конечных исполнителей.

Его обязанности:

  • Получить исходники от заказчика
  • Прогнать все исходники через авторасшифровку
  • Передать задачу модератору (аудио и расшифрованный автоматически файл)
  • Принять работу у модератора, проконтролировать качество
  • Оплатить принятые работы или же вернуть на доработку
  • Оформить титульный лист и выслать результат заказчику

Экономика

Заказчик платит по договору. После уплаты налогов по УСН, я получаю в грубом приближении 30 р за минуту записи. За эти деньги заказчик хочет получить оформленные тексты с титульным листом, временными метками, с расставленными фио спикеров. Все в едином формате. Кроме того, он получает гарантию качества от меня, как исполнителя. Без необходимости проверять работу.

Средний объем заказов 12000 минут в месяц.

Когда я начал изучать вопрос, то обнаружил, что профессиональные транскрибаторы берут в диапазоне 15..60 рублей за минуту.

Прибыльный ларек с Шаурмой VS небольшое приложение с Chat GPT?

Сервисы, имеющиеся на рынке, которые предлагают автоматическую расшифровку, стоят от 3 до 15 р за минуту. И к сожалению, обладают весьма посредственным качеством распознавания. Чуть выше я написал о типичных проблемах таких сервисов.

При том, что для обработки изначального входного файла в этих сервисах еще требуется затратить очень много времени, то становится грустно. Файлы надо преобразовывать в подходящий формат, порезать на части, затем по частям отправлять. Выжидать некоторую значительную паузу для обработки. При таком раскладе временные метки придется ставить ручками.

Очевидно, что если привлекать модераторов даже по 15 рублей, то необходимо нанимать еще супермодератора на полный рабочий день. Примерно 3-4 часа в день он тратит на подготовку данных для модераторов и еще примерно 2 часа на приемку работ для обеспечения качества.

По сути, это означало найм сотрудника на полный рабочий день для управления всем процессом. При этом уровень ответственности и задач подразумевает, что дешевле 70 т.р. на руки, такого не найти.

Как результат, вся история становилась слабо рентабельной.

Выручка (на руки) за 12000 минут после уплаты налогов - 360 т.р.

----------------------------------------------------------

Оплата модераторам 15 р/мин x12000 мин = 180 т.р.

Оплата супермодератору на полный рабочий день - 70 т.р.

Оплата сервисам для подготовки данных: от 4 до 8 р/мин x 12000 мин - 48..96 т.р.

Если решать задачу вот так “в лоб”, то мне бы доставалось за труды от 4 до 50 т.р. При этом все вопросы найма персонала, документооборот, а также оплаты работникам оставались на мне… В общем, так себе, бизнес идея

Автоматизация для повышения рентабельности

Я решил эту задачу за счет написания своего интерфейса, который подготавливает расшифровку в полностью автоматическом режиме быстро и значительно дешевле.

Сюда входит предварительная обработка: приведение любого формата в mp3, затем разбиение на части, далее отправка в один из сервисов по api частей, далее обработка полученного результата с временными метками по 3-4 шт на страницу в начале абзацев.

Автоматическая проверка расшифровки на наличие глюков: когда нет запятых, точек или много ошибок в регистрах. Интерфейс позволяет расклеивать входные файлы в пакетном режиме и может работать с огромными файлами.

Тут используются многопоточные системы, которые распараллеливают процессы, чтобы можно было даже для пачки входных файлов суммарно в 10 часов, потратить на получение корректного авторасшифрованного файла не более 10 минут.

Как результат, супермодератор тратит всего 10.. 15 минут на то, чтобы подготовить данные для выдачи задания исполнителям вместо 4 часов. Общие трудозатраты для супермодератора снизились с 6 часов, до 2ч 15 минут, что позволило нанять на частичную занятость человека за 25 т.р. вместо 80.

Также использование API различных сервисов транскрибации, позволило снизить затраты с 3..8 до 0,7..1,5 рублей за минуту.

Используется несколько внешних сервисов, к которым исключительно программный доступ. Это дало существенную экономию. Если есть экономия 6 р в минуту, то на объеме 12 тыс минут, это уже становится значительно более интересным.

Следующий шаг - это работы по повышению качества файла для модерации. Расстановка временных меток, автоматическая проверка косяков и расстановка смены спикеров уменьшает время, которое модераторы тратят на внесение редактуры. Со временем, модераторы при отличном качестве бОльшую часть времени проходят запись на скорости x1.5..x2, лишь иногда замедляясь в сложных для распознавания местах.

Эти мероприятия позволили нанимать модераторов за 12 р./мин.

Таким образом, далее, если все будет нормально, то при затратах в 30-40 минут, прибыль со всего мероприятия составит около 160 т.р. в месяц, что уже весьма неплохо. По крайней мере, выхлоп получается, как с двух точек шаурмы при очень удачном ведении такого бизнеса. А риски и затраты минимальны.

На такие цифры можно выйти за счет 6 р/мин за счет отказа от готовых сервисов. Еще 3 р/мин за счет более качественной предварительной подготовки входного файла модератору и 55000 р экономии на зп супермодератора, которого можно стало брать на частичную занятость.

Сам интерфейс написан с помощью Chat GPT на Python. По времени единоразово затрачено примерно 20 часов чистого времени, которое я выделял по выходным или же по вечерам в будние дни. Но для меня это больше как форма отдыха и развлечение.

Функционал интерфейса:

  • создание папки проекта по входным исходным файлам;

- конвертацию любых входных аудио/видео файлов в разрезанные куски mp3;

- расклейку на части с нумерацией, чтобы можно было эти части отправить в сервис расшифровки - 4 часа (пришлось поиграться с установкой доп. ПО);

- параллельную отправку всех частей отправки на расшифровку;

- постобработка полученных результатов: расстановка меток и автоматический контроль отсутствия проблем;

- доп. обработка генеративными ИИ моделями полученного текста и его коррекция в случае выявления ошибок;

- обработчик по определению смены спикера.

Оговорюсь, что пока не уверен, что есть смысл в том, чтобы включать обработчик определения смены спикера. Это очень сложный процесс, который требует очень больших вычислительных мощностей и точность, которую мне удалось получить, 82%. Т.е. примерно каждая пятая отметка о смене спикера либо стоит не в том месте, либо смены спикера реально не было, или же была, но сервис не определил ее. Пока я не готов подключать это решение именно из-за цены. Модераторам я расстановкой спикеров не смогу сильно снизить стоимость оплаты… При этом, куда больше потрачу на вычислительные мощности, которые будут её определять.

Если “на пальцах”, то смена спикера определяется примерно так: весь аудиофайл “разрезается” на множество мелких сегментов. Далее эти сегменты оцифровываются. С помощью технологий машинного обучения ищутся паттерны, присущие каждому сегменту и преобразовываются в вектора. Далее эти вектора сравниваются и определяется, была ли смена спикера. Пока решил, что овчинка не стоит выделки.

Еще в те же 20 часов вошли создание инструкции модератора, супермодератора, контроль качества, а также первичный поиск исполнителей.

Сейчас все работает в автономном режиме и я трачу время только на поиск новых модераторов, если есть всплеск заказов. Это не каждый день.

Очевидно, что такой “бизнес“ пока слабо тянет на звание бизнеса, т.к. риски у него огромные. Я полностью завишу от одного клиента. И если он уйдет, то и весь “бизнес” накрывается.

Итоговое сравнение с открытием “точки”

Прибыльный ларек с Шаурмой VS небольшое приложение с Chat GPT?

Можно придраться, что описываемый “бизнес”, это просто удачное стечение обстоятельств и что “подвалившего” крупного клиента можно сравнить, как если бы мне нахаляву досталось коммерческое помещение в 10 м2 на углу проходного места у метро. Тогда бы и расклад был бы совсем другим.

Также нельзя сказать, что вся эта история совсем без риска. В моем случае, отношения с клиентом, это постоплата, поэтому потенциально я с первого месяца рисковал затратами по ведению деятельности. Весь персонал, который привлечен, оплачивался мной. В случае, если мы расстанемся с заказчиком, а он не оплатит - для меня это будут прямые убытки. Это сумма порядка 200 т.р.

В любом случае, основная идея и посыл всей статьи в том, что изучение современных технологий очень во многих случаях позволяет, вот так просто, за считанные дни работы одного человека, накидать рабочее решение, которое решает реальные задачи для бизнеса.

И если вы будете ими владеть, то у вас будет шанс реализовать подвернувшуюся возможность.

44
16 комментариев

Это называется фриланс, миллионы людей на нем уже обосрались и еще обосруться. Любой фриланс в отличии от системного бизнеса рано или поздно сдохнет, или вы дойдете до финансового придела. Хорошо построенный бизнес будет кормить еще и ваших внуков.

4

А почему такой негатив к фрилансу? И на чем основывается прогноз, что он сдохнет?

Даже бизнес консультант, который помогает выстраивать процессы в крупных компаниях, в некотором роде фрилансер. Разве не так?

2

Соглашусь. Но в фуд-сфере тоже рано или поздно будет провал. Говорю, как маркетолог по ресторанному бизнесу. Сложная ниша и очень затратная. Здесь привели в пример шаурму - так себе идея на постоянку.

1

да что там владеть, написал что нужно он тебе и выдает, но работоспособность этих решений временами крайне сомнительна

1

Виталий, есть огромная разница в том, кто именно общается с генеративными моделями. Если говорить, например, о написании кода, то "у хренового программиста GPT будет писать хреновый код".

Сформировать запросы, продумать архитектуру и границы всех компонентов, а затем встроить полученный скрипт в приложение, все равно в настоящее время приходится пользователю. Т.е. в любом случае, обычный пользователь сможет сходу настрогать нормальное решение для высоконагруженной системы. Но если он обладает хорошим кругозором и знает принципы построения таких систем, то для него стираются границы, как например, на каком языке писать приложение?

Точка с шавермой - тру дело Для кого то шаверма предпочтительней

Мастер Ч, ну что вы, право? Это же совсем другой бизнес )