IT стартап на свой страх и риск в 2024 году

Всем привет! С вами Михаил Молчанов и это моя первая статья на VC. В ней я хотел бы поделиться личным опытом перехода от наемного сотрудника к реализации собственных идей. Спойлер: опыт захватывающий, но дойти до выпуска как переплыть океан. И в конце у меня будет маленький вопрос к вам, уважаемые читатели VC.

Что мы делаем

Наша молодая команда создает видеоредактор Joineo с семантическим ядром. С его помощью можно преобразовывать длинные видео в короткие по определенному или главному контексту. Также мы добавляем в итоговое видео субтитры и стикеры и очень короткие видео, которые подходят по смыслу, для визуализации информации. Не буду расписывать про векторизацию или какой еще наш алгоритм, чтобы не перегружать статью. Отмечу только, что мы не используем коммерческие *GPT продукты, а просто крутим BERT подобные модели на своих серверах.

Тривиальный пример. Я записал длинное 30-ти минутное видео про свою поездку в Таиланд и хочу дать его пользователям на моем канале или блоге. Для этого мне надо убрать все паузы и оставить только моменты, где я делюсь личными эмоциями и отзывами о еде. У меня очень мало свободного времени и нет команды монтажеров. Я просто воспользуюсь Joineo.

<b>Joineo</b>. Страница создания видео
Joineo. Страница создания видео

Как мы начинали

Начну с того, что я с детства горю разработкой ПО и всегда мечтал делать именно свои продукты. Но по разным причинам не мог себе этого позволить. И таких причин две: 1) мне нужна уникальность идеи, 2) пока этой уникальности не придумал, надо было на что-то жить.

Мои ощущения в последний год работы и после увольнения
Мои ощущения в последний год работы и после увольнения

Для меня написание кода - это своего рода искусство. Поэтому, хоть я и умею быстро строить проекты с применением различных технологий, свою идею в свет еще не представил. Умение - это вопрос "Как?". А я же хотел открыть для себя ответ на вопрос "Зачем?".

И вот уже полгода как мы с командой работаем над Joineo. Отмечу, что я, может, что-то или даже многое делаю неправильно, не проводя сперва каст девы, не строю своты и даже не провожу маркетинговое исследование. Так решено намеренно, лично мне так проще получить результат. Хотя некоторый фидбек я получил в парочке конкурсов, от знакомых и просто от наблюдения за тенденцией. Так что я решил врываться, не смотря ни на какие антимотивационные отзывы о том, что проект может не залететь и так далее.

Коротко о продукте

Но сначала короткая историческая справка на минуту или две.

Однажды я увлекся всякими LLM (Large Language Models), их строением, и обнаружил, что есть достаточно много способов, не прибегая к ChatGPT, использовать их для семантического анализа. Меня это заинтересовало и я начал экспериментировать. Смотрел, как можно сделать контекстный поиск в разных платформах, например, искать товары по их описанию или блогеров по описанию их деятельности и постам в Инстаграм (Запрещен в РФ) и однажды подумал "А классно было бы сделать поиск по видео". Но не впихнешь ведь весь интернет на свой скромный сервер. Выхода два - делать B2B под довольно скромную аудиторию или B2C с намного более непонятным сегментом, но с лютым азартом. Конечно, хотелось второй вариант. И вот листал я однажды ленту Shorts в YouTube и выявил некоторую закономерность, что я, рядовой пользователь, сильно увлечен короткими вырезками из фильмов, из интервью, из подкастов, рукоделиями и лайфхаками. Почему такое интересно? Потому что информация сжата до черной дыры, проговаривается и есть субтитры. Этот рецепт я называю "Наркотиком 21го века". И я сложил 2+2, прикинул, какой есть в этом коммерческий интерес и погнали.

Первая версия

У меня довольно много времени ушло, чтобы научиться делать короткие захватывающие вырезки из YouTube и веб редактор, в котором можно быстренько доделать неточности алгоритма и вырезать все аккуратно и красиво. Выглядело оно так:

Первая относительно стабильная версия продукта Joineo
Первая относительно стабильная версия продукта Joineo

Там был правильно установленный реакт, LLM, основы быстрых алгоритмов видеоредактирования и довольно тонкая работа с ffmpeg и сейчас я, конечно, выпадаю в осадок с того, что это сделано одним человеком.

Интересные кейсы

Я занимаюсь этим проектом, потому что я буквально испытываю что-то похожее на выброс адреналина от экстремального спорта, когда вижу результат от программы. Наша разработка может с легкостью выцеплять эмоции, положительные или негативные окрасы. И все это только с помощью NLP без дополнительного анализа звуковой дорожки. Конечно, хотелось бы развить эту идею и сделать полноценный разбор аудио или даже видео, но это позже. К слову, вот что получается создать из 15-ти минутного видео Давидыча про Porsche 918 (присутствует ненормативная лексика):

Оригинал https://www.youtube.com/watch?v=FSjcslofWa4

Доработка идеи и создание команды

В конце 2023-го года я понимал, что уже не могу оставаться на своей основной работе и надо максимально вложиться в мечту, благо я к этому подготовился финансово ровно на столько, чтобы хватило времени на первый релиз. Мы быстро переориентируемся на мобильное приложение, некоторые дыры закрываются подрядчиками, в команде появляется NLP специалист, я увольняюсь с работы и создается распределение обязанностей. И вот у нас уже посвежевший продукт для IOS и Android:

<b>Joineo</b> сейчас
Joineo сейчас

Как еще можно использовать Joineo

Здесь я рассмотрю варианты использования, если в некоторых пунктах абстрагироваться от конечной реализации мобильного приложения.

1) Поиск моментов в видео по смыслу или определенной тематике. Например, можно найти моменты про мотивацию или здоровье и использовать их для разнообразия своего видео. Мы как раз в процессе создания коллекции из фильмов.

2) Как помощь компьютерному зрению. Например, мы строим систему для определения участников в важных событиях футбольного матча (голы, опасные моменты, удаления, травмы). Использовать сложную систему CV для каждого кадра довольно сложно и дорого. Но у нас есть комментатор, который подметит все основные моменты и с помощью Joineo можно в несколько раз сжать объем для обработки CV. Я проводил тесты. Супер насыщенный матч сжимается до 30-ти минут. Для среднего по интересу матча итоговая длительность будет около 10-ти минут или меньше.

3) Создание клипов на музыку. Особенно интересно, если подключить MidJourney к этому делу.

4) Поиск по пользовательской медиатеке. Сейчас YouTube автоматически размечает видео, тем самым убирает границу между поиском и видео. Теперь можно найти по запросу фрагмент из середины видео. Круто! С помощью Joineo можно позволить людям загружать свои видео в определенную платформу (скажем, telegram бот) и давать к ней доступ участникам, чтобы они могли быстро ориентироваться в ваших видео и легко находить информацию.

5) Как маркетинговый помощник. Joineo найдет плюсы и минусы товара, на который есть видео обзор. Или я, допустим, риелтор, и провожу съемку квартир. В этом случае я бы воспользовался нашим сервисом опять же для быстрой склейки положительных свойств квартиры и создал бы дополнительный канал продаж.

И многое другое

Наша монетизация

Планируется работать по Freemium модели и за подписку давать расширенный функционал: более одного видео в обработке одновременно, продвижение видео в очереди, наложение стикеров, увеличенное количество минут для сгенерированных видео:

Premium страница
Premium страница

Международная компания

Несколько удивился, когда понял, что не получится публиковать приложения с платным функционалом, потому что знакомые с неистекшей подпиской разработчика в AppStore говорили, что все окей. Что ж, сгонять в другую страну и потрепать себе нервы с бюрократией для открытия компании? - не проблема! Компания - наверное, громко сказано, это всего лишь ИП и пару лет назад без него можно было бы обойтись. Жаль, тогда я не нашел подходящего для себя направления, а клепать что-то базовое не сильно горел желанием.

Счастливый я с открытым ИП в Армении
Счастливый я с открытым ИП в Армении

Планы

Сейчас проводим финальные приготовления к публикации в мобильных сторах, а также закрытое бета-тестирование. Если Вам интересно поучаствовать, напишите мне и обсудим возможный формат. Параллельно будем пробовать международные инвестиционные площадки. И, конечно, допиливать продукт! Наша B2C задача состоит в том, чтобы делать Viral видео. Того, что есть, недостаточно. Впереди большая работа с кадрированием и перенятием опыта от людей из медиасферы. B2B тоже потихоньку развиваем.

Чему я научился

Хоть путь только в самом начале, уже этот проект дал мне то, о чем давно мечтал - свободу в реализации и управлении. В найме было очень тяжело смириться с поставленными задачами или получать по шапке, когда брал на себя больше. Также я понял одну важную вещь, что довольно простую идею можно раскручивать, думая над ней продолжительное время под разными углами, и найти множество способов ее воплотить. Еще я наконец научился сохранять дружеские отношения, работая с человеком на разных уровнях. Помимо этого получил кучу инсайтов в области управления, стратегии, мотивации команды, международного продвижения.

А какой ваш опыт разработки своих продуктов? Мне (я уверен, не только) правда очень интересно, поделитесь в комментариях.

Эпилог

Спасибо, что дочитали до конца! С вами была команда molchanov.ai. Буду рад конструктивной критике. Обязательно делитесь в комментариях своим виденьем, опытом, советами! Отдельная благодарность Яндексу за грант на свой облачный сервис с инфраструктурой и серверами. Позвольте пару своих ссылочек: 1) Личный telegram, 2) Мой блог в неделовом стиле про деловое IT

99
Начать дискуссию