Коротко и текстом о том, что заняло бы много часов в видеоформате. Проект https://t.me/Meeting_summarizer_bot [2 часа встречи → 1 минуту инсайтов]
Сейчас ChatGPT даже в бесплатной версии на GPT4o работает) но круто что у вас есть голосовой ввод
А что касается GPT-4o, то пока есть вот эти демо stt (надо выбрать meeting notes или lecture summarization)
https://openai.com/index/hello-gpt-4o/
Это сильно лучше вариаций whisper
Спасибо что поправили, этот пункт из оферты смутил:
У мультимодальной Gemini Pro WER 5,6% vs 7.3% у Whisper на 15 минутных аудио
https://arxiv.org/pdf/2403.05530
Причем, если протестируете, прям совсем другое качество по распознаванию собственных имен и аббревиатур. И контекст классно понимает это не 30 секунд, как у Whisper, этот подкаст в 120к токенов Gemini Pro помещается из 1кк.
А в ChatGPT все еще Whisper на распознание прикручен пока. Поэтому и процент ошибок тот же что и был.
Про 100% точность не говорил, но и у человека WER 0% не будет)
Короче будущее в stt за мультимодальными моделями у которых трилиарды параметров + контекст с 1+ часов.
На самом деле OpenAI уже победила эту проблему своим GPT-4o. У мультимодальных моделей в 1000x раз больше знаний о текстах и она понимает любые термины, которые были в интернете. Но использовать эту возможность пока могут только избранные пару компаний, доступ к API для видео/аудио не публичный еще. Вот в Gemini от Гугла уже можно попробовать.
Mymeet.ai насколько из их оферты понял, использует Google API для транскрипции (но лучше всех по качеству из доступных API транскрипции - у амазона)
В комментарий только половина влезла, но так ребята молодцы) удачи им) зачетный эпизод!
Не удержался и транскрибировал эту серию))
Саммари:
00 min
1. Удержание мотивации команды важно, особенно в условиях долгого ожидания результатов (1:13)
2. Поддержка от близких и команды важна, но на первых этапах стартапу не стоит рассчитывать на поддержку рынка (1:35, 1:42)
3. Один из стартапов за первые полгода смог привлечь 12 млн рублей грантов и 4,5 млн рублей инвестиций (1:48)
4. Спрос на инструменты для бизнеса и команд в области искусственного интеллекта увеличился из-за бума нейросетей (2:05)
5. Команда MyMeet.ai привлекла первый раунд в 3 млн рублей (3:18)
6. Разработка собственных моделей и движков важна для стартапов в области искусственного интеллекта (8:17)
7. Проблема с LLM-моделями заключается в сложностях работы с русским языком из-за различий в токенизации (9:09)
10 min
1. Модели нейросетей работают лучше на языках с большим объемом данных, таких как немецкий, испанский, китайский (10:38)
2. Для улучшения работы моделей можно использовать частичное дообучение на 200-500 примерах (12:18)
3. Для успешного проекта в области нейросетей и LLM необходима команда из NLP-специалиста, ML-инженера и дата-инженера (15:26)
4. На начальных стадиях проекта можно обойтись без специалистов, привлекая людей заинтересованных в проекте (17:26)
5. После MVP для развития проекта требуется более квалифицированная команда, средняя зарплата МЛ-специалиста составляет 300-350 тысяч рублей (18:45)
6. Важно, чтобы участники команды были заинтересованы в проекте и видели его как свое дело, возможно с долями в компании (19:26)
20 min
1. Инвестиции необходимы для выхода на прибыль (20:12).
2. Илья Байзер является кофаундером и получает долю (20:58).
3. Планируют привлечь инвесторов через акселераторы и конференции (22:48).
4. Участие в различных мероприятиях, таких как HSE Fiesta и TMO Акселератор, помогло привлечь инвесторов (23:09).
5. Product Radar помог найти партнеров и инвесторов (23:23).
6. Целевая аудитория - в первую очередь айтишники, затем социологи и другие специалисты (27:02).
7. Средний чек - 2500, количество платящих пользователей - 250 (27:18).
8. Маркетинг начали с привлечения первых платных пользователей и корпоративных тарифов (28:08).
9. Анализ метрик привлечения и воронок продаж помог увеличить эффективность маркетинга (29:13).
30 min
1. Стартап MyMeet не требует финансирования и инвесторов, потратили 70 тысяч рублей, деньги идут на маркетинг (30:10).
2. Генеральный директор стартапа MyMeet сталкивался с трудностями, работая фулл-тайм и занимаясь разработкой вечерами и выходными (30:36).
3. Необходимость многократного пересмотра образовательных видео для поиска нужной информации привела к созданию проекта Visever, который предлагает поиск внутри видео с помощью текстовых запросов и тайм-кодов с краткими резюме (37:41).
4. Visever получил гранты от фонда содействия инновациям на сумму 2 миллионов рублей (34:52).
5. Пользователи Visever благодарят за возможность быстро находить нужные цитаты в видео и использовать их в своих работах (37:53).
6. Внутри видео на Visever также представлены тайм-коды с кратким текстовым резюме, что помогает пользователям быстро оценить содержание фрагмента (38:35).
7. Многие пользователи предпочитают получать новые знания в текстовом формате, а видео используют для визуализации и подкрепления информации (39:16).
40 min
1. Важным стал момент рождения дочери, после чего возникла потребность быстро и эффективно подготовиться к поступлению в аспирантуру (40:20)
2. Недостаток возможности отфильтровать и сортировать образовательные видеоиз источников привел к идее создания сервиса для сбора видео из разных источников (41:36)
3. Важность быстрой разработки продукта и его тестирования, особенно при наличии маленьких детей (45:45)
4. Поиск команды для проекта начался с определения целевой аудитории и потребностей, что привело к нахождению специалистов в Беларуси (48:14)
5. Озвучивание своих потребностей и запросов помогло быстро найти нужных специалистов, включая крупнейших экспертов в области искусственного интеллекта (49:12)
Жду суммаризацию) Отличная статья
00 min
1. Захар начал заниматься дизайном после профессионального футбола (2:10)
2. Он начал изучать дизайн с пробного курса в Яндекс.Практикуме и работал на фрилансе (3:36)
3. Захар создал портфолио из учебных и студенческих проектов (7:40)
4. Первый сайт, который Захар задизайнил и разработал, пошел в прод (7:40)
5. Захар начал работать с МАЦ по проектной основе, позже стал фулл-тайм дизайнером (9:40)
10 min
1. После опыта работы в МАЦе решено перейти в продуктовую сферу из-за желания зарабатывать (10:10-10:14).
2. Опыт работы в МАЦе включал различные проекты, от лендингов до корпоративных сайтов (10:37).
3. Сложность перехода из студии в продуктовую компанию из-за отсутствия опыта и портфолио (11:17, 11:37).
4. Поиск работы в продуктовой сфере после работы в стартапе Бриз для наполнения портфолио (14:39).
5. Middle дизайнер из студии выдаст хуже результат, чем Middle
дизайнер в разработке продукта, если нужно будет сделать новый раздел, допустим в Ozone travel (17:02).
6. Для успешного продуктового дизайнера важно иметь опыт работы с продуктом (18:18).
7. Большинство студий не продуктовые, лишь меньшинство занимается долгосрочным развитием продуктов (19:04).
8. Упоминание о корпорациях, где продукты развиваются долгосрочно (19:50).
20 min
1. 40 проектов сделано, из них примерно 10% - лендосы, остальные продукты (20:07)
2. Работа с Сбером и Евразом только через Клуб Первых - социальная сеть для предпринимателей (20:20)
3. Отличие между продуктом и студией: в продукте важно следить за результатами после запуска (20:52)
4. Разработка интерфейсов для Smart TV и других устройств для Сбера (21:10)
5. Переход от работы над продуктами к созданию собственной студии произошел из-за скучноты и желания заниматься своим бизнесом (23:53)
30 min
1. Решение по созданию студии пришло случайно, команда дизайнеров пришла с идеей продукта «Хелпер» - это медицинская информационная система (30:08-30:50).
2. Команда состоит из 8 человек: из них 3 разработчика, 1 дизайнер (33:09-33:16).
3. Решение создать студию полного цикла было обусловлено необходимостью разработчиков для продукта и переходом на клиентские проекты (33:40-34:16).
4. Ошибка в найме сотрудников была связана с выбором людей, не соответствующих ценностям и требованиям команды (36:11-36:28).
5. Команда не нанимает сотрудников, которые не готовы вкладывать себя в развитие студии в нерабочее время (38:25-38:51).
6. Вся кор-команда получает выгоду от роста студии, что мотивирует их работать сверхурочно (39:14-39:22).
7. Получение наград и премий в студии рассматривается как способ поощрения и мотивации команды (39:42-39:55).
40 min
1. Некоторые люди постят в соцсетях, чтобы похвастаться и потешить своё эго, а не для получения наград (40:08).
2. При найме сотрудников важно определить критерии выбора и потребности на разных этапах развития компании (40:43).
3. Рекомендации от знакомых могут быть ключевым фактором при выборе сотрудников (41:49).
4. Уровень дизайна не зависит только от количества часов работы, но и от обучаемости, предрасположенности и синергии времени (43:01).
5. Процессы в студии помогают повысить качество проектов, сократить время работы и обеспечить рентабельность бизнеса (47:14).
6. Оптимизация процессов производства дизайна может привести к экономии времени и денег на других проектах (48:07).
50 min
1. Компания стремится к росту и увеличению объемов проектного портфеля (51:40).
2. Цель компании - стать бутиковой студией с небольшой командой, участвующей в одном проекте (51:51).
3. Планируется масштабирование компании до 100-500 сотрудников (52:10).
4. Важно сохранить качество проектов при масштабировании (52:05).
5. Подкаст с фаундером студии Утопия завершился предложением участвовать в розыгрыше мерча с заданием написать о попадании в новую школу (52:38).
В этом и сложность) что не так много людей имеют привязанный МТС/Билайн к Apple ID
Вы использовали RAG от Яндекса, который генерирует ответы на основании сайтов, а не сам YandexGPT 🤦♂️
До этого для ботов было Payments 2.0 прямо в телеграмме без всяких шлюзов и максимально надежно. Сейчас же пользователи Apple из России из-за сложностей с пополнением Apple ID отвалятся.
Вот полный текст предупреждения от Телеграма, до 12 июня еще можно будет человеческим способом оплатить подписки в ботах
Когда они пришли за баклажаном, я молчал. Но когда за ботами …
Телеграмм бота для суммаризации встреч сделал, как бонусом он и ссылки YT поддерживает и вычленяет все факты с временными метками: https://t.me/Meeting_summarizer_bot
(Но из-за того что за 2 месяца уже 12к пользователей набралось, только 1 видео с YT бесплатно, остальные по 7р, чтобы не получить бан от YT, + 3 встречи бесплатно каждый месяц:))
А так есть варианты, которые именно с субтитрами YT работают - в GPT store много вариантов и на Product Hunt видел еще)
2/3 интересующих видео с YouTube в формате текстового саммари начал смотреть, ни о чем не жалею :)
Можно просто на LMSYS chatbot arena зайти и попробовать) дополните свою инструкцию, пожалуйста
В Side by side разделе работает 👍🏻
О, видимо сейчас слишком много запросов. Но проверил в Arena (side-by-side) все работает
Не, это только текст) пока функция переводчика даже в ChatGPT недоступна - в том ключе, в котором на презентации было показано
*Это некоммерческий проект спонсируемый kaggle, Berkeley и еще парой компаний для сравнения нейросетей. Надо выбрать Direct Chat и потом gpt-4o-2024-05-13
В реальности тормозит(
Бесплатно, без впн и ненужных телеграм ботов GPT-4o можно сравнить со всеми остальными нейронками на LMSYS Chatbot Arena: https://chat.lmsys.org/
Запросов можно будет отправить только на 5$. А если привяжете карту, то не больше чем на 100$ можно будет запросов отправить
Как раз GPT-4o оказалось моделью с наименьшим количеством галлюцинаций) На тесте из общих вопросов (MMMU) лучше всего себя показывает. А если давать 5 попыток ответить, у простой GPT-4 до этого 86% правильных ответов было. Так что тут явно за 90% точность перевалит
Я не говорил что его нет у chatgpt) я говорил что это круто))