Axevil Capital: Как мы создавали венчурного AI-советника Клаудию

Axevil Capital: Как мы создавали венчурного AI-советника Клаудию

Мы в Axevil Capital строим венчурную платформу для инвестиций в частные технологические компании на pre-IPO стадии. Считается, что венчурные инвестиции в late-stage компании удел крупных инвестиционных фондов. Наша цель — разрушить этот стереотип и демократизировать доступ к венчуру.

Доступность начинается с информированности, поэтому мы подумали, что будет интересно создать AI-советника, который не просто рассказывает про то, что такое pre-IPO, но и разбирается в деталях бизнесов наших портфельных компаний.

В процессе создания AI-ассистента мы изучили все доступные LLM модели, набили энное количество шишек, поняли, почему все то, что вызывает восторг у нас, как у обычных пользователей, мы же, как представители бизнеса, воспринимает с некоторым скепсисом.

В итоге первый венчурный AI-ассистент успешно запущен и уже отвечает на вопросы пользователей в приложении Axevil и в телеграмме, а мы хотим поделиться тем, как это было.

Что уже умеет генеративный ИИ.

Для начала давайте посмотрим, на какой стадии развития сейчас находятся генеративные нейронные сети. Вообще слово генеративный в определении подразумевает, что речь идет про создание контента — текста, картинок, видео, музыки.

Работа с графикой

Теперь вы можете воочию увидеть все, чтобы ни пришло вам в голову. Достаточно перенести вашу фантазию в промт и изображение готово. С этим уже отлично справляются DALL-E, Midjorney и другие.

Axevil Capital: Как мы создавали венчурного AI-советника Клаудию

Профессиональные видео

Еще пару месяцев назад сгенерированные видео выглядели как набор отдельных кадров, склеенных вместе. Теперь же AI-модели научились сохранять консистентность между кадрами, где каждый следующий кадр плавно продолжает предыдущий.

Такие видео теперь выглядят как работа профессиональной команды, состоящей из оператора и специалиста по спецэффектам. Результат впечатляет.

Видео создано Luma AI

Музыкальные таланты AI

Включите видео и звук, и вы услышите песню, которой ранее просто не существовало в мире. У нее не было автора, не было композитора. Был просто промпт: “Напиши песню о венчурном советнике Клаудии, которая отвечает на вопросы про венчурные инвестиции в джазовом исполнении”. Получилось очень даже неплохо, спасибо Suno за эту композицию.

Мультимодальные чатботы

Если раньше общаться с чат-ботами можно было только текстом, то теперь они умеют работать с голосом, фото и видео.

Axevil Capital: Как мы создавали венчурного AI-советника Клаудию
Axevil Capital: Как мы создавали венчурного AI-советника Клаудию

На самом деле картинка выбрана не случайно.

Что здесь интересного:

  • Во-первых AI распознал рукописный текст на листе бумаги и понял его смысл.
  • Во-вторых, он считал эмоции с лица персонажа
  • В-третьих, он связал первое со вторым и понял скрытый смысл, заложенный в картинку — почувствовал сарказм в подобном сочетании.

В чем разница между B2C и B2B

Что ждет бизнес от AI? Довольно много:

  • Повышение эффективности за счет автоматизации и сокращения ручного труда
  • Персонализация для улучшения взаимодействия с клиентами
  • Инновации в разработке продуктов, маркетинге и обслуживании клиентов
  • Операционные инсайты на базе анализа внутренней информации

Безусловно, генеративный AI умеет уже очень и очень много, но есть моменты, которые требуют внимание разработчиков ведущих LLM моделей.

В первую очередь, у бизнеса есть запрос на точность информации, которая непосредственно связана с деятельностью компании.

  • Нужна не просто картинка, а конкретное изображение продукции компании
  • Нужно не просто распознать человека на фотографии, а уметь определить имя и фамилию сотрудника, если, например, речь идет о пропускной системе
  • Нужно не просто рассказать про рынок венчура и пре-IPO, но дать подробную информацию о портфельных компаниях.

Помимо точности существуют также опасения по поводу безопасности данных при использовании AI, особенно в тех вопросах, где заходит речь о персональных данных.

Какую LLM модель мы выбрали?

По имени нашего AI-ассистента — Клаудии — можно догадаться, что мы выбрали Claude 3 от компании Anthropic. Изначально, впрочем, Клаудия не была Клаудией — в процессе исследования мы перебрали множество LLM моделей от всех известных разработчиков и в итоге остановились на Claude.

Почему?

Во-первых, нам нравится сам продукт и его направление развития. Новые версии Claude неизменно держат высокую планку, соперничая с ведущими LLM моделями от OpenAI. Свежий релиз Claude 3.5 уверенно конкурирует с GPT-4o и демонстрирует отличные результаты по ключевым метрикам..

Во-вторых, нам нравится сама компания Anthropic и тот вектор создания безопасного AI, который они выбрали. Эта философия привлекает сильнейших экспертов из индустрии, и если Open AI постоянно сопровождают корпоративные конфликты, то Anthropic наращивает экспертизу во всех ключевых направлениях.

Один из ярких примеров недавнего времени — переход из Open AI в Anthropic ведущего специалиста по безопасности Ян Лейке, цитата которого во время ухода из Open AI, заслуживает отдельного внимания:“Stepping away from this job has been one of the hardest things I have ever done, because we urgently need to figure out how to steer and control AI systems much smarter than us.”

В вольном переводе — уход из OpenAI одно из самых сложных решений в его жизни, но не потому, что он так прикипел душой к компании, а потому, что “нам нужно срочно понять, как управлять и контролировать AI системы, которые намного умнее нас”.

Немного пугает слово “срочно” и радует, что есть люди, которым это небезразлично.

В итоге мы сделали свою ставку на Claude и начали создавать нашу Клаудию.

Как бизнес учит LLM модели

Есть несколько базовых способа обучения LLM моделей.

Axevil Capital: Как мы создавали венчурного AI-советника Клаудию

Fine tuning

По сути компания заказывает разработку собственной LLM модели на основе существующей, она обучается на предоставленных данных и в итоге получается новая fine tuned модель.

Особенности такого подхода к обучению:

  • Для такого обучения нужен большой объем данных
  • Это дорого, не каждая компания сможет себе это позволить
  • Каждое обучение занимает время
  • При этом, как ни печально, результат не гарантирован

Retrieval Augmented Generation (RAG)

Мы для тренировки Клаудии выбрали этот метод, так как он позволяет быстрее и дешевле обучить модель на нашей внутренней информации без трансформации базовой модели.

Вместе с запросом пользователя в LLM модель отдается база знаний, которая и задает контекст будущего ответа LLM модели.

По сути, RAG объединяет сильные стороны поисковых систем (нахождение нужной информации) и языковых моделей (создание естественных и плавных ответов), чтобы предоставлять более точные и полезные ответы.

Вот как это работает простыми словами:

  • Поиск: Когда вы задаете вопрос или вам нужна информация, система сначала ищет в большой коллекции документов (например, в библиотеке или базе данных), чтобы найти наиболее релевантные кусочки информации.
  • Дополнение: Затем система использует найденную информацию, чтобы лучше понять тему. Этот шаг гарантирует, что ответ будет основан на точной и актуальной информации.
  • Генерация: Наконец, система использует языковую модель для создания связного и уместного ответа, интегрируя информацию, найденную на этапе поиска.

Если ранее такой способ обучения моделей был ограничен размером контекстного окна, то теперь это ограничение снимается в новых версиях ведущих LLM моделей.

Что в итоге у нас получилось

В итоге получилась Клаудия — первый на рынке венчурный AI-советник, который знает и про рынок pre-IPO и венчура и обладает детальной информацией по портфельным сделкам Axevil Capital, включая последние апдейты о текущем бизнесе компаний, куда мы уже инвестировали: Anthropic, Klarna, Stripe, Revolut, Kraken, Scale AI и другие.

Пусть Клаудия расскажет сама про себя.

Как можно поговорить с нашим AI-советником?

Внимательный читатель может заметить, что Claude от Anthropic не умеет создавать визуальный образ аватара. И это абсолютная правда — для визуализации нашего Клаудии мы использовали платформу Heygen, которая в свою очередь для генерации голоса использует платформу ElevenLabs, а те, скорее всего тренировали свою модель на базе данных таких инфраструктурных игроков типа Scale AI.

Как видим в этой индустрии все взаимосвязано, все дополняет друг друга и самая приятная в этом вещь в том, что мы уже можем пользоваться результатом этих коллабораций.

Забегая вперед скажем, что визуальный аватар наша Клаудия пока не использует, но это есть в планах на будущее.

Прямо сейчас Клаудию можно найти в приложении Axevil

Axevil Capital: Как мы создавали венчурного AI-советника Клаудию

Также она живет в нашем телеграм-боте

Что дальше?

На Клаудию у нас большие планы — мы видим, что она помогает не только потенциальным клиентам, интересующихся венчуром, но и является отличным ассистентом для партнеров и менеджеров.

В дальнейших планах — использование AI для персонализации коммуникаций с клиентами, более четкое понимание контекста и запроса каждого, кто использует мобильное приложение Axevil.

1 комментарий

Клава давай! Когда то еще сериал был такой