Обзор YC W23 стартапов по аналитике

Исследовал все стартапы по аналитике из Y Combinator в батче W23. Делюсь описанием их продуктов:

Rollstack

Rollstack - автоматическое создание и обновление документов с данными

Какую проблему решают:

50% работников хотя бы раз в неделю создают слайды презентаций. 75% слайдов используются хотя бы 2 раза, 30% более 5 раз. Для каждого использования слайдов данные нужно обновлять, собирая их по частям из разных систем, каждую неделю/месяц/квартал делая одно и то же.

Продукт:

Создают веб-приложение, где можно настроить интеграцию данных в презентации

Как работает:

  • Добавляете в приложение свой документ
  • Подключаете источники данных
  • Задаете параметры интеграции
  • Графики и данные в документах автоматически обновляются согласно заданным параметрам

Фичи:

  • Поддерживает google и office приложения для документов и презентаций
  • Умеет получать данные из BI инструментов, CRM, БД с готовым SQL запросом
  • Есть версионирование документов

Вообще прикольно, но по сути, решается проблема пропасти в data-грамотности у технических и бизнес пользователей т.к. существующими BI можно легко заменить 80% презентаций, но люди продолжают ручками копировать циферки в слайды.

Brewit

Brewit - диалоговый ИИ для анализа данных

Какую проблему решают:

Напрямую не пишут, но,видимо, как обычно: анализ данных человеком = долго и дорого -> часть простых запросов от менеджеров можно решить с помощью ИИ, а аналитиков в этом процессе оставить в роли супервайзеров.

Продукт:

Веб приложение с диалоговым ИИ

Как работает:

  • Создаете рабочее пространство для своей команды
  • В пространство добавляете нужных сотрудников и управляете политиками доступа для каждого
  • В рабочем пространстве есть подключения к данным, сохраненные графики и чаты. Основная рабочая сущность - чат, т.е. диалог с ассистентом, где вы задаете вопросы, а он генерирует ответы на данных с графиками.

Фичи:

  • Встроенный каталог данных
  • Есть совместное использование, т.е. менеджер может провести какую-то аналитику с ИИ, и потом для валидации отправить результат аналитику данных
  • Настраиваемые политики безопасности, т.е. можно определять у кого какие права доступа будут
  • Есть каталог визуализаций, т.е. можно попросить ИИ генерировать графики, и потом их настраивать
  • Автоматическая аналитика - ИИ сам предлагает вопросы, которые можно задать о своих данных и добавляет свои выводы к получаемым данным

CreatorML

CreatorML - прогнозная аналитика с помощью ML для создателей контента

Какую проблему решают:

  • Успех на ютубе зависит от просмотров, но у создателей контента нет способа узнать сколько они получает просмотра до публикации
  • В попытке узнать “формулу успеха” многие пытаются выпускать много видео и быстро выгорают
  • Ютуберам надо анализировать данные, но только у крупных каналов есть на это ресурс
  • Ключевые факторы успеха на ютубе - качество заголовков и подписей

Продукт:

Расширение для хрома (для всех) и веб-приложение (для блогеров)

Как работает:

  • Загружаете в приложение метаданные планируемого ролика (длительность, превью, описание, теги и т.д.)
  • Получаете прогноз количества просмотров для видео

Фичи:

  • Высокая “насмотренность модели”, т.е. подходит для большого количества ниш и разного размера каналов.
  • Предсказания метрик для видео по метаданным
  • Рекомендации по оптимизации метаданных для видео (скажут что поправить в описании, тегах, обложке, чтобы получить больше просмотров)

Идея - на сайте сказано, что длительность видео значимо влияет на CTR ролика -> почему бы не перейти на платформу, где длительность примерно одинаковая (TikTok)

А вообще, забавно, что раньше были стартапы, создающие алгоритмы для рекомендаций контента, а теперь стартапы, разгадывающие эти алгоритмы, чтобы продвигать нужный контент.

Helicone

Helicone - самый легкий способ следить за LLM приложениями

Какую проблему решают:

Если в вашем продукте есть генеративный ИИ, вам нужны:

  • Админка, чтобы следить за диалогами, промптами и ответами
  • Данные об экономике продукта, например средняя стоимость пользовательского диалога
  • Метрики роста вашего приложения, чтобы не упереться в лимиты подписки
  • Аналитика эффективности ответов, чтобы понимать, когда пора дорабатывать модель/логику

Продукт:

Платформа мониторинга LLM приложений

Как работает:

  • Добавляете в запросы к API из своего приложения прокси к helocine
  • Получаете отчет по всей активности с вашим приложением + доп возможности для его настройки

Фичи:

  • Кеширование - сохраняет запросы = сохраняет время и деньги
  • Лимитирование - защищает ваше приложение от злоупотреблений пользователям
  • Аналитика - покажет все главные метрики LLM приложения (запросы, использование токенов, пользователи)
  • Уведомления - можно настроить триггеры, по которым будут приходить уведомления

Defog.ai

Defog.ai - доработанные LLM для анализа данных в компаниях

Какую проблему решают:

Получение данных для выводов занимаете много времени.

Продукт:

Диалоговый ИИ для задачи text-to-SQL запрос

Как работает:

  • Передаете ИИ метаданные своей базы данных
  • Внедряете ассистента defog в свое приложение
  • Настраиваете внешний вид встроенного окна
  • Запускаете пользователей задавать вопросы о данных и получать графики из текста

Фичи:

  • Адаптируемость - умеет запоминать вашу схему данных и использовать её при построении ответов
  • Точность - сделали модель, специально для задачи текст-sql, которая “из коробки” лучше всех аналогов (даже gpt4), а при использовании заданной схемы, точность близка к 99%
  • Визуализация - все полученные ответы можно автоматически представить в виде графика
  • Безопасность - ИИ не требует доступа к данным и пользуется только описанием метаданных БД

Sherloq

Sherloq - github для команд анализа данных, ИИ помощник для SQL запросов

Я смотрел этот стартап еще полгода назад, они занимались другим продуктом. Раньше делали расширение для хрома для упрощения совместной работы с SQL запросами. Описание ниже - будет о том, что делают сейчас, согласно сайту

Какую проблему решают:

Напрямую не пишут, но,видимо, как обычно: анализ данных человеком = долго и дорого, а надо быстро, доступно, дешево

Продукт:

Текстовый ИИ ассистент + надстройка с популярным редакторам кода

Как работает:

Публичного описания нового продукта еще нет

Фичи:

  • Генерация текст-SQL
  • Автодополнение кода
  • Репозиторий метрик и SQL запросов (видимо осталось с прошлой итерации продукта)
  • Интеграция с популярными редакторами SQL запросов

Honeydew

Honeydew - “дом” для логики работы с данными

Какую проблему решают:

Почему DAU никогда не совпадает в разных отчетах? Команды аналитики - отличные, но не справляются с синхронизацией всех метрик. Нет единого источника правды о расчетах и метриках.

Продукт:

Создают приложение для создания семантического слоя для DWH

Как работает:

  • Подключаете БД
  • Определяете отношения таблиц (есть опция автоматического определения)
  • Задаете кусочки логики (определяете что такое “пользователь”, что такое “активный”)
  • Используете централизованные определения в своих потоках работы с данными

Фичи:

  • Автоматически визуализирует происхождение данных для каждой метрики и её использование в разных отчетах и таблицах
  • Встроенная система контроля версий метрик и данных
  • Оптимизация запросов под *snowflake
  • Дружелюбный к инженерам UI - все настройки определяются через yaml конфиг

*snowflake - провайдер услуг по обработке данных в облаке

Baselit

Baselit - оптимизация расходов на snowflake

Какую проблему решают:

Snowflake - реально дорогой

Продукт:

Веб-приложение, которое ищет неэффективности в использовании вашего *DWH

*DWH - data warehouse - корпоративное хранилище данных

Как работает:

  • Создаете доступ с правами на чтение метаданных вашего DWH
  • Получаете рекомендации по оптимизации работы с DWH + смотрите отчетик в интерфейсе

Фичи:

  • Аналитика затрат вашего DWH
  • Автоматическая генерация рекомендаций по сокращению затрат
  • Уведомления в слак и на почту о проделанной работе по оптимизации

Mantys

Mantys - отслеживание и прогноз ARR для SaaS компаний

Какую проблему решают:

При росте компаний очень тяжело прогнозировать финансовые и продуктовые метрики, потому что сырые данные лежат в разных системах, обработанные данные лежат в эксель/гугл таблицах сотрудников. В результатае, CFO не может точно ответить даже на базовые вопросы, по типу ARR, реализованный ARR.

Продукт:

Делают платформу финансовой аналитики для компаний

Как работает:

NB. Не нашел публичного демо или описания, но частично восстановил из FAQ и скринов:

  • Платформа 3-4 недели изучает вашу бизнес-модель и источники данных
  • Через это время в платформе появляется финансовая отчетность и прогнозирование для вашей компании

Фичи:

  • Автоматизированный сбор данных из большинства систем
  • Отображение метрик и финансовые прогнозы в режиме реального времени
  • Детализация отчетов до сырых данных, т.е. можно провалиться в показатель и смотреть его во всех разрезах, которые только есть в исходных данных
  • Большой набор шаблонов финансового моделирования

Muffin Data

Muffin Data - современная аналитика для брендов потребительских товаров

Какую проблему решают:

В ретейле высокие барьеры входа в аналитику данных о продукте, потому что:

  • Данные разрознены и лежат в разных источниках
  • Почти нет автоматизации
  • Нет согласованности данных, т.к. у всех приложений своя модель данных и своя терминология.

Продукт:

Платформа данных и отчетности для ритейла.

Как работает:

  • Подключаете источники данных
  • Платформа их собирает, обрабатывает для согласованности и считает по ним стандартную аналитику
  • Стандартную аналитику можно видеть в отчетах, а для более сложных запросов можно пользоваться данными, которые были сведены воедино из разных источников

CorgiAI

CorgiAI - защита платежей от мошенничества в ecommerce и путешествиях

Какую проблему решают:

33% пользователей не возвращается в магазин после ложного отклонения платежа

750$ LTV теряется на каждые 100$ ложно отклоненных платежей

Продукт:

Софт для защиты от фрода и платформа аналитики платежей

Как работает:

  • Подключаете своего провайдера платежей
  • За 48 часов под вас создается ML модель
  • Модель запускается в онлайн работу с платежами
  • Вы можете смотреть аналитику транзакций в приложении с отчетами

Фичи:

  • Кастомная, интерпретируемся ML модель
  • Централизованная аналитика платежей
  • Система уведомлений по тригерам

Turntable

Turntable - ИИ помощник для построения потоков обработки данных

Какую проблему решают:

Хотя данные уже одна из самых важных частей современного бизнеса, их обработка зачастую сложная, долгая и дорогая. Команды аналитики тратят большую часть времени в поисках нужных данных, создании конвейеров обработки данных и выполнении разовых запросов. С учетом того, что нанимать талантливых инженеров - трудно, создание потоков данных в компании стало узким горлышком развития и аналитики бизнеса.

Продукт:

Второй пилот для DBT

* DBT - фреймворк с открытым исходным кодом для выполнения, тестирования и документирования SQL-запросов

Фичи:

  • Интеграция с git
  • Автоматический исследовательский анализ данных
  • Есть режим песочницы с ускорением и виртуальной средой
  • Построение истории изменения данных вплоть до каждой колонки

Итоги:

3/12 делают диалогового ИИ для анализа данных в общем виде (Brewit, Defog.ai, Sherloq)

4/12 делают ML/ИИ для конкретной задачи:

  • Muffin data - платформа аналитики для товаров повседневного спроса
  • Mantys - финансовая аналитика для SaaS
  • Helicone - аналитика приложений, использующих LLM
  • CorgiAI - аналитика платежей

4/12 делают промежуточный слой в процессе работы с данными в компании:

  • Rollstack - автоматизация сбора данных для презентаций
  • Honeydraw - централизованное хранилище метрик и понятий для аналитики в компании
  • Turntable - ускорение и упрощение работы по трансформации данных в компании
  • Baselit - автоматизация кост-контроля и оптимизации работы с DWH

Спасибо, что дочитали до конца.

О своем пути аналитика данных в стартапы рассказываю в канале https://t.me/ppbaboshkin, подписывайтесь, если интересно)

1111
17 комментариев

Для каждого использования слайдов данные нужно обновлять, собирая их по частям из разных систем, каждую неделю/месяц/квартал делая одно и то жеВ ПауэрПойнте можно делать графики как эмбеддед Эксель-таблицы. А Эксель через ODBC можно сконнектить к любой БД.

2
Ответить

Эмоционально - соглашусь, что интегрировать данные в документы уже очень легко. Многие BI уже умеют встраиваться много куда, например tableau в notion, power bi в power point.

Идейно, все же выделю, почему (имхо) эту идею оценил YC
1) другой контекст. СНГ компании действительно часто будут искать бесплатное решение для проблемы, стартап все же про US, EU рынки. Там вполне может быть дешевле купить решение, чем обучать и оплачивать время сотрудника на "прикручивание кастомного решения"

2) простота. Да, под каждую подзадачу можно найти бесплатное решение. Где-то odbc прикрутить, что-то умеет само состыковываться, где-то кастом запилить, но тут уже есть готовое для основных источников графиков и данных к основным инструментам по созданию презентаций.

3) ролевая модель. Этот инструмент для бизнес пользователей, по многими причинам им не стоит давать доступ самостоятельно определять откуда и какие данные они будут брать -> инструмент решает проблему интеграции результата работы data-команд в деятельность бизнес-пользователей. Первые делают отчеты и витрины данных, добавляют их в рабочее пространство в rollstack, затем бизнес-пользователи приходят выбирают из готового и обновляют презу.

1
Ответить

Комментарий недоступен

1
Ответить

Мы делаем ETL платформу с low-code dlh.satorilab.ru
Хотим прикрутить аналог sherloq или defrog
Если интересно, давай обсудим)

1
Ответить

Написал в лс на vc.ru, спасибо)

Ответить

Комментарий недоступен

Ответить