Стартап Datacurve, который собирает данные для обучения ИИ через задачи для программистов, привлёк $15 млн инвестиций

С развитием моделей ИИ-лаборатории активнее ищут «сложные» датасеты, отмечал TechCrunch.

Основатели Datacurve Серена Ге и Чарли Ли. Источник: Chemistry VC
Основатели Datacurve Серена Ге и Чарли Ли. Источник: Chemistry VC
  • В раунде инвестиций серии А участвовал партнёр венчурного фонда Chemistry Марк Голдберг, а также сотрудники DeepMind, Vercel, Anthropic и OpenAI. До этого Datacurve привлёк $2,7 млн — в посевном раунде от бывшего технического директора криптобиржи Coinbase Баладжи Сринивасана.
  • Для сбора «качественного» кода Datacurve проводит геймифицированные челленджи для разработчиков на платформе Shipd. Участники выполняют задания по анализу и отладке кода, а также оценивают результаты работы программ.
  • Лучшие разработчики получают денежное вознаграждение — в сумме стартап выплатил им более $1 млн.
  • Полученный код Datacurve проверяет на корректность и продаёт компаниям, которым нужны «сложные» датасеты — например, тем, кто разрабатывает инструменты для генеративного ИИ или создаёт базовые модели.
  • Соосновательница Datacurve Серена Ге считает стартап «скорее потребительским продуктом, чем фабрикой по разметке данных». «Главный стимул для наших участников — сам процесс, поскольку на основной работе они всё равно получают больше денег», — сказала Ге.
  • Она также отметила, что модель сбора данных Datacurve может быть адаптирована к другим сферам — например, финансам, маркетингу или медицине.
  • В сентября 2025 года TechCrunch сообщал, что крупные ИИ-лаборатории стали создавать среды для обучения с подкреплением, где тренируют агентов на сложных задачах. Для этого нужны «качественные данные в больших объёмах» — и с усложнением среды увеличиваются требования к ним, отметило издание.
3
9 комментариев