Платформа для управления качеством аналитических данных Datafold с основателями из России привлекла $20 млн

Средства направят на расширение команды и улучшение платформы.

  • Раунд возглавила венчурная фирма NEA (New Enterprise Associates), также в нём участвовала компания Amplify Partners.
  • Полученные средства компания направит на дальнейшее развитие платформы контроля данных и расширение команды. По данным основателя Глеба Межанского, сейчас в стартапе работают 18 человек.
  • Стартап Datafold был запущен в 2020 году Глебом Межанским и Алексом Морозовым. Компания предлагает автоматизированную систему для поиска качественных данных, их исправления перед использованием в производстве, а также мониторинга тех данных, которые уже используются.
  • Среди клиентов платформы есть Patreon, Thumbtack, Faire и Dutchie. По данным Crunchbase, с момента основания стартап привлёк $22,2 млн.
1515
22 комментария

Не очень понял, что они в итоге делают с данными? Заполняют пропуски средним?)

7
Ответить

Скорее даёт алёрты в случае обнаружения проблем:
«With Datafold, changes made by data engineers in their extractions and transformations can be compared for unintentional changes. For instance, maybe a function that formerly returned an integer now returns a text string, an accidental mistake introduced by the engineer. Rather than wait until BI tools flop and a bunch of alerts come in from managers, Datafold will indicate that there is likely some sort of problem, and identify what happened».
https://techcrunch.com/2020/08/05/datafold-is-solving-the-chaos-of-data-engineering/

2
Ответить

Это платформа для мониторинга качества данных.
Ведь на основе плохих данных может получиться, что "команда биг дата проанализировала" и привет

2
Ответить

Профилируют данные по разным правилам и следят, чтобы по ходу времени профиль был стабилен. Если, например, в црмке обычно за день обновляются записи по 5000 клиентов, а за вчера было 30000 изменений - почему бы владельцу данных не обратить внимание на это.

1
Ответить

Заменяют пробелы на тире в строке

Ответить

И это с командой в 18 человек. Кажется, КПД у этой команды зашкаливает

6
Ответить

Собственно идея, технология и движок там несложные. Основная сложность это пользовательские сценарии и UX.

Прямой кандидат на продажу Informatica, потому что это ещё одно слабо интегрируемое в стэк по управлению данными софтваре. У этого продукта сильно больше шансов заинтересовать клиентов если его грамотно пришьют к существующим платформам.

3
Ответить