{"id":13886,"url":"\/distributions\/13886\/click?bit=1&hash=830980e998c57143b7939201e0c0a7c7faf66494e3f81d26faa1100cf4336772","title":"\u00ab\u041c\u043e\u0434\u0443\u043b\u044c\u0431\u0430\u043d\u043a\u00bb: \u043f\u043e\u043c\u043e\u0436\u0435\u043c \u043e\u0442\u043a\u0440\u044b\u0442\u044c \u041f\u0412\u0417 \u0438 \u0440\u0435\u0448\u0438\u043c \u043f\u0440\u0435\u0442\u0435\u043d\u0437\u0438\u0438 \u043c\u0430\u0440\u043a\u0435\u0442\u043f\u043b\u0435\u0439\u0441\u043e\u0432","buttonText":"\u041f\u0440\u043e\u0432\u0435\u0440\u0438\u0442\u044c","imageUuid":"3669c0b4-afd0-5dd5-9434-590ba61d5e83","isPaidAndBannersEnabled":false}

Стартап Kern AI привлек $2,9 млн на платформу с инструментами для разработчиков NLP-моделей

Стартап Kern AI занимается развитием платформы со вспомогательными инструментами для разработчиков NLP-моделей и специалистов по обработке данных. Она предназначена для упрощения процесса маркировки обучающих данных и автоматизации различных задач по их обработке.

Изображение: Kern AI

На днях компания объявила о привлечении $2,9 млн в ходе посевного раунда финансирования, в котором приняли участие несколько венчурных фондов и частных инвесторов.

Технологии обработки естественного языка (Natural Language Processing, NLP) развиваются уже далеко не первый год, но за последние несколько месяцев интерес к ним значительно возрос из-за ажиотажа вокруг ChatGPT и его конкурентных языковых моделей. Вводя несколько ключевых слов в поле и мгновенно получая в ответ полноценный сгенерированный текст, пользователи не всегда задумываются, какая масштабная работа стоит за созданием таких моделей, начиная от первых этапов разработки и заканчивая доведением продукта до полноценного состояния, пригодного для массового использования.

Для создания NLP-моделей необходимы не только алгоритмы, но и массивы качественных обучающих данных, которые правильно промаркированы. Маркировка - это метод классификации необработанных данных, которые затем служат шаблонами для всестороннего обучения ИИ-модели.

Основанный в 2020 году стартап Kern AI разрабатывает инструменты для упрощения этого процесса - с их помощью разработчики могут быстрее обучать свои модели благодаря качественной маркировке данных. Так, флагманским продуктом компании является инструмент Refinery с открытым исходным кодом, который позволяет полуавтоматизировать процесс маркировки обучающих данных, выявлять среди них низкокачественные наборы и мониторить все данные в едином интерфейсе.

Еще одна разработка компании с открытым исходным кодом - инструмент Bricks, представляющий собой набор модульных стандартизированных “фрагментов кода”, которые разработчики могут интегрировать в свои инструменты по обработке данных для автоматизации различных процессов.

По заявлению стартапа, его инструментами уже пользуются специалисты в таких крупных компаниях, как Samsung и DocuSign.

Продукты стартапа, по словам его генерального директора Йоханнеса Хеттера, предназначены не только для создания больших языковых моделей, но и для автоматизации NLP-процессов в небольших компаниях. Например, Kern AI предлагает инструменты, которые помогают структурировать письменные заказы клиентов на основе языкового анализа и извлечения из них различного вида информации.

Полученное новое финансирование стартап планирует вложить в дальнейшее расширение своей платформы: например, компания собирается пополнить её инструментами для маркировки и обработки данных аудио-формата. Кроме того, в планы стартапа входит создание более узконаправленных продуктов для применения в конкретных отдельных отраслях.

Источник: TechCrunch

Если вам понравилась статья, поделитесь ею в своем блоге или поставьте нам оценку, чтобы о проекте узнало как можно больше читателей!

0
1 комментарий
Nickolai Vasiliev

Интерестинг. Букмаркд.

Ответить
Развернуть ветку
Читать все 1 комментарий
null