{"id":14277,"url":"\/distributions\/14277\/click?bit=1&hash=17ce698c744183890278e5e72fb5473eaa8dd0a28fac1d357bd91d8537b18c22","title":"\u041e\u0446\u0438\u0444\u0440\u043e\u0432\u0430\u0442\u044c \u043b\u0438\u0442\u0440\u044b \u0431\u0435\u043d\u0437\u0438\u043d\u0430 \u0438\u043b\u0438 \u0437\u043e\u043b\u043e\u0442\u044b\u0435 \u0443\u043a\u0440\u0430\u0448\u0435\u043d\u0438\u044f","buttonText":"\u041a\u0430\u043a?","imageUuid":"771ad34a-9f50-5b0b-bc84-204d36a20025"}

Стартап Kern AI привлек $2,9 млн на платформу с инструментами для разработчиков NLP-моделей

Стартап Kern AI занимается развитием платформы со вспомогательными инструментами для разработчиков NLP-моделей и специалистов по обработке данных. Она предназначена для упрощения процесса маркировки обучающих данных и автоматизации различных задач по их обработке.

Изображение: Kern AI

На днях компания объявила о привлечении $2,9 млн в ходе посевного раунда финансирования, в котором приняли участие несколько венчурных фондов и частных инвесторов.

Технологии обработки естественного языка (Natural Language Processing, NLP) развиваются уже далеко не первый год, но за последние несколько месяцев интерес к ним значительно возрос из-за ажиотажа вокруг ChatGPT и его конкурентных языковых моделей. Вводя несколько ключевых слов в поле и мгновенно получая в ответ полноценный сгенерированный текст, пользователи не всегда задумываются, какая масштабная работа стоит за созданием таких моделей, начиная от первых этапов разработки и заканчивая доведением продукта до полноценного состояния, пригодного для массового использования.

Для создания NLP-моделей необходимы не только алгоритмы, но и массивы качественных обучающих данных, которые правильно промаркированы. Маркировка - это метод классификации необработанных данных, которые затем служат шаблонами для всестороннего обучения ИИ-модели.

Основанный в 2020 году стартап Kern AI разрабатывает инструменты для упрощения этого процесса - с их помощью разработчики могут быстрее обучать свои модели благодаря качественной маркировке данных. Так, флагманским продуктом компании является инструмент Refinery с открытым исходным кодом, который позволяет полуавтоматизировать процесс маркировки обучающих данных, выявлять среди них низкокачественные наборы и мониторить все данные в едином интерфейсе.

Еще одна разработка компании с открытым исходным кодом - инструмент Bricks, представляющий собой набор модульных стандартизированных “фрагментов кода”, которые разработчики могут интегрировать в свои инструменты по обработке данных для автоматизации различных процессов.

По заявлению стартапа, его инструментами уже пользуются специалисты в таких крупных компаниях, как Samsung и DocuSign.

Продукты стартапа, по словам его генерального директора Йоханнеса Хеттера, предназначены не только для создания больших языковых моделей, но и для автоматизации NLP-процессов в небольших компаниях. Например, Kern AI предлагает инструменты, которые помогают структурировать письменные заказы клиентов на основе языкового анализа и извлечения из них различного вида информации.

Полученное новое финансирование стартап планирует вложить в дальнейшее расширение своей платформы: например, компания собирается пополнить её инструментами для маркировки и обработки данных аудио-формата. Кроме того, в планы стартапа входит создание более узконаправленных продуктов для применения в конкретных отдельных отраслях.

Источник: TechCrunch

Если вам понравилась статья, поделитесь ею в своем блоге или поставьте нам оценку, чтобы о проекте узнало как можно больше читателей!

0
1 комментарий
Nickolai Vasiliev

Интерестинг. Букмаркд.

Ответить
Развернуть ветку
-2 комментариев
Раскрывать всегда