«День в стиле Ghibli»
Ручка в виде кредитки

Handl — сервис разметки данных для машинного обучения от Dbrain

На платформе уже зарегистрировалось 25 тысяч человек, которые помогают размечать данные для технологических компаний и получают за это деньги. Сегодня Handl официально запускается после успешного альфа-тестирования, и теперь к проекту может присоединиться любой желающий.

Что такое разметка

Представьте маленького ребёнка, который ничего не умеет. Родители не будут объяснять, что котёнок — это маленькое животное с пушистым хвостиком. Такое описание подходит и щенку. Вместо этого они покажут много котят и щенят, поправляя ребенка до тех пор, пока он не научится отличать животных самостоятельно.

С искусственным интеллектом тот же принцип, который применим почти везде: ИИ распознает качество пиццы, преступников на улице и серьезные заболевания на ранних стадиях, но сначала ему надо показать тысячи примеров, где эту задачу уже решил человек, — другими словами, подготовил данные для машинного обучения. Это и называется разметкой.

Разметка данных — самая трудозатратная задача при создании ИИ: надо без ошибок разметить тысячи единиц информации. Мы в Handl придумали, как упростить весь процесс. Наши разметчики подключаются из любой точки мира и размечают данные — к примеру, определяют, что изображено на картинке, то есть ставят «метки». Так они готовят обучающую выборку для ИИ. Переняв знания людей, алгоритм успешно решает аналогичные задачи.

Сегментация текста на Handl

Как устроен процесс работы в Handl

Со стороны клиента. Клиент загружает данные, выбирает шаблон задачи (классификация, сегментация, ввод текста) и запускает её в работу. Разметчики выполняют задания. Если разметка требует специальных знаний вроде китайского языка или медицинского образования, можно привлечь своих исполнителей и использовать наш интерфейс.

Со стороны разметчиков. Разметчики регистрируются, проходят онбординг и получают доступ к задачам, зарабатывая до 3 долларов в час.

Механизм работы. Алгоритм консенсуса распределяет выплаты и следит за отсутствием ошибок: от качества разметки зависит точность распознавания будущей ИИ-модели. Система выплат работает так: как только люди размечают картинку, мы считаем объективное время, необходимое для этой задачи, а алгоритм консенсуса вычисляет коэффициент качества. Чем меньше времени затрачено на задачу и чем точнее она выполнена, тем больше начисление. Поэтому разметчики стараются выполнять задачи максимально качественно.

Мы уже разметили более 6 миллионов картинок, текстов и звуков для таких компаний как Nvidia, Nestle, Cherry Home. В отличие от других аналогичных сервисов, Handl сфокусирован только на задачах по подготовке данных для машинного обучения. Благодаря этому мы выполняем разметку с высокой точностью, скоростью и с меньшими затратами.

Кейс: молочная ферма

Коровам на ферме нужно правильно питаться, чтобы давать вкусное молоко. Но когда их сотни, проследить за состоянием каждой коровы сложно. Чтобы автоматизировать контроль за их здоровьем, мы разметили 143 тысячи изображений для обучения нейронной сети. Сначала люди размечали картинки, отвечая на вопрос «что тут изображено?», тем самым отсеивая коров от других животных.

Потом обводили коров по контуру, чтобы ИИ точно определил их местоположение. И наконец, работали с видео, указывая, что делает корова: ест, пьёт, лежит или ходит.

В итоге получилась нейронная сеть, которая мониторит здоровье коров и прогнозирует, как они будут себя чувствовать в будущем. Руководствуясь информацией с камер наблюдения, ИИ отслеживает поведение каждого животного по отдельности и выявляет аномалии — например, корова плохо ест или слишком долго лежит на земле. В этом случае система подаёт сигнал фермерам.

Выводы

Основная проблема в разработке ИИ — подготовить данные. Мы упростили этот процесс и запустили платформу, которая объединяет удалённых работников и технологические компании для создания искусственного интеллекта.

Сегодня мы запустились на Product Hunt. Посмотреть нашу страницу и оставить фидбек проекту можно здесь.

5252
45 комментариев

Хорошая работа - научи роботов, потом вообще не сможешь найти никакую работу )

13

"Котёнок - это маленькое животное с пушистым хвостиком". Милота какая. =)))

2

Тоже делал многопользовательскую сеть для распознавания еды на всех картинках, найденных на Tripadvisor, OpenTable, TheFork и Yelp. Довольно быстро делается. Исполнители были довольны - за час удаётся накликать очень много картинок. Картинки проходили через голосование (порог принятия решения - два голоса из трех должны указать, какой вид еды на картинке). За месяц обработали 1 500 000 картинок. Охват - крупные города Европы.

Я не нашёл способ заработать на этом. Была возможность показывать на карте мира, что именно находится в ресторанах и кафе рядом с указанной гео точкой в крупных европейских городах, но профита от этого никаго. Сервер для хранения данных и веб-приложения стоит немного. А вот работа операторов стоит намного дороже.

3

Распознование по типу: "хот дог / не хотдог"))

1

Очевидно надо было продать базу большой корпорации

Раскрывать всегда
Феномен Гребенюка: Как от учителя по истории дойти до самого популярного предпринимателя в России

Я человек разносторонний, отдал 13 лет бальным танцам, где работал со своей будущей женой, поработал учителем по обществознанию и истории 2 года, учителем много не заработаешь, поэтому я..

Феномен Гребенюка: Как от учителя по истории дойти до самого популярного предпринимателя в России
1515
1212
Опять инфоцыгане, все из бизнес молодости…
Массовой подмены трудовых отношений «наймом» самозанятых нет, а компании, которые так делают, — «как на ладони»: ФНС — о самозанятости в России
1515
33
22
«а компании, которые так делают, — как на ладони» _ Ну тоисть на лапу дают, да?
Как построить качественный фундамент для LLM+RAG
Как построить качественный фундамент для LLM+RAG

Разбираемся, зачем генеративному ИИ нужна качественная база знаний и какими характеристиками она должна обладать, чтобы LLM-модель выдавала релевантные ответы, а не «галлюцинации».

Вложил 300 тысяч в онлайн и потерял все деньги. Как это было и почему: разбор на личном опыте.

Всем вам уже надоели эти эксперты, которые трубят из каждой подворотни о том, что бизнес в онлайне - это лучшая ниша. Но лично я на своем опыте убедился в обратном, и давайте разберем, как же это было

Вложил 300 тысяч в онлайн и потерял все деньги. Как это было и почему: разбор на личном опыте.
1717
22
11
Маск заявил о продаже X своему ИИ-стартапу xAI

Объединённая компания получила название XAI Holdings, говорит источник.

Источник: Saul Loeb / AFP / Getty Images / TechCrunch
1515
33
22
22
Рассказываю схемку: - Привлечь деньни под X не удалось - Удалось привлечь деньги под AI-стартап - AI-стартап купил X Profit
День 1130: генконсульство Китая во Владивостоке начнёт оформлять китайские визы на сайте

Собираем новости, события и мнения о рынках, банках и реакциях компаний.

Источник: Wolfram K / Pexels
33
11
11
UGREEN Choice HiTune S3: Ваш билет в мир чистого звука и тишины

Мечтали оказаться на концерте, не выходя из дома? Или просто отключиться от шума города и насладиться любимыми треками? UGREEN Choice HiTune S3 — это больше, чем наушники. Это ваш личный аудиококон с кристально чистым звучанием, мощным шумоподавлением и стильным дизайном.

UGREEN Choice HiTune S3
Маркетинг мёртв: 3 самых бесполезных вещи, на которые вы сливаете бюджет

Мы живём в то время, когда каждый второй маркетолог называет себя "диджитал-стратегом", "трансформационным лидером" или ещё каким-нибудь придурком, не несущим в себе никакого смысла. За этими громкими титулами скрывается одно — тотальная профнепригодность

Маркетинг мёртв: 3 самых бесполезных вещи, на которые вы сливаете бюджет
55
🐑 «Люди виноваты в росте инфляции»! Почему зампред ЦБ винит народ в росте цен, пока банки втихую режут ставки? Анализ инфляции

Найти виноватых? Легко — пусть это будет народ! Есть ощущение, что кто-то явно путает причины и следствия...

🐑 «Люди виноваты в росте инфляции»! Почему зампред ЦБ винит народ в росте цен, пока банки втихую режут ставки? Анализ инфляции
2323
44
22
11
Сэм Альтман: "AGI неизбежен, но что это будет — благо или катастрофа — зависит от нас": самое большое интервью основателя OpenAI
"Когда удачно поужинал с Илоном Маском". Изображение создано ИИ. <br />
66
22
11
Ещё один неверный шаг, и я бы потерял 1,5 млн ₽ на ровном месте? Не знал что реальность такая…

С такими слова обратился ко мне некий Никита.

Никита, не в обиду)) Самое главное, что мы справились. 💪
1414
11
«Если честно — ********»: создатель «Глаза Бога» рассказал, что закрыл Telegram-бота «до момента, пока не станет понятно, можно ли возобновить работу»
4848
1010
33
33
Он так и не понял, что занимается незаконной деятельностью, даже в случае когда это "официальный" запрос.