Трибуна
Dbrain
14 004

Handl — сервис разметки данных для машинного обучения от Dbrain

На платформе уже зарегистрировалось 25 тысяч человек, которые помогают размечать данные для технологических компаний и получают за это деньги. Сегодня Handl официально запускается после успешного альфа-тестирования, и теперь к проекту может присоединиться любой желающий.

В закладки
Аудио

Что такое разметка

Представьте маленького ребёнка, который ничего не умеет. Родители не будут объяснять, что котёнок — это маленькое животное с пушистым хвостиком. Такое описание подходит и щенку. Вместо этого они покажут много котят и щенят, поправляя ребенка до тех пор, пока он не научится отличать животных самостоятельно.

С искусственным интеллектом тот же принцип, который применим почти везде: ИИ распознает качество пиццы, преступников на улице и серьезные заболевания на ранних стадиях, но сначала ему надо показать тысячи примеров, где эту задачу уже решил человек, — другими словами, подготовил данные для машинного обучения. Это и называется разметкой.

Разметка данных — самая трудозатратная задача при создании ИИ: надо без ошибок разметить тысячи единиц информации. Мы в Handl придумали, как упростить весь процесс. Наши разметчики подключаются из любой точки мира и размечают данные — к примеру, определяют, что изображено на картинке, то есть ставят «метки». Так они готовят обучающую выборку для ИИ. Переняв знания людей, алгоритм успешно решает аналогичные задачи.

Сегментация текста на Handl

Как устроен процесс работы в Handl

Со стороны клиента. Клиент загружает данные, выбирает шаблон задачи (классификация, сегментация, ввод текста) и запускает её в работу. Разметчики выполняют задания. Если разметка требует специальных знаний вроде китайского языка или медицинского образования, можно привлечь своих исполнителей и использовать наш интерфейс.

Со стороны разметчиков. Разметчики регистрируются, проходят онбординг и получают доступ к задачам, зарабатывая до 3 долларов в час.

Механизм работы. Алгоритм консенсуса распределяет выплаты и следит за отсутствием ошибок: от качества разметки зависит точность распознавания будущей ИИ-модели. Система выплат работает так: как только люди размечают картинку, мы считаем объективное время, необходимое для этой задачи, а алгоритм консенсуса вычисляет коэффициент качества. Чем меньше времени затрачено на задачу и чем точнее она выполнена, тем больше начисление. Поэтому разметчики стараются выполнять задачи максимально качественно.

Мы уже разметили более 6 миллионов картинок, текстов и звуков для таких компаний как Nvidia, Nestle, Cherry Home. В отличие от других аналогичных сервисов, Handl сфокусирован только на задачах по подготовке данных для машинного обучения. Благодаря этому мы выполняем разметку с высокой точностью, скоростью и с меньшими затратами.

Кейс: молочная ферма

Коровам на ферме нужно правильно питаться, чтобы давать вкусное молоко. Но когда их сотни, проследить за состоянием каждой коровы сложно. Чтобы автоматизировать контроль за их здоровьем, мы разметили 143 тысячи изображений для обучения нейронной сети. Сначала люди размечали картинки, отвечая на вопрос «что тут изображено?», тем самым отсеивая коров от других животных.

Потом обводили коров по контуру, чтобы ИИ точно определил их местоположение. И наконец, работали с видео, указывая, что делает корова: ест, пьёт, лежит или ходит.

В итоге получилась нейронная сеть, которая мониторит здоровье коров и прогнозирует, как они будут себя чувствовать в будущем. Руководствуясь информацией с камер наблюдения, ИИ отслеживает поведение каждого животного по отдельности и выявляет аномалии — например, корова плохо ест или слишком долго лежит на земле. В этом случае система подаёт сигнал фермерам.

Выводы

Основная проблема в разработке ИИ — подготовить данные. Мы упростили этот процесс и запустили платформу, которая объединяет удалённых работников и технологические компании для создания искусственного интеллекта.

Сегодня мы запустились на Product Hunt. Посмотреть нашу страницу и оставить фидбек проекту можно здесь.

Материал опубликован пользователем.
Нажмите кнопку «Написать», чтобы поделиться мнением или рассказать о своём проекте.

Написать
{ "author_name": "Dbrain", "author_type": "self", "tags": ["\u043c\u0430\u0448\u0438\u043d\u043d\u043e\u0435\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435"], "comments": 47, "likes": 65, "favorites": 120, "is_advertisement": false, "subsite_label": "tribuna", "id": 63360, "is_wide": false, "is_ugc": true, "date": "Wed, 03 Apr 2019 14:18:25 +0300", "is_special": false }
Объявление на vc.ru
Трибуна
Как совершить революцию в традиционном на первый взгляд рынке. История PerseiLine, производителя товаров для животных
Российский зоорынок начал формироваться в конце девяностых, когда телевизор впервые показал, что кормить питомцев…
0
{ "id": 63360, "author_id": 233759, "diff_limit": 1000, "urls": {"diff":"\/comments\/63360\/get","add":"\/comments\/63360\/add","edit":"\/comments\/edit","remove":"\/admin\/comments\/remove","pin":"\/admin\/comments\/pin","get4edit":"\/comments\/get4edit","complain":"\/comments\/complain","load_more":"\/comments\/loading\/63360"}, "attach_limit": 2, "max_comment_text_length": 5000, "subsite_id": 199116, "last_count_and_date": null }
47 комментариев
Популярные
По порядку
Написать комментарий...
13

Хорошая работа - научи роботов, потом вообще не сможешь найти никакую работу )

Ответить
2

"Котёнок - это маленькое животное с пушистым хвостиком". Милота какая. =)))

Ответить
1

:) мой кот такого же цвета

Ответить
3

Тоже делал многопользовательскую сеть для распознавания еды на всех картинках, найденных на Tripadvisor, OpenTable, TheFork и Yelp. Довольно быстро делается. Исполнители были довольны - за час удаётся накликать очень много картинок. Картинки проходили через голосование (порог принятия решения - два голоса из трех должны указать, какой вид еды на картинке). За месяц обработали 1 500 000 картинок. Охват - крупные города Европы.

Я не нашёл способ заработать на этом. Была возможность показывать на карте мира, что именно находится в ресторанах и кафе рядом с указанной гео точкой в крупных европейских городах, но профита от этого никаго. Сервер для хранения данных и веб-приложения стоит немного. А вот работа операторов стоит намного дороже.

Ответить
1

Распознование по типу: "хот дог / не хотдог"))

Ответить
0

Силиконовую долину не смотрел. Про "хотдог/не хотдог" мне буквально на днях рассказали.

Была такая хотелка - дать возможность людям найти не кафе и рестораны на карте, а конкретную еду. Кроме "хотдог" ещё можно было выбрать 20+ параметров что он хочет или не хочет ("здоровая еда да ; фасоль или соя нет" или "бургер да; курица или рыба да" или "суп или паста да; морепродукты нет").

Сами владельцы ресторанов такое заполнять не хотели. Вот и придумался сервис по определению вида и состава. Очень приблизительный, конечно.

Ответить
0

Очевидно надо было продать базу большой корпорации

Ответить
0

да это как обычно. Сделать то сервис нынче не проблема. Вот продать его, вот это уже слегка посложнее

Ответить
3

Нужно написать нейросеть, которая будет размечать данные для другой нейросети 🤓

Ответить
2

Сколько шекелей можно поднять

Ответить
3

По сегодняшнему курсу около 11 шекелей в час

Ответить
0

чет мало же?

Ответить
1

Лучше всего в йенах писать, их больше. Венесуэльские боливары тоже ничо, но уж больно быстро устаревают

Ответить
0

Всем боливарским миллионерам посвящается

Ответить
0

фигня какая то, этого ж на рюмку кофе разве хватит

Ответить
0

видимо на уровне отгадывания капчи

Ответить
0

Зашел, 10 минут поотгадывал — 5 центов.

Ответить
1

А че у вас за буча в телеге в английском чате? народ пишет что вы не платите.

Ответить
1

Это не разметчики, а участники баунти-программы, с которой мы пока разбираемся. Что касается разметки — мы платим за каждую выполненную задачу, за тестовые –– в том числе. У нас есть русский чат (https://t.me/Dbrainchatru) в Телеграме с активными разметчиками. Присоединяйтесь!

Ответить
2

Ок, убедили, вы уж там разберитесь с ними))). Ждемс дельных заданий, а то кошечки и уточки закончились быстро).

Ответить
1

Надеюсь UX создания задания лучше чем у Толока

Ответить
0

не работает ссылка https://my.handl.ai

Ответить
0

Попробуйте зайти через VPN

Ответить
1

Круть, круть!

Ответить
1

anticaptcha проморгали рынок?

Ответить
1

подобное давно сделал Amazon - Mechanical Turk, вроде?

Ответить
0

Клиентский софт у исполнителей на MTurk не предназначен для работы с разметкой графики. Теги поставить могут (корова, овца, автомобиль).

Ответить
0

В отличие от MTurk Amazon и других аналогичных сервисов, Handl сфокусирован только на задачах по подготовке данных для ИИ. Благодаря этому мы выполняем разметку с высокой точностью, скоростью и с меньшими затратами.

Ответить
–1

развод какой то
на 5 центов котиков щелкаешь, потом в подписоте сиди, типа "заданий нет".
разве не изза "огромного обьема работ" вы и запустили сервис ? ....

Ответить
2

Мы молодой проект –– у нас пока непостоянный поток задач. Последняя разметка была на прошлой неделе, следующая совсем скоро!

Ответить
1

А сервис позволяет размечать такие данные как тексты или звуки?

Ответить
1

Да, у нас уже есть опыт разметки текстов (звуки тоже скоро прикрутим). Какие еще инструменты для разметки доступны — смотрите здесь: https://try.handl.ai

Ответить
–18

Интересно, а какие мощности использовали? Случайно не видеокарты (GPU) от REG.RU?

Ответить
0

Да, Николай Васильев, aka 3 часа аккаунту и один единственный коммент.
Именно так.

Ответить
0

Так можно или нет у вас работать с планшета? Ранее траблы были при работе с ним. Уже исправили?

Ответить
0

Пока не исправили, но обязательно сделаем. Как будет готово — сообщим!

Ответить
0

обычный вопрос любого VC "What problem does it solve?"

Ответить
0

Подготовка данных — самый трудозатратный этап в разработке ИИ. Нужно разметить тысячи картинок, текстов или звуков, на которых будет обучаться ИИ-модель. Мы упростили весь процесс и создали платформу, где технологические компании могут быстро и качественно разметить данные.

Ответить
0

Вы не поняли вопроса.

Какую проблему бизнеса это решает;
Что они используют сейчас как альтернативу;
Чем ваше решение лучше.

ИИ модель сама по себе никому не интересна

Ответить
0

С проблемой разметки данных сталкиваются data science отделы крупных компаний. У них есть два пути: сделать внутренний инструмент, под который надо искать сотни разметчиков, или использовать существующие на рынке решения — такие как Scale. В отличие от других платформ мы даем лучшее качество за более доступную цену: во-первых, у нас сильный обучающий онбординг и коммьюнити с поддержкой 24/7. Во-вторых, мы используем алгоритм консенсуса, который не пропускает ошибки.

Ответить
0

Можно ли видео размечать?
Что делают люди агрессия, человеку плохо?

Ответить
0

можно)

Ответить
0

Есть готовые решения?

Ответить
{ "page_type": "article" }

Прямой эфир

[ { "id": 1, "label": "100%×150_Branding_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox_method": "createAdaptive", "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfl" } } }, { "id": 2, "label": "1200х400", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfn" } } }, { "id": 3, "label": "240х200 _ТГБ_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fizc" } } }, { "id": 4, "label": "Article Branding", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "p1": "cfovx", "p2": "glug" } } }, { "id": 5, "label": "300x500_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfk" } } }, { "id": 6, "label": "1180х250_Interpool_баннер над комментариями_Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "bugf", "p2": "ffyh" } } }, { "id": 7, "label": "Article Footer 100%_desktop_mobile", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjxb" } } }, { "id": 8, "label": "Fullscreen Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjoh" } } }, { "id": 9, "label": "Fullscreen Mobile", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjog" } } }, { "id": 10, "disable": true, "label": "Native Partner Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyb" } } }, { "id": 11, "disable": true, "label": "Native Partner Mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyc" } } }, { "id": 12, "label": "Кнопка в шапке", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "p1": "bscsh", "p2": "fdhx" } } }, { "id": 13, "label": "DM InPage Video PartnerCode", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox_method": "createAdaptive", "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "bugf", "p2": "flvn" } } }, { "id": 14, "label": "Yandex context video banner", "provider": "yandex", "yandex": { "block_id": "VI-223676-0", "render_to": "inpage_VI-223676-0-1104503429", "adfox_url": "//ads.adfox.ru/228129/getCode?pp=h&ps=bugf&p2=fpjw&puid1=&puid2=&puid3=&puid4=&puid8=&puid9=&puid10=&puid21=&puid22=&puid31=&puid32=&puid33=&fmt=1&dl={REFERER}&pr=" } }, { "id": 15, "label": "Баннер в ленте на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byudx", "p2": "ftjf" } } }, { "id": 16, "label": "Кнопка в шапке мобайл", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byzqf", "p2": "ftwx" } } }, { "id": 17, "label": "Stratum Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fzvb" } } }, { "id": 18, "label": "Stratum Mobile", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fzvc" } } }, { "id": 19, "disable": true, "label": "Тизер на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "p1": "cbltd", "p2": "gazs" } } }, { "id": 20, "label": "Кнопка в сайдбаре", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "p1": "cgxmr", "p2": "gnwc" } } } ] { "page_type": "default" }