#Разметкаданных

Способы обеспечения качества данных для машинного обучения
2 показа
6.3K открытий
Разметка данных в машинном обучении: процесс, разновидности и рекомендации
481 показ
5.9K открытий
Как контролировать миллионы исполнителей: инструменты и правила «Яндекс.Толоки»

Проблема качества — одна из ключевых в краудсорсинге. Когда работаешь с удалёнными, незнакомыми тебе исполнителями, невозможно угадать, кто возьмёт очередное задание. Достаточно ли он внимателен? Хорошо ли изучил инструкцию? И вообще, это человек или робот? Мы в Яндексе используем краудсорсинг каждый день. Создавать и развивать наши сервисы…

Иван Карпеев, старший менеджер по развитию бизнеса Яндекс.Толоки
4 показа
5.6K открытий
Как размечать данные для машинного обучения
1 показ
4.8K открытий
1 репост
Хочу в IT: почему этот месседж не работает в сфере разметки данных
6.6K показов
3.1K открытий
Аннотирование текста для машинного обучения
4 показа
1.9K открытий
Как организовать разметку данных для машинного обучения: методики и инструменты
3 показа
1.6K открытий
Лучшие инструменты разметки изображений для компьютерного зрения 2020 года
3 показа
1.3K открытий
Подготовка датасета для машинного обучения: 10 базовых способов совершенствования данных
12 показов
1.3K открытий
Создаем датасет для распознавания счетчиков на Яндекс.Толоке
4 показа
971 открытие
Лучшие инструменты аннотирования для компьютерного зрения в 2021 году
4 показа
878 открытий
Топ-5 инструментов для разметки данных в 2021 году

Программы для разметки данных (data labeling) необходимы для прокачки машинного обучения и создания обучающих наборов данных. Поэтому мы решили изучить наилучшие решения из этой области, имеющиеся сегодня на рынке.

3 показа
866 открытий
Разметка данных для машинного обучения: обзор рынка, методики и компании

Большая доля data science и машинного обучения зависит от чистых и корректных источников данных, поэтому неудивительно, что скорость роста рынка разметки данных продолжает увеличиваться. В этой статье мы расскажем о многих крупных игроках отрасли, а также об используемых ими методиках, чтобы вы могли иметь возможность выбора наилучшего партнёра в…

7 показов
846 открытий
20+ популярных опенсорсных датасетов для Computer Vision
630 показов
732 открытия
Как Scale AI создаёт качественные данные для машинного обучения
1 показ
730 открытий
Архитектура платформы машинного обучения в продакшене
18 показов
694 открытия
10 лучших опенсорсных инструментов аннотирования для компьютерного зрения
282 показа
681 открытие
Руководство по Human Pose Estimation
19 показов
557 открытий
Почему за автоматической разметкой данных будущее?
2 показа
451 открытие
7 способов получить качественные размеченные данные для машинного обучения

Наличие размеченных данных необходимо для машинного обучения, но получение таких данных — непростая и дорогостоящая задача. Мы рассмотрим семь способов их сбора, в том числе перепрофилирование, поиск бесплатных источников, многократное обучение на данных с постепенно повышающимся качеством, а также другие способы.

3 показа
441 открытие
Методика машинного обучения Human-in-the-Loop
2 показа
434 открытия
6 правил по обеспечению качества данных для машинного обучения

«Качество — это не действие, а привычка», — сказал великий древнегреческий философ Аристотель. Эта идея справедлива сегодня так же, как и более двух тысяч лет назад. Однако качества добиться не так легко, особенно когда дело касается данных и технологий наподобие искусственного интеллекта (ИИ) и машинного обучения.

4 показа
287 открытий
Оптимизация разметки данных с помощью активного обучения
3 показа
269 открытий
Почему при разработке ИИ главное — это данные

Системы машинного обучения рождаются от союза кода и данных. Код сообщает, как машина должна учиться, а данные обучения включают в себя то, чему нужно учиться. Научные круги в основном занимаются способами улучшения алгоритмов обучения. Однако когда дело доходит до создания практических систем ИИ, набор данных, на котором выполняется обучение, по…

4 показа
214 открытий
Ускорение семантической сегментации при помощи машинного обучения
377 показов
205 открытий
Лучшие платформы аннотирования изображений для компьютерного зрения на 2019 год
5 показов
191 открытие
Датацентрический и моделецентрический подходы в машинном обучении
497 показов
188 открытий
Четыре урока о создании инструментов для машинного обучения
8 показов
165 открытий
Руководство по типам аннотирования изображений
5 показов
150 открытий
Зачем вам нужно использовать активное обучение при обучении нейронных сетей
9 показов
150 открытий
Пять альтернатив Scale AI

Выбор подходящего инструмента для аннотирования данных — непростая задача, поэтому чтобы принять верное решение, необходимо знать все возможные варианты. В этой статье мы расскажем о лучших, по нашему мнению, альтернативах Scale AI.

3 показа
142 открытия
Семантическая сегментация 4D сцен с лидаров и прогресс в разработке беспилотных автомобилей
4 показа
133 открытия
Десять лучших опенсорсных инструментов аннотирования 2021 года для Computer Vision
432 показа
126 открытий
5 этапов, гарантирующих успешную разметку данных
3 показа
123 открытия
Опенсорсные массивы данных для Computer Vision
12 показов
117 открытий
Как за неделю разметить миллион примеров данных
11 показов
116 открытий
5 трендов в аннотировании данных в 2021 году
1 показ
115 открытий
Как мы масштабируем машинное обучение
308 показов
107 открытий
Ручное аннотирование по-прежнему незаменимо для разработки моделей глубокого обучения
587 показов
105 открытий
Как Hasty использует автоматизацию и быструю обратную связь для обучения моделей ИИ
CEO Hasty Тристан Руиллар (в центре), сооснователи компании Константин Проскудин (слева) и Александр Веннман (справа)
6 показов
103 открытия
Если вы устраняете систематическую ошибку модели, то уже слишком поздно
1K показов
94 открытия
Почему я изменил своё мнение о слабой разметке для ML
5 показов
81 открытие