#Разметкаданных

Ускорение семантической сегментации при помощи машинного обучения
Датацентрический и моделецентрический подходы в машинном обучении
Разметка данных в машинном обучении: процесс, разновидности и рекомендации
Большой объём данных для машинного обучения — не панацея
10 лучших опенсорсных инструментов аннотирования для компьютерного зрения
ML и консенсус между людьми: берём от обоих подходов лучшее
Подготовка датасета для машинного обучения: 10 базовых способов совершенствования данных
Архитектура платформы машинного обучения в продакшене
Руководство по Human Pose Estimation
Опенсорсные массивы данных для Computer Vision
Как за неделю разметить миллион примеров данных
Как избавиться от проблем при разметке данных для обучения ML моделей?
Как создать эффективный план разметки данных?
Зачем вам нужно использовать активное обучение при обучении нейронных сетей
Четыре урока о создании инструментов для машинного обучения
Разметка данных для машинного обучения: обзор рынка, методики и компании

Большая доля data science и машинного обучения зависит от чистых и корректных источников данных, поэтому неудивительно, что скорость роста рынка разметки данных продолжает увеличиваться. В этой статье мы расскажем о многих крупных игроках отрасли, а также об используемых ими методиках, чтобы вы могли иметь возможность выбора наилучшего партнёра в…

Почему я изменил своё мнение о слабой разметке для ML
Как Hasty использует автоматизацию и быструю обратную связь для обучения моделей ИИ
CEO Hasty Тристан Руиллар (в центре), сооснователи компании Константин Проскудин (слева) и Александр Веннман (справа)
Руководство по типам аннотирования изображений
Лучшие платформы аннотирования изображений для компьютерного зрения на 2019 год
Почему при разработке ИИ главное — это данные

Системы машинного обучения рождаются от союза кода и данных. Код сообщает, как машина должна учиться, а данные обучения включают в себя то, чему нужно учиться. Научные круги в основном занимаются способами улучшения алгоритмов обучения. Однако когда дело доходит до создания практических систем ИИ, набор данных, на котором выполняется обучение, по…

Аннотирование текста для машинного обучения
Семантическая сегментация 4D сцен с лидаров и прогресс в разработке беспилотных автомобилей
Пять альтернатив Scale AI

Выбор подходящего инструмента для аннотирования данных — непростая задача, поэтому чтобы принять верное решение, необходимо знать все возможные варианты. В этой статье мы расскажем о лучших, по нашему мнению, альтернативах Scale AI.

Оптимизация разметки данных с помощью активного обучения
Лучшие инструменты разметки изображений для компьютерного зрения 2020 года
Лучшие инструменты аннотирования для компьютерного зрения в 2021 году
6 правил по обеспечению качества данных для машинного обучения

«Качество — это не действие, а привычка», — сказал великий древнегреческий философ Аристотель. Эта идея справедлива сегодня так же, как и более двух тысяч лет назад. Однако качества добиться не так легко, особенно когда дело касается данных и технологий наподобие искусственного интеллекта (ИИ) и машинного обучения.

5 этапов, гарантирующих успешную разметку данных
Как организовать разметку данных для машинного обучения: методики и инструменты
Создаем датасет для распознавания счетчиков на Яндекс.Толоке
Как Scale AI создаёт качественные данные для машинного обучения
7 способов получить качественные размеченные данные для машинного обучения

Наличие размеченных данных необходимо для машинного обучения, но получение таких данных — непростая и дорогостоящая задача. Мы рассмотрим семь способов их сбора, в том числе перепрофилирование, поиск бесплатных источников, многократное обучение на данных с постепенно повышающимся качеством, а также другие способы.

Топ-5 инструментов для разметки данных в 2021 году

Программы для разметки данных (data labeling) необходимы для прокачки машинного обучения и создания обучающих наборов данных. Поэтому мы решили изучить наилучшие решения из этой области, имеющиеся сегодня на рынке.

Как размечать данные для машинного обучения
Способы обеспечения качества данных для машинного обучения
5 трендов в аннотировании данных в 2021 году
Методика машинного обучения Human-in-the-Loop
Почему за автоматической разметкой данных будущее?
Как контролировать миллионы исполнителей: инструменты и правила «Яндекс.Толоки»

Проблема качества — одна из ключевых в краудсорсинге. Когда работаешь с удалёнными, незнакомыми тебе исполнителями, невозможно угадать, кто возьмёт очередное задание. Достаточно ли он внимателен? Хорошо ли изучил инструкцию? И вообще, это человек или робот? Мы в Яндексе используем краудсорсинг каждый день. Создавать и развивать наши сервисы…

Иван Карпеев, старший менеджер по развитию бизнеса Яндекс.Толоки
null