Инструментыдляразметки: статьи и новости по теме

Руководство по аутсорсингу разметки данных для машинного обучения

Аннотирование и разметка сырых данных (изображений и видео) для моделей машинного обучения (ML) — это самая длительная и трудоёмкая, хотя и необходимая часть любого проекта компьютерного зрения.

Техника для жизни: что купить?

Техника

20.08.2024

Какой лазерный уровень выбрать: обзор 5 лучших

Лазерные нивелиры – устройства, обеспечивающие высокий уровень точности при выполнении как небольших ремонтных работ, так и более сложных строительных проектов. Такие инструменты оборудованы ярким лазерным лучом для проекции вертикальных и горизонтальных линий и значительно ускоряют и упрощают процесс работы, а также повышают качество окончательног…

Роман Куцев

13.08.2024

Шесть шагов для создания более качественных моделей Computer Vision

Компьютерное зрение (computer vision, CV) — подраздел искусственного интеллекта, использующий алгоритмы машинного обучения и глубокого обучения для распознавания и интерпретации объектов на изображениях и видео. CV сосредоточено на воссоздании аспектов сложности зрительной системы человека, позволяя компьютерам определять и анализировать предметы н…

Роман Куцев

02.04.2023

Самое важное с конференции NeurIPS 2021

6–14 декабря 2021 года была виртуально проведена конференция Neural Information Processing Systems (NeurIPS). Это одна из самых влиятельных конференций, собирающих лучших инженеров по ML, дата-саентистов и исследователей искусственного интеллекта со всего света. Это место для обмена информацией об исследованиях нейронных систем обработки информации…

Роман Куцев

13.03.2023

Хотите усовершенствовать цикл обработки данных? Попробуйте задействовать людей

На саммите iMerit ML Data Ops глава отдела искусственного интеллекта Cruise Хуссейн Мехенна провёл с Рагаваном Сринивасаном из Facebook AI беседу, озаглавленную Emerging AI Companies are Driving a Paradigm Shift.

Роман Куцев

20.02.2023

Если вы устраняете систематическую ошибку модели, то уже слишком поздно

Роман Куцев

17.02.2023

Как мы масштабируем машинное обучение

Роман Куцев

03.02.2023

Датацентрический и моделецентрический подходы в машинном обучении

Код и данные — фундамент ИИ-системы. Оба эти компонента играют важную роль в разработке надёжной модели, но на каком из них следует сосредоточиться больше? В этой статье мы сравним методики, ставящие в центр данные, либо модель, и посмотрим, какая из них лучше; также мы поговорим о том, как внедрять датацентрическую инфраструктуру.

Роман Куцев

30.01.2023

Большой объём данных для машинного обучения — не панацея

Модели глубокого обучения обладают потрясающим свойством — они становятся лучше с увеличением объёма данных, и кажется, что этот процесс практически неограничен. Чтобы получить качественно работающую модель, недостаточно больших объёмов данных, нужны ещё и точные аннотации. Хотя большие объёмы данных помогают модели решать проблему несогласованност…

Роман Куцев

04.01.2023

ML и консенсус между людьми: берём от обоих подходов лучшее

Роман Куцев

12.12.2022

Подготовка датасета для машинного обучения: 10 базовых способов совершенствования данных

У Колумбийского университета есть хорошая история о плохих данных. Проект в сфере здравоохранения был нацелен на снижение затрат на лечение пациентов с пневмонией. В нём использовалось машинное обучение (machine learning, ML) для автоматической сортировки записей пациентов, чтобы выбрать тех, у кого опасность смертельного исхода минимальна (они мог…

Роман Куцев

23.11.2022

Как за неделю разметить миллион примеров данных

В 2019 году компания OpenAI опубликовала статью о точной настройке GPT-2, в которой она использовала Scale AI для сбора мнений живых разметчиков с целью совершенствования своих языковых моделей. Хотя в то время мы уже размечали миллионы задач обработки текста и computer vision, уникальные требованиях к срокам и субъективная природа задач OpenAI соз…

Инструментыдляразметки

Руководство по аутсорсингу разметки данных для машинного обучения

Какой лазерный уровень выбрать: обзор 5 лучших

Шесть шагов для создания более качественных моделей Computer Vision

Самое важное с конференции NeurIPS 2021

Хотите усовершенствовать цикл обработки данных? Попробуйте задействовать людей

Если вы устраняете систематическую ошибку модели, то уже слишком поздно

Введение

Как мы масштабируем машинное обучение

Введение

Датацентрический и моделецентрический подходы в машинном обучении

Большой объём данных для машинного обучения — не панацея

ML и консенсус между людьми: берём от обоих подходов лучшее

Введение в категоризацию классификаций

Подготовка датасета для машинного обучения: 10 базовых способов совершенствования данных

Как за неделю разметить миллион примеров данных