«Яндекс» опубликовал набор данных беспилотников для исследований в области машинного обучения Статьи редакции

А также данные «Переводчика» и «Погоды».

Это самый большой в мире массив данных такого типа в открытом доступе: он содержит более 1600 часов движения, разбитых на 600 тысяч размеченных фрагментов поездок на дорогах России, Израиля и США в хорошую погоду, снег и дождь, рассказали vc.ru в «Яндексе».

Датасет опубликовали для конкурса Shifts Challenge, который «Яндекс» проведёт в рамках международной конференции NeurIPS 2021 совместно с учёными из Оксфорда и Кембриджа.

Задача конкурса — привлечь внимание к проблеме «сдвига данных» в машинном обучении.

Сдвиг данных возможен везде, где модели машинного обучения сталкиваются с неопределённостью — незнакомыми ситуациями и неизвестными данными. Для конкурса «Яндекс» выбрал три области — предсказание траектории движения транспорта и пешеходов на дороге, прогнозирование погоды и машинный перевод текстов.

Участники конкурса должны будут создать устойчивые к сдвигу модели — например, модель машинного перевода, которая обучалась на художественной литературе, но может качественно переводить и твиты, и ролики на YouTube.

Для конкурса исследователи «Яндекса» вместе с командами «Яндекс.Погоды», «Переводчика» и беспилотных технологий предоставили данные сервисов, решающих практические задачи и часто сталкивающихся со сдвигом. Скачать данные можно на GitHub.

Исследователи должны будут обучить алгоритмы на предоставленных данных, а затем проверить качество их работы в условиях сдвига. Создатели алгоритмов, которые покажут лучшее качество, получат денежные призы.

Сам конкурс проходит с 16 июля по 30 ноября, в каждой области выберут по три победителя — за первое место приз $5000, второе — $3000, третье — $1000

Все данные обезличены. Так, в наборе данных по беспилотникам есть высокоточные карты маршрутов и треки всех окружающих машин и пешеходов (их положение, скорость), но в нём нет видео, где были бы видны номера машин или лица прохожих.

0
15 комментариев
Написать комментарий...
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Man Coolman

Ты видел размер призового фонда?

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Bender Rodriguez

приз обычно символичный, но если ты выиграешь конкурс, то тебе сделают много предложений о работе, так как их в основном и проводят чтобы найти сотрудников и новые подходы

Ответить
Развернуть ветку
Jay Green

Вы в курсе репутации Яндекса как работодателя для разработчиков? Отсутствие оффера от них лучше чем наличие.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
nochnoy.ru

Это не просто хуйня, это его нормальное состояние, судя по его комментам.

Ответить
Развернуть ветку
Hakim Callidus

Считаю, что это ошибочно, они реально крутые вещи делают и условия у них хорошие (знаю не понаслышке)

Ответить
Развернуть ветку
Александр Антипов

Тут вы правы, вас хоть как-то заметят и будут поступать предложение, по-моему, это и есть отличный рост.

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Денис Педан

Это самый большой в мире массив данных такого типа в открытом доступе: он содержит более 1600 часов движения, разбитых на 600 тысяч размеченных фрагментов поездок на дорогах России, Израиля и США в хорошую погоду, снег и дождь. Ну это круто очень!

Ответить
Развернуть ветку
Vasis bouillon

Выметнута крошечная пыль данных и поставлена нереальная для такого объема задача за смехотворное вознаграждение

Ответить
Развернуть ветку
Arthur N
Сам конкурс проходит с 16 июля по 30 ноября, в каждой области выберут по три победителя — за первое место приз $5000, второе — $3000, третье — $1000

Может забыли нули дописать? Смешные призы

Ответить
Развернуть ветку
Anton

Да не, это обычная практика. Вот, например

https://waymo.com/open/challenges/

Ответить
Развернуть ветку
Руслан Кудрявцев

Призы все любят. И без разницы каким он будет!

Ответить
Развернуть ветку
Кристина Сабор

Норм тема. Будем следить за развитием 

Ответить
Развернуть ветку
12 комментариев
Раскрывать всегда