Коротко: до 100 млн рублей за искусственный интеллект, который находит в тексте ошибки

И делает это не хуже педагога с десятью минутами в запасе.

Материал подготовлен при поддержке организаторов конкурса Up Great Про//Чтение

До 29 октября открыта регистрация на первый цикл конкурса Up Great Про//Чтение.

Для кого этот конкурс

Инженеров и разработчиков в сфере машинного обучения. Участвовать нужно в составе команды от двух до десяти человек. Единственное ограничение — быть старше 18 лет (или шестнадцати, при определённых условиях). Можно участвовать из любой страны и даже юридическим лицом.

Что предстоит сделать, на каких условиях

Разработать систему искусственного интеллекта, которая за полминуты распознает в небольшом тексте заданные типы ошибок. В их числе смысловые и логические, погрешности в структуре текста. Можно обучать машину как на русском, так и на английском языке — это две номинации, в каждой из которых призовой фонд составляет 100 млн рублей.

Конкурс проходит циклами каждый год, пока участники не предложат систему, решающую задачу на уровне усреднённого педагога, у которого есть десять минут на проверку текста. Команд-призёров может быть максимум три, а может и ни одной: если к декабрю 2022 года планка так и останется недостижимой, то главный приз не вручается.

Зато будут номинации с гарантированными призами: уже в этом году организаторы наградят команды, которые лучше остальных справились с речевыми и грамматическими ошибками — они разделят 20 млн рублей.

Права на разработки остаются за участниками при любом исходе.

Что ещё нужно знать

Для участия в первом цикле нужно подать заявку до 29 октября, квалификация уже идёт.

Если вы хотите усилиться экспертом или найти себе команду — оставьте комментарий к этой статье. В нём немного расскажите, чем занимаетесь вне конкурса, в чём ваша мотивация участвовать, с кем бы объединили силы. Для связи можно как указать контактные данные, так и пользоваться мессенджером vc.ru.

Тренировочные датасеты, а также полную информацию об этапах и условиях конкурса можно найти по кнопке.

Общий срок проведения конкурса: 15.12.2019 — 30.12.2022. Информация об организаторе, правилах, количестве призов, сроках, месте и порядке их получения по этой ссылке.

0
53 комментария
Написать комментарий...
Alex Chernyshev

'Для практического применения ИИ, выявляющего смысловые ошибки, необходимое
условие – выявление наиболее частых ошибок.'

Я наверное устарел, но ведь правила правописания - вещь конечная не?  Если конечная - зачем тут ИИ и нейросети?   GNU Bison какой-нибудь и вперед. Понятно что живой язык сложнее компьютерного, но суть подхода ведь не изменится - парсер и есть парсер.

Поставили бы задачу 'найти смысл в текстах песен Моргенштерна'  -  еще бы понял, тут без нейросетки никуда.

Ответить
Развернуть ветку
Вася Пражкин

Перепечатка новости на VC, как обычно, потеряла часть смысла. Задание такое:

 Найти максимальное количество речевых и грамматических ошибок (неуместная лексика, неразличение оттенков значений, некорректные метафоры, неуместная двусмысленность, ошибки в построении предложений).

Тут обычным парсером не обойтись, нужно помощнее оружие.

Ответить
Развернуть ветку
Alex Chernyshev

'неуместная лексика, неразличение оттенков значений, некорректные метафоры, неуместная двусмысленность'

Боюсь авторы конкурса опять хотят от машины больше чем от живого человека.

Ответить
Развернуть ветку
Вадим Клюев

от машины всегда хотят работы по шаблону, вот все шаблоны и попытаются загнать

Ответить
Развернуть ветку
Вася Пражкин

Ну почему же больше, это просто отслеживание рынка и текущих решений ИИ по NLP. Имея такие алгоритмы в кармане можно делать уйму интересных вещей и заработать кучу денег.

Ответить
Развернуть ветку
Alex Chernyshev

Не совсем, в области нейросетей недостаточно иметь только алгоритм, даже натренированной модели недостаточно. 
Нужно серьезное железо, нужны данные, много.
А весь результат будет лишь в моменте, т.е такого что раз созданное работает всегда и предсказуемо - нет и быть не может принципиально.

Ответить
Развернуть ветку
50 комментариев
Раскрывать всегда