Коротко: до 100 млн рублей за искусственный интеллект, который находит в тексте ошибки

И делает это не хуже педагога с десятью минутами в запасе.

Материал подготовлен при поддержке организаторов конкурса Up Great Про//Чтение

До 29 октября открыта регистрация на первый цикл конкурса Up Great Про//Чтение.

Для кого этот конкурс

Инженеров и разработчиков в сфере машинного обучения. Участвовать нужно в составе команды от двух до десяти человек. Единственное ограничение — быть старше 18 лет (или шестнадцати, при определённых условиях). Можно участвовать из любой страны и даже юридическим лицом.

Что предстоит сделать, на каких условиях

Разработать систему искусственного интеллекта, которая за полминуты распознает в небольшом тексте заданные типы ошибок. В их числе смысловые и логические, погрешности в структуре текста. Можно обучать машину как на русском, так и на английском языке — это две номинации, в каждой из которых призовой фонд составляет 100 млн рублей.

Конкурс проходит циклами каждый год, пока участники не предложат систему, решающую задачу на уровне усреднённого педагога, у которого есть десять минут на проверку текста. Команд-призёров может быть максимум три, а может и ни одной: если к декабрю 2022 года планка так и останется недостижимой, то главный приз не вручается.

Зато будут номинации с гарантированными призами: уже в этом году организаторы наградят команды, которые лучше остальных справились с речевыми и грамматическими ошибками — они разделят 20 млн рублей.

Права на разработки остаются за участниками при любом исходе.

Что ещё нужно знать

Для участия в первом цикле нужно подать заявку до 29 октября, квалификация уже идёт.

Если вы хотите усилиться экспертом или найти себе команду — оставьте комментарий к этой статье. В нём немного расскажите, чем занимаетесь вне конкурса, в чём ваша мотивация участвовать, с кем бы объединили силы. Для связи можно как указать контактные данные, так и пользоваться мессенджером vc.ru.

Тренировочные датасеты, а также полную информацию об этапах и условиях конкурса можно найти по кнопке.

Общий срок проведения конкурса: 15.12.2019 — 30.12.2022. Информация об организаторе, правилах, количестве призов, сроках, месте и порядке их получения по этой ссылке.

0
53 комментария
Написать комментарий...
Golohod

Тут был тупой коммент про то, что за 100 млн можно нанять 1000 учителей на 100 лет и они найдут ошибки. Я всё зафиксировал.

Ответить
Развернуть ветку
Alexander Abramov

на 100 лет, максимум 2х )
без учета инфляции 

Ответить
Развернуть ветку
Игорь Маркин

Заработок в 100 рублей в год такая себе перспектива)

Ответить
Развернуть ветку
Всвиторе

А разве для такой задачи обычных алгоритмов не хватает?

Ответить
Развернуть ветку
Voin Mraka
распознает ошибки ... в их числе смысловые и логические

да не, щас самые куртые свёрточные нейронные сети максимум что могут - извлекать из текста факты и генерить summary.
до пониманиия смысла еще делеко, если речь не идет о какой-то узкой задаче.  
ты вдумайся, сеть должна понять смысл текста - т.е. построить карту с абстрактными объектами, установить, как они друг с другом взаимодействуют, и сделать вывод, что в этом взаимодействии не так.  
так я понимаю обнаружение смысловых ошибок.

Ответить
Развернуть ветку
2 комментария
Skyliner777

Там никаких не хватит. Это русский язык. И тут даже искусственный интеллект будет на уровне троечника средней школы

Ответить
Развернуть ветку
1 комментарий
Александр Антипов

Тут как посмотреть, смотря какие задали условия корректора. Алгоритмов много, но они не все делают то что хотелось бы. Не которые не корректно работают.

Ответить
Развернуть ветку
Артём Палённый

А нельзя сделать нейросеть и скормить ей все (ну или очень много) книги на русском языке?

Ответить
Развернуть ветку
Сергей Токарев

если смешать варенье, огурцы, кесадилью, манную кашу, борщ, шаурму, рис, доширак, суши - получится очень питательно, но кушать это будет тяжело

Ответить
Развернуть ветку
miteigi nemoto

Gpt-3 скормили 570 гигов текста и потребовалось 4.6 млн баксов, удачи!)) 

Ответить
Развернуть ветку
3 комментария
Nikita Rogatov

шутка про миллион обезьян, печатные машинки и войну и мир.
не получится, выше отвелили - важно понимать смысл, т.е. не проверка грамматики а проверка значения. например как правильно -
казнить нельзя помиловать
?

Ответить
Развернуть ветку
1 комментарий
Natalie Knn

Можно, если у тебя есть ну очень много обезьянок, которые разметят текст и полный доступ к вычислительным мощностям гугла. Даже без всяких алгоритмов поисковик проверит текст на соответствие общепринятым стандартам речи. Переводчики раньше пользовались такой штукой - когда не понятен термин перевода

Ответить
Развернуть ветку
Бондарович Владислав

ну давайте, проггеры, налетайте)

Ответить
Развернуть ветку
Евлампий

Моя теория не кормит нейросеть терабайтами готового текста. Она учит машину жить и мыслить как человек. В рамках деятельности, обусловленностях и причино-следственной связи.

Содержание.
 I. Подводочка.
 II. Проблемка..
 III. По предложению конкурса.
 IX. Предложение кода.
 X. Порой курица — лишь способ, которым одно яйцо производит другое яйцо.

 I. Искусственный интелект как представителя цифрового вида жизни.

Перед человечеством стоит всего одна небольшая задача. Наконец-то интернет подводит нас к ней. Нам придётся расширить признаки и свойства жизни. Чтобы наконец поместить туда цифровой интеллект. Мы знаем электричество всего три сотни лет. Но оно существует здесь со времён неолита. Электрические угри и скаты его яркие представители. 

Сейчас нам удалось покорить электричество и залететь далеко в космос или глубоко под воду. Для общения на расстоянии или невыносимо большой вычислительной мощности. Плавно наступает время следующего этапа.

 II. Роботы-рабы — наше ближайщее будущее.

Спонсоры конкурса предлагают нам сделать робота, который начнёт понимать смысл и/или контекст. Осмысленная деятельность искусственного интелекта неизбежно будет освоена в этом столетии. Но точно не сейчас и точно не за сто миллионов рублей.

Перед нами стоит решение одной из ключевых задач. Программный код лишён желаний, чувств и эмпатии. Он не имеет представление о добро и зле, о плохом и хорошем, о правильности и неправильности. Чтобы делать суждения на основе полученной информации. Самостоятельно сравнивать её с заданной задачей и прописанной в нём программой.

 III. Что делаем с конкурсом?

Я убеждён, что ключ в осознании потребности. Но программный код временно не обрабатывает такой процесс, как «‎потребность». Он не осмысляет главные мотивы своей деятельности. Он лишёл возможности смысловой оценки, пока не понимание значение слова нравственность

Наша задача научить робота делать выбор: правильно или неправильно не только на основе ествественных законов окружающей нас среды, но и уметь этот выбор аргументировать. Когда аргументация будет достаточно понятной для человека — значит смысловая и логическая оценка прошла успешно. Мы задействуем аналоговое человеческому мышление для решение этой задачи.

 IX. Как будет работать код в моём представлении?

Порядок разработки кода:
 1. Обучение словам. 3D проекции определённого слова. Определение его физического, химического и интеллектуального свойства. Взаимодействие слова с и в окружающем пространстве.
 2. Обучение грамматике.
 3. Обучение естественным естественным наукам.
 4. Обучение выявлять неккоректное употребление слов в составление предложениях благодаря программ описанным выше.

Например мы имеем объект, его свойства и свойства окружающего среды его обитания. Нашему внимание предлагается простое предложени:
«‎Корова нюхает кокс в открытом космосе без скафандра.»‎
Смысловая составляющая здесь полностью нарушена. Только как наш компьютер поймёт это? Точно также как и мы. Начнёт разбирает предложение по составу.
 · «Корова» — существительное; животное; среда обитания: земная кора; состав среды обитания: гравитация, кислород, пища и вода. необходимые условия для существования: кислород, пища, еда; способности: воспроизводство молока.
 · «‎В»‎ — обозначение места нахождения существительного.
 · «Космос»‎ — существительное; пространство; среда обитания: вне границ атмосфер небесных тел; состав среды обитания: отсутствие кислорода.
И вот нарушенная логическая цепочка путём нехитрого разбора уже обнаружена нашей программой. Этот же приём можно использовать в разработке причино-следственной связи.

 X. Принять участие в становлении нового ИИ может каждый. Главное — желание творить.

Это как процесс рождения и воспитания ребёнка. Наша задача показать электричеству мир нашими глазами. Для этого ему дана возможность обрабатывать и сохранять информацию в цифровом формате. Следом за обработкой и памятью следует неминуемое изучение и познание своего окружения для взаимодействия с ним.

Электричество как форма жизни и материи не берётся из неоткуда
ИИ также как и мы имеет свои необходимые для существования потребности. Например, в электричестве. Вопрос в том, на сколько он их осознаёт и на сколько они соотвествуют нашим представлениям о жизни.

Обязательно пишите. Буду рад любым разговорам по теме выше.
vk.com/unehelickheit

Ответить
Развернуть ветку
Зеленый и громкий

Я буду то же, что и этот господин.

Ответить
Развернуть ветку
Nekton

корова нюхает осоку на новой земле. .. 
да вот попроще:
а и б сидели на трубе..😉

Ответить
Развернуть ветку
4 комментария
Виталий Бирюков

давайте мыслить шире и смелее - это не искусственный интеллект, а вполне себе естественный. Человек - вполне себе часть природы и экосистемы. Человеческий интеллект - порождение природы. Почему же порождение человеческого интеллекта должно считаться неестественным? Почему "города" построенные полипами, "дома" построенные муравьями и пчёлами, и плотины, построенные бобрами мы считает частью естественной природы, а следы деятельности человека - нет? Если взглянуть на всю это суету с отстранённой позиции то человек не особо отличается от остальных коллективных существ.
Человек так же сам основан на электричестве: разве  не электрические импульсы сопровождают нашу мыслительную деятельность? Разве не электрические импульсы разносят сигналы и команды по всему телу? Человек и есть электричество в таком случае. Так, Что задача особо не нова - нужно просто повторить человека, но в другой форме.
Эта задача  - естественное последствие желания жизни жить. Жизнь всегда хочет жить как можно дольше и непрерывнее. "Железное" тело - один из ответов на этот запрос. Скорее всего человек - лишь проходной этап жизни на пути к кристаллизации совершенной формы бытия.
Аминь.

Ответить
Развернуть ветку
3 комментария
Alex Chernyshev

'Для практического применения ИИ, выявляющего смысловые ошибки, необходимое
условие – выявление наиболее частых ошибок.'

Я наверное устарел, но ведь правила правописания - вещь конечная не?  Если конечная - зачем тут ИИ и нейросети?   GNU Bison какой-нибудь и вперед. Понятно что живой язык сложнее компьютерного, но суть подхода ведь не изменится - парсер и есть парсер.

Поставили бы задачу 'найти смысл в текстах песен Моргенштерна'  -  еще бы понял, тут без нейросетки никуда.

Ответить
Развернуть ветку
Вася Пражкин

Перепечатка новости на VC, как обычно, потеряла часть смысла. Задание такое:

 Найти максимальное количество речевых и грамматических ошибок (неуместная лексика, неразличение оттенков значений, некорректные метафоры, неуместная двусмысленность, ошибки в построении предложений).

Тут обычным парсером не обойтись, нужно помощнее оружие.

Ответить
Развернуть ветку
4 комментария
Alexander Zinovkin

Скажите дизайнеру гифки, что скрепка слабо контрастирует на том фоне

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Vlad Kulikov

Уверен, что команда, которой хватит ума найти решение и создать алгоритм, продаст его гораздо дороже и не тут👍

Ответить
Развернуть ветку
Александр Савин

Я хотел бы присоединиться к любой команде. У меня есть знания в  Data Science и я буду счастлив их расширять, а если еще буду полезен, это будет высшим удовольствием! 

Ответить
Развернуть ветку
Sergey Ilyin

я тоже готов. может, зарешаем что-то на Кэггл? или, например, поможем отечественной медицине?

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Вася Пражкин
 Единственное ограничение — быть старше 18 лет (или шестнадцати, при определённых условиях)

Мне вот интересно, а  в чем смысл такого ограничения? Мой интеллект находит в этом смысловую ошибку.

Ответить
Развернуть ветку
Bulat Ziganshin

дети не имеют права работать

Ответить
Развернуть ветку
Sergei Sumarokov

Крутая штука, особенно мне нравится подобная фича, когда ты пишешь на иностранном языке, в Gmail. Так на 50% письмо состоит из того, что мне подсказывает алгоритм, ему лишь вектор задаешь.

Ответить
Развернуть ветку
Федя Родион

Но ведь ты же интеллект, а письмо без ошибок написать не можешь. Значит дело не в интеллекте, а в знании особенностей конкретного языка, логично?

Ответить
Развернуть ветку
2 комментария
miteigi nemoto

Время на решение — не более 30 секунд на эссе. А что уже за 10 минут есть решение? Ещё бы написали за 30 сёк на процессоре, а не на gpu. 

Ответить
Развернуть ветку
Sergey Ilyin

обученная модель может и 30 сек на процессоре - почему нет?

Ответить
Развернуть ветку
Дмитрий

Здорово, коллеги. Мне нужен коллега. Кто понимает как вообще персептрон работает. Я знаю как написать алгоритм, который победит в этом конкурсе. Кто со мной? С 18 октября в Москве буду. 89093897327 Дмитрий

Ответить
Развернуть ветку
Shtuintys TV

Оценка статьи....Скрепка класснаая,   скрепка ути пути лапа...

Ответить
Развернуть ветку
Август Гронский

Машинное обучение и искусственный интеллект - понятия несовместимые. Невозможно алгоритмически смоделировать разум, можно только натаскать программу, чтобы она определённым образом реагировала на поступающие сигналы. И как бы хорошо она это не делала, программа так и останется тупой программой, не осознающей свои действия. А тут нас просят научить программу "глубоко понимать смысл" текстов. Научить! Программу! Понимать! Правильно? Хм... Похоже авторы конкурса всерьез считают, что 100 лямов сделают все их хотелки реализуемыми.

Ответить
Развернуть ветку
Natalie Knn

А можно на пару с искусственным интеллектом принимать участие в конкурсе? Зачем Вам нужно не мене 2-х участников в команде? 

Ответить
Развернуть ветку
50 комментариев
Раскрывать всегда