{"id":14277,"url":"\/distributions\/14277\/click?bit=1&hash=17ce698c744183890278e5e72fb5473eaa8dd0a28fac1d357bd91d8537b18c22","title":"\u041e\u0446\u0438\u0444\u0440\u043e\u0432\u0430\u0442\u044c \u043b\u0438\u0442\u0440\u044b \u0431\u0435\u043d\u0437\u0438\u043d\u0430 \u0438\u043b\u0438 \u0437\u043e\u043b\u043e\u0442\u044b\u0435 \u0443\u043a\u0440\u0430\u0448\u0435\u043d\u0438\u044f","buttonText":"\u041a\u0430\u043a?","imageUuid":"771ad34a-9f50-5b0b-bc84-204d36a20025"}

Dbrain

12 дек 2023 12.12.2023

Как мы учим ИИ распознавать рукописный текст. Расскажите про нас «Тотальному диктанту» (пжл)

Всем привет. Это Dbrain, и мы всё ещё распознаём документы для больших и не очень компаний. Распознать паспорт или ПТС — это изи. А что насчёт научить нейросеть распознавать сложные рукописные тексты?

Например, школьные сочинения на несколько страниц, где у каждого ребёнка свой почерк и свои приколы. Этому мы тоже учим ИИ, и обучение выглядит очень красиво. Сейчас покажу.

Данила

Head of Labeling в Dbrain. Или глава разметки, если по-русски

Шаг 1. Ищем большой датасет фото или сканов с рукописным текстом

Мы взяли фотографии школьных сочинений у онлайн-школы, с которой работали. Для начала показали нашему ИИ, что такое тетрадь и страница тетради. Теперь он знает, откуда брать слова для обучения.

Напоминаем тем, кто давно закончил школу, как выглядит тетрадь

Шаг 2. Перед полноценным обучением размечаем поля

Показываем ИИ, что в тетради не просто гора текста, а всё-таки есть структура: даты, типы работ, номера заданий и решения.

Упражнение под номером аж 440. Бедный ребёнок

Шаг 3. Размечаем текст: на строки, слова и символы

Сначала разметчики выделяют прямоугольниками строки. Затем строки делят на слова, а слова — на буквы. Последними выделяют знаки препинания.

Разметка строк помогает нам правильно выставлять последовательность слов

Без этапа разметки строк слова из соседних строк могут перемешаться на этапе распознавания. А нам так не надо.

Деление на слова и символы учит ИИ словам и знакам препинания

Последняя стадия: все элементы размечены и подсвечиваются разными цветами. Красота

Шаг 4. Переписываем отдельные слова для примера

На предыдущих этапах мы научили ИИ находить страницу тетради, строки, слова и символы. Это всё? Если бы. Теперь нас ждёт самый объёмный и затратный этап 🥲

Мы должны научить ИИ не просто находить слово в рукописном тексте, но и понимать, что это за слово. Отдельная сложность в том, что нам нужен именно тот вариант написания, который был у школьника — со всеми ошибками и исправлениями. Так что никаких эвристик и прочих пост-процессинговых хитростей, только хардкор.

Таким образом мы разметили порядка миллиона слов. Маршрутка разметчиков на этом моменте могла бы заплакать

Включаем режим учителя и пытаемся понять, что написал ребёнок

Шаг 5. Проверяем нейросеть и доучиваем её

На этом этапе нейросеть пробует распознавать текст и местами спотыкается. Когда какое-то слово непонятно нейросети, она приходит за помощью к разметчикам. Те смотрят контекст и печатают верное слово. Размеченные тексты отдают обратно нейросети, чтобы она запомнила буквы в разном написании. Даже самом кривом.

На этом этапе уже можно посмотреть, насколько хорошо ИИ справляется с рукописным текстом.

Радуемся 💫

Какочок? Присматриваемся и видим слово «крючок». Дообучаем 👩🏻‍🏫

«В» вместо сердечка. ИИ так и не научился любить 💔

ИИ может научиться распознавать любой рукописный текст?

Да. Школьные сочинения мы уже умеем распознавать, а вот под новые задачи — например, рецепты от врача или судовой журнал морского капитана — придётся обучать ИИ по-новому. Но это не проблема. Если есть такой запрос — приходите.

А если нужно распознать сочинения — дообучение будет очень быстрым. У кого там есть контакты ребят из «Тотального диктанта»?)

406 показов

87 открытий

{"id":233759,"url":"https:\/\/vc.ru\/u\/233759-dbrain","name":"Dbrain","avatar":"42fb4b42-28f1-5a4c-abde-e19f32269c9e","karma":1084,"description":"\u041c\u044b \u0441\u0435\u0440\u0432\u0438\u0441 \u0438\u0437\u0432\u043b\u0435\u0447\u0435\u043d\u0438\u044f \u0434\u0430\u043d\u043d\u044b\u0445 \u0438\u0437 \u0434\u043e\u043a\u0443\u043c\u0435\u043d\u0442\u043e\u0432. \u0420\u0430\u0431\u043e\u0442\u0430\u0435\u043c \u0441 \u043f\u0430\u0441\u043f\u043e\u0440\u0442\u0430\u043c\u0438, \u0412\u0423, \u0421\u0422\u0421, \u0434\u043e\u0433\u043e\u0432\u043e\u0440\u0430\u043c\u0438 \u0438 \u043f\u0435\u0440\u0432\u0438\u0447\u043d\u043e\u0439 \u0434\u043e\u043a\u0443\u043c\u0435\u043d\u0442\u0430\u0446\u0438\u0435\u0439. \u0418\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u043c \u0418\u0418 \u0432\u043c\u0435\u0441\u0442\u043e \u0432\u0440\u0435\u043c\u0435\u043d\u0438 \u0432\u0430\u0448\u0438\u0445 \u0441\u043e\u0442\u0440\u0443\u0434\u043d\u0438\u043a\u043e\u0432","isMe":false,"isSubscribed":false,"isNotificationsEnabled":false,"isShowMessengerButton":false,"isShowSubscribe":true,"hasBadge":false,"badgeType":null,"badgeUuid":null,"badgeUrl":null,"hasVideoAvatar":false}

Комментарии

Написать комментарий...

-3 комментариев

Раскрывать всегда