Нейросеть «Яндекса» распознала 24 тысячи выпусков газеты «Советский спорт» для сервиса «Поиск по архивам»

По сканам газеты можно искать информацию — например, упоминания конкретных людей или событий.

Нейросеть «Яндекса» распознала 24 тысячи выпусков газеты «Советский спорт» для сервиса «Поиск по архивам»
  • Нейросеть адаптировали под газетную вёрстку для работы с номерами «Советского спорта», рассказали в «Яндексе». Специалисты вручную обработали тысячи страниц и разметили их на блоки: от заголовков и колонок, до рекламы и надписей на форме спортсменов.
  • В сервисе можно найти интервью известного советского футболиста Игоря Нетто, статью о необычном подходе к трансферам в Бразилии в середине 20 века и заметку о конфликте австрийской футбольной ассоциации с игроками из-за причёсок в «стиле битлз».
  • «Яндекс» запустил «Поиск по архивам» в январе 2023 года. Это электронный каталог архивных документов и материалов от середины XVIII до конца XX века, в базе которого более 2,5 млн страниц документов, в том числе с дореволюционной орфографией. Пользователи могут искать записи через поиск или по каталогу, отфильтровав их по годам, архивам, фондам и описям.
36
83 комментария

Больше впечатлило не то, что осилили распознавание, а то, что у Советского спорта было как минимум 24 000 выпусков.
Это действительно потрясающе 👍🏻

16
Ответить

Газета-то ежедневная

4
Ответить

Больше впечатляет, как ты осиливаешь писать столько комментов. Это действительно потрясающе 👍🏻

4
Ответить

Теперь нейросеть убеждена что Советский спорт самый лучший и прогрессивный, а капиталистический - полный отстой. 24 тысячи газет не дадут соврать.

11
Ответить

Неправильному её научили

Ответить

Непонятно откуда эти артефакты вылезли

5
Ответить