По сканам газеты можно искать информацию — например, упоминания конкретных людей или событий.Нейросеть адаптировали под газетную вёрстку для работы с номерами «Советского спорта», рассказали в «Яндексе». Специалисты вручную обработали тысячи страниц и разметили их на блоки: от заголовков и колонок, до рекламы и надписей на форме спортсменов.В сервисе можно найти интервью известного советского футболиста Игоря Нетто, статью о необычном подходе к трансферам в Бразилии в середине 20 века и заметку о конфликте австрийской футбольной ассоциации с игроками из-за причёсок в «стиле битлз».«Яндекс» запустил «Поиск по архивам» в январе 2023 года. Это электронный каталог архивных документов и материалов от середины XVIII до конца XX века, в базе которого более 2,5 млн страниц документов, в том числе с дореволюционной орфографией. Пользователи могут искать записи через поиск или по каталогу, отфильтровав их по годам, архивам, фондам и описям.#новость #яндекс
Больше впечатлило не то, что осилили распознавание, а то, что у Советского спорта было как минимум 24 000 выпусков.
Это действительно потрясающе 👍🏻
Газета-то ежедневная
Больше впечатляет, как ты осиливаешь писать столько комментов. Это действительно потрясающе 👍🏻
Теперь нейросеть убеждена что Советский спорт самый лучший и прогрессивный, а капиталистический - полный отстой. 24 тысячи газет не дадут соврать.
Неправильному её научили
Непонятно откуда эти артефакты вылезли
То есть так и не исправили эти баги: https://vc.ru/services/590965-yandeks-nauchil-neyroseti-rasshifrovyvat-arhivnye-zapisi-s-dorevolyucionnoy-orfografiey?comment=5429729&from=copylink
Нейронка у них, хуёнка. Нагнали толокеров - вот и вся их нейронка, лол.