Да общался 10 лет, еще на форуме по FineReader, и сделано было с гулькин нос, точнее почти ничего..…

ABBYY

Что почитать

07.02.2022

Что читают разработчики ABBYY

Полезные ссылки от Frontend, Backend, DevOps и Mobile.

1414

niccolo

18.02.2022

Да общался 10 лет, еще на форуме по FineReader, и сделано было с гулькин нос, точнее почти ничего.....

1. Возможность изменения типа блока есть в 8 версии, раньше не помню....
2. Режим извлечения текста из PDF вместо распознавания тоже есть в 8 версии.

В связи с этим вопрос — а вы компетентны обсуждать вопрос? Вы свои продукты знаете? Сколько и чего вы распознали и привели в божеский вид с помощью ФР, желательно разных версий, за последний год?

1. По п. 1. Skankromsator - сложная программа. Но функции, которые в ней реализованы обгоняют ваш недоделанный редактор с вашими темпами работы на столетия.... С подходом просто посмотреть - вы ничего не увидите.
Честно говоря, чтобы не тратить силы, для грамотного приложения которых у вас я не вижу ни ума ни идей посоветую лучше договориться с разработчиком SK и просто постараться обеспечить максимально простое взаимодействие с этой программой, что не должно представлять сложности, учитывая тот факт, что в ней информация о пакете полностью открыта....

По п. 5,7,8 - что смотреть - я вам который раз говорю - возьмите любой том Шломана попробуйте распознать и вычитать и вы всё увидите...

п. З текстовый поиск - искать выше и ниже есть, а искать по кругу - т.е. с автопереходом от первой страницы к последней или наоборот и обратно до текущей - нет. Решение когда-то возможно оправданное, но на сегодняшний день — странное.

по п. 4 - рабочих языков у распознавальщиков единицы - гораздо проще вытащить наверх пяток - десяток кнопок наиболее распространённых языков и переключать их нажатием, нежели копаться в выпадающих списках. То же самое касается и свойств блоков, ячеек таблиц и т.п., тем более что в свойствах блока языки как правило только те, что выбраны для распознавания документа.....

Я когда то написал иллюстрированную статью о том, как такая передовая компания уже 20 лет лажает в доведению до ума эргономики своих программ, но, видимо из-за «хороших» отношений хабр её завернул... Нетерпимость к разумной критике - обычно серьёзный звоночек того, что компания стала на нисходящую....

Изучим - и будем дальше работать над продуктом :)

Эти пустые слова (а еще «мы передадим полученную информацию в отдел разработки») я слышу лет 10 а может и больше..... ФР пухнет, превращается в страшного тормозного монстра, а результаты лучше не становятся...... Одно радует с такой разработкой - может хоть скоро всё оцифруют и необходимость в нём отпадёт. И кстати - а где можно пообщаться не просто с передастами информации из отдела в отдел, а с людьми принимающими решение и делающими?

Кстати туда же - про ПДФ - если бы вы работали нормально - вы бы знали о проблеме кривого маппинга шрифтов в ПДФ, сделанных в старых версиях продуктов ADOBE... В них толком не работает ни поиск, ни копи-паст.. Для кириллицы это просто беда....

Автоматического решения проблемы нет до сих пор. А ремапить вручную кучу шрифтов в Инфиксе, чтобы потом только в инфиксе этот файл стал нормальным, занятие так себе.....

Очень странно, что вы этой проблемы не заметили...
Сравнение ПДФ при смещении полос, не говоря уже про полное перемакетирование одного из документов, тоже работает неидеально и непонятно, как сопоставить блоки текста, которые надо сравнивать, если программа не смогла сама корректно определить их....

Про распознавание формул, возможность экспорта изображений с наложенными блоками в версии вниз, ластик, редактирование изображений без потери расставленных блоков (и это при наличии встроенной функции сохранения и наложения блоков!!!!!) (для масштабируемых изображений нужно, по хорошему, не забыть о масштабировании и блоков) (а еще лучше просто сохранять информацию о пакете в простом текстовом файле, как это делает Кромсатор), правку встроенных словарей, перенос вклеек в книгах (подписи к таблицам, рисункам) в разрывы между абзацами или главами, минимизация Style Hell в новых версиях, возможность залочки от перераспознавания отредактированных вручную блоков текста, задание зон нераспознавания (чтобы автоматом не распознавать колонтитулы и нумерацию страниц) вместо часто некорректно работающего определения колонтитулов — это глас вопиющего в пустыне, но на работу и пути улучшения программы, я так понимаю, не тянет...... ПЕЧАЛЬНО....

Кстати по поводу рассылки от Лингво, вот такое мнение от коллег
«Коллеги, вы видели, какой дурацкий опросник рассылает Лингво? Маркетинг пытается понять, сколько можно будет брать денег за пользование их продуктом в год!»

ДУРАЦКИЙ!!!!!!! После 8 лет забивания, тихой замены части нормальных словарей на какие-то убогие при переходе X5-X6, похорон Лингводы, каким образом вы хотите вернуть былую популярность и авторитет? Вопросом - сколько денег взять? За что!!!??? Только за то, что новая версия может быть будет менее проблемно ставиться и запускаться на W10-W11, или может за добавление Шломана, которого я отослал вам - так я его и так свободно выложил, или? Может поясните?

Ответить