Начало года – отличная возможность погрузиться в чтение и узнать что-то новое. Спросили наших DevOps-инженеров, Backend, Frontend, Mobile-разработчиков, что они советуют почитать, посмотреть и послушать, чтобы прокачаться в своей профессиональной области, быть в курсе важных новостей ИТ-индустрии или просто расширить кругозор. Сохраняйте себе полезные ссылки и делитесь своими советами в комментариях.
А когда реализуете нормальный finereader?
Расскажите, что хотелось бы добавить? Вообще мы регулярно обновляем текущую версию FineReader PDF, - как и другие наши решения. Из последних новостей, связанных с ним: добавили версию для мобильных устройств - теперь можно отправлять сканы из мобильного FineReader в продукт на ПК, улучшили интеграцию с Microsoft Office, а редактировать документы теперь можно с помощью списка ключевых слов.Не знаем, норма ли это, но стремимся к ней всеми силами :) Будем рады услышать, что еще можно улучшить.
vc.ru никто не читает что ли?
Кто-то читает)
Никогда они не реализуют. Если люди задают такие вопросы - чего от них ждать.
Abbyy
1. Сравните ваш редактор изображений с теми же СканКромсатор - который разрабатывает 1!!!!!!! человек, скантайлор - и поплачьте.....
Про то, что с такой структурой пакета у вас не нашлось в нём места для сохранения оригиналов, которые отдельные функции предобработки МОГУТ БЕЗВОЗВРАТНО ИСПОРТИТЬ — ???????!!!!!!!!!!!!!!!
2. Если у вас остался кто-нибудь, кто помнит версию 8 сравните поведение ластика там и в новых версиях - а чтобы лучше сравнивалось - возьмите в новой версии чертёж, расставьте что- автоматом, что вручную сотню другую блоков, а потом ластиком.....
3. Отсутствие кругового поиска — это жесть...
4. Выбор языков в выпадающем списке вместо выбора кнопками - это ППЦ.
5. В табличных блоках - функция объединения строк есть, а на столбцы - ума не хватило?
В 15 версии в книжке страниц на 500 jpg попробуйте исправить блоки на странице и перераспознать — не знаю, что делала программа, но потратив пару секунд на перераспознавание она ещё до минуты висела, не давая ничего делать.... Полагаю это обусловлено структурой пакета, в котором распознанный текст находится в одном файле и после каждого перераспознавания этот файл повторно собирается и перезаписывается.... Грамотность решения даже не поддаётся оценке.....
6. Перейти к предыдущей странице Ctrl+↑ — раньше было CTRL+.... Интересно - если педали тормоза и газа вам в машине местами поменять - много восторга будет....
7. До сих пор, не знаю почему, наверное от большого старания, ОЧЕНЬ много ошибок распознавания ьно - ЫЮ и других не сильно распространённых сочетаний букв для разных языков....
8. Глюки с разбивкой на строки во встроенном редакторе в разных режимах.... Точно помню, что были, но не скажу, в каких режимах....
9. Невозможность избавиться от ТАБов при экспорте в док.... Где мозг....
И это недостатки, набросанные по памяти за 10 минут......
А вообще - берёте какой-нибудь том Шломана - распознаёте и приводите к исходному виду - недостатков вылезет столько - что вместо вопросов - только работать надо будет.
Спасибо за ваши комментарии!
Если мы не опознались, то вы раньше общались с нашей продуктовой командой. С того времени мы много что обновили, в том числе по вашим предыдущим замечаниям. Из того, что вспомнили навскидку: добавили еще пару лет назад возможность отредактировать тип блока вручную и вызвать распознавание без запуска анализа. В 15-й версии добавили режим извлечения текстового слоя из PDF – то есть, если он уже есть в PDF в хорошем качестве, то распознавать не нужно.
Новые комментарии тоже передадим продуктовой команде, если у вас будет время и желание предоставить дополнительную информацию и скрины нашей техподдержке. По пунктам 1,5,7,8 желательно посмотреть на примеры, по пункту 3,4 – просим рассказать о проблеме немного подробнее. Изучим - и будем дальше работать над продуктом :)
Да общался 10 лет, еще на форуме по FineReader, и сделано было с гулькин нос, точнее почти ничего.....
1. Возможность изменения типа блока есть в 8 версии, раньше не помню....
2. Режим извлечения текста из PDF вместо распознавания тоже есть в 8 версии.
В связи с этим вопрос — а вы компетентны обсуждать вопрос? Вы свои продукты знаете? Сколько и чего вы распознали и привели в божеский вид с помощью ФР, желательно разных версий, за последний год?
1. По п. 1. Skankromsator - сложная программа. Но функции, которые в ней реализованы обгоняют ваш недоделанный редактор с вашими темпами работы на столетия.... С подходом просто посмотреть - вы ничего не увидите.
Честно говоря, чтобы не тратить силы, для грамотного приложения которых у вас я не вижу ни ума ни идей посоветую лучше договориться с разработчиком SK и просто постараться обеспечить максимально простое взаимодействие с этой программой, что не должно представлять сложности, учитывая тот факт, что в ней информация о пакете полностью открыта....
По п. 5,7,8 - что смотреть - я вам который раз говорю - возьмите любой том Шломана попробуйте распознать и вычитать и вы всё увидите...
п. З текстовый поиск - искать выше и ниже есть, а искать по кругу - т.е. с автопереходом от первой страницы к последней или наоборот и обратно до текущей - нет. Решение когда-то возможно оправданное, но на сегодняшний день — странное.
по п. 4 - рабочих языков у распознавальщиков единицы - гораздо проще вытащить наверх пяток - десяток кнопок наиболее распространённых языков и переключать их нажатием, нежели копаться в выпадающих списках. То же самое касается и свойств блоков, ячеек таблиц и т.п., тем более что в свойствах блока языки как правило только те, что выбраны для распознавания документа.....
Я когда то написал иллюстрированную статью о том, как такая передовая компания уже 20 лет лажает в доведению до ума эргономики своих программ, но, видимо из-за «хороших» отношений хабр её завернул... Нетерпимость к разумной критике - обычно серьёзный звоночек того, что компания стала на нисходящую....
Изучим - и будем дальше работать над продуктом :)
Эти пустые слова (а еще «мы передадим полученную информацию в отдел разработки») я слышу лет 10 а может и больше..... ФР пухнет, превращается в страшного тормозного монстра, а результаты лучше не становятся...... Одно радует с такой разработкой - может хоть скоро всё оцифруют и необходимость в нём отпадёт. И кстати - а где можно пообщаться не просто с передастами информации из отдела в отдел, а с людьми принимающими решение и делающими?
Кстати туда же - про ПДФ - если бы вы работали нормально - вы бы знали о проблеме кривого маппинга шрифтов в ПДФ, сделанных в старых версиях продуктов ADOBE... В них толком не работает ни поиск, ни копи-паст.. Для кириллицы это просто беда....
Автоматического решения проблемы нет до сих пор. А ремапить вручную кучу шрифтов в Инфиксе, чтобы потом только в инфиксе этот файл стал нормальным, занятие так себе.....
Очень странно, что вы этой проблемы не заметили...
Сравнение ПДФ при смещении полос, не говоря уже про полное перемакетирование одного из документов, тоже работает неидеально и непонятно, как сопоставить блоки текста, которые надо сравнивать, если программа не смогла сама корректно определить их....
Про распознавание формул, возможность экспорта изображений с наложенными блоками в версии вниз, ластик, редактирование изображений без потери расставленных блоков (и это при наличии встроенной функции сохранения и наложения блоков!!!!!) (для масштабируемых изображений нужно, по хорошему, не забыть о масштабировании и блоков) (а еще лучше просто сохранять информацию о пакете в простом текстовом файле, как это делает Кромсатор), правку встроенных словарей, перенос вклеек в книгах (подписи к таблицам, рисункам) в разрывы между абзацами или главами, минимизация Style Hell в новых версиях, возможность залочки от перераспознавания отредактированных вручную блоков текста, задание зон нераспознавания (чтобы автоматом не распознавать колонтитулы и нумерацию страниц) вместо часто некорректно работающего определения колонтитулов — это глас вопиющего в пустыне, но на работу и пути улучшения программы, я так понимаю, не тянет...... ПЕЧАЛЬНО....
Кстати по поводу рассылки от Лингво, вот такое мнение от коллег
«Коллеги, вы видели, какой дурацкий опросник рассылает Лингво? Маркетинг пытается понять, сколько можно будет брать денег за пользование их продуктом в год!»
ДУРАЦКИЙ!!!!!!! После 8 лет забивания, тихой замены части нормальных словарей на какие-то убогие при переходе X5-X6, похорон Лингводы, каким образом вы хотите вернуть былую популярность и авторитет? Вопросом - сколько денег взять? За что!!!??? Только за то, что новая версия может быть будет менее проблемно ставиться и запускаться на W10-W11, или может за добавление Шломана, которого я отослал вам - так я его и так свободно выложил, или? Может поясните?