Что читают разработчики ABBYY

Полезные ссылки от Frontend, Backend, DevOps и Mobile.

Начало года – отличная возможность погрузиться в чтение и узнать что-то новое. Спросили наших DevOps-инженеров, Backend, Frontend, Mobile-разработчиков, что они советуют почитать, посмотреть и послушать, чтобы прокачаться в своей профессиональной области, быть в курсе важных новостей ИТ-индустрии или просто расширить кругозор. Сохраняйте себе полезные ссылки и делитесь своими советами в комментариях.

Рассказ Github о том, как они переехали на Codespaces и что это им дало. Эта статья полезна для понимания трендов ускорения разработки на больших проектах с объемной кодовой базой. Подход не то, чтобы новый, говорят об этом давно, но сейчас появилась техническая возможность его реализации, и сразу несколько крупных игроков, такие как Microsoft и Jetbrains, представили готовые продукты. В этой статье нет никаких сложных технических деталей, нужно только понимать в общих чертах, что такое IDE (интегрированная среда разработки) и зачем она нужна.
You Suck at Excel. Доклад одного из основателей StackOverflow о том, как можно повысить продуктивность при использовании Excel. Несмотря на то, что далеко не все программисты в работе используют эту программу, инструмент на самом деле очень мощный и полезный. В докладе демонстрируются лучшие практики и лайфхаки работы с Excel – пригодится всем, кто применяет его в работе.
Ежерелизный обзор Стивена Тауба по performance в net6.0. Уже ставшая традиционной статья одного из топовых разработчиков .NET о том, что было сделано в новой версии платформы с точки зрения performance. Статья очень объемная и требует серьезных знаний о том, что у .NET под капотом. Материал разбит на блоки, поэтому можно читать только те части, которые интересны вам. Также к каждому блоку приложены ссылки на Github, если хочется почитать код. Стоит сказать, что большинство разработчиков работают с более высокоуровневыми абстракциями, поэтому непосредственно в работе применить подобные знания будет сложно. Тем не менее, любопытно узнать, как тюнят фреймворк, на котором ты пишешь :)
Чарльз Пертцольд «Код». Шикарная книга от популяризатора Windows. Основательный экскурс в то, как появились компьютеры. Электродинамика, реле, логические вентили, транзисторы и все новые и новые абстракции, на основании того, что уже знаешь. Эта книга полезна еще и тем, что поможет освежить в голове школьные и университетские знания, а иногда – даже и поискать новую информацию по теме.
Чумачечий доклад про performance анализ. Андрей – создатель BenchmarkDotNet и признанный специалист в performance тестировании, очень интересно, с юмором и множеством примеров рассказывает, с чем вы столкнетесь, если решите окунуться в performance-анализ. Несмотря на то, что тема непростая, рассказ воспринимается очень легко и приятно. Этот доклад я рекомендую буквально всем, но особенно он будет полезен людям, которые проводят нагрузочные тестирования и впоследствии интерпретируют результаты этих тестов.

Nicole Forsgren, Jes Humble, Gene Kim. Accelerate. В книге рассказывается о том, как эффективность доставки программного обеспечения влияет на прибыльность, производительность и долю рынка, а также на некоммерческие показатели: продуктивность, работоспособность, удовлетворенность клиентов. Подойдет как руководителям, так и рядовым DevOps-инженерам, которые хотят понимать, какие ключевые метрики позволяют оценить, как влияет внедрение DevOps-практик и инструментов на цифровые продукты компании и на компанию в целом и что можно сделать, чтобы улучшить эти показатели.
John Arundel, Justin Domingus. Cloud native DevOps with Kubernetes. Дает понимание, как с помощью Kubernetes можно строить цифровые продукты, как ускорить доставку цифровых продуктов и уменьшить количество ошибок в процессе доставки. Так как Kubernetes уже используют многие компании для оркестрации контейнеров, его изучение является обязательным для DevOps-инженера.
Viktor Farcic. The DevOps 2.0 Toolkit. Хороший обзор инструментов и подходов, которые используются DevOps-инженерами изо дня в день. Это CI/CD, микросервисная архитектура, виртуализация и контейнеризация, docker, service discovery tools, инструменты автоматизации, observability. Книга на данный момент, возможно, немного устарела, но главное в ней – это не столько конкретные инструменты, сколько подходы. Инструменты меняются все время, но, если ты как инженер понимаешь суть проблемы и знаешь, какой подход использовать, то ты сможешь взять инструменты, имеющиеся на данный момент, и выбрать оптимальный. Книга подойдет начинающим DevOps-инженерам и middle-уровню.
Certified Kubernetes Administrator (CKA) with Practice Tests и Kubernetes CKS 2021 Complete Course - Theory - Practice. Это курсы сертификации Kubernetes, которые дают понимание об использовании этой технологии как платформы для размещения приложений. Первый курс можно проходить с минимальными знаниями Kubernetes, но нужно понимать, что инженер уже должен обладать знаниями Linux, Docker, Networking. Второй курс имеет смысл изучать, когда ты уже работаешь с Kubernetes, так как вопросы безопасности идут неразрывно с вопросами построения надежной отазоустойчивой инфраструктуры.

Youtube-канал «АйТи Синяк». Автор подкаста – фронтендер со стажем работы более семи лет в HTML, CSS и JS. Много информации, поделенной на рубрики: «Паттерны проектирования», «UiKit», «Frontend SOLID», «ReactJS под капотом». Канал скорее рассчитан на уровень от Middle и выше. Будет полезен для построения сильной теоретической базы и глубокого понимания устройства React-библиотеки.

Михаил Рубанов «Про доступность iOS». Автор книги рассказывает о том, как адаптировать мобильные приложения для людей с ограничениями зрения и подвижности. Ребята из Dodo Pizza реально заморочились, чтобы их приложением было удобно пользоваться разным людям, да еще и поделились полезной информацией, как это сделать другим. Это соответствует и ценностям Apple, которая тоже уделяет много внимания доступности своих технологий.

А вы что интересного прочли в своей профессиональной области за последнее время? Делитесь в комментариях!

23 комментария

Сергей Добрицкий

07.02.2022

А когда реализуете нормальный finereader?

Ответить

ABBYY

Автор

Расскажите, что хотелось бы добавить? Вообще мы регулярно обновляем текущую версию FineReader PDF, - как и другие наши решения. Из последних новостей, связанных с ним: добавили версию для мобильных устройств - теперь можно отправлять сканы из мобильного FineReader в продукт на ПК, улучшили интеграцию с Microsoft Office, а редактировать документы теперь можно с помощью списка ключевых слов.Не знаем, норма ли это, но стремимся к ней всеми силами :) Будем рады услышать, что еще можно улучшить.

Никита

08.02.2022

vc.ru никто не читает что ли?

Кто-то читает)

niccolo

17.02.2022

Никогда они не реализуют. Если люди задают такие вопросы - чего от них ждать.
Abbyy
1. Сравните ваш редактор изображений с теми же СканКромсатор - который разрабатывает 1!!!!!!! человек, скантайлор - и поплачьте.....
Про то, что с такой структурой пакета у вас не нашлось в нём места для сохранения оригиналов, которые отдельные функции предобработки МОГУТ БЕЗВОЗВРАТНО ИСПОРТИТЬ — ???????!!!!!!!!!!!!!!!

2. Если у вас остался кто-нибудь, кто помнит версию 8 сравните поведение ластика там и в новых версиях - а чтобы лучше сравнивалось - возьмите в новой версии чертёж, расставьте что- автоматом, что вручную сотню другую блоков, а потом ластиком.....

3. Отсутствие кругового поиска — это жесть...

4. Выбор языков в выпадающем списке вместо выбора кнопками - это ППЦ.

5. В табличных блоках - функция объединения строк есть, а на столбцы - ума не хватило?

В 15 версии в книжке страниц на 500 jpg попробуйте исправить блоки на странице и перераспознать — не знаю, что делала программа, но потратив пару секунд на перераспознавание она ещё до минуты висела, не давая ничего делать.... Полагаю это обусловлено структурой пакета, в котором распознанный текст находится в одном файле и после каждого перераспознавания этот файл повторно собирается и перезаписывается.... Грамотность решения даже не поддаётся оценке.....

6. Перейти к предыдущей странице Ctrl+↑ — раньше было CTRL+.... Интересно - если педали тормоза и газа вам в машине местами поменять - много восторга будет....

7. До сих пор, не знаю почему, наверное от большого старания, ОЧЕНЬ много ошибок распознавания ьно - ЫЮ и других не сильно распространённых сочетаний букв для разных языков....

8. Глюки с разбивкой на строки во встроенном редакторе в разных режимах.... Точно помню, что были, но не скажу, в каких режимах....

9. Невозможность избавиться от ТАБов при экспорте в док.... Где мозг....

И это недостатки, набросанные по памяти за 10 минут......

А вообще - берёте какой-нибудь том Шломана - распознаёте и приводите к исходному виду - недостатков вылезет столько - что вместо вопросов - только работать надо будет.

18.02.2022

Спасибо за ваши комментарии!

Если мы не опознались, то вы раньше общались с нашей продуктовой командой. С того времени мы много что обновили, в том числе по вашим предыдущим замечаниям. Из того, что вспомнили навскидку: добавили еще пару лет назад возможность отредактировать тип блока вручную и вызвать распознавание без запуска анализа. В 15-й версии добавили режим извлечения текстового слоя из PDF – то есть, если он уже есть в PDF в хорошем качестве, то распознавать не нужно.

Новые комментарии тоже передадим продуктовой команде, если у вас будет время и желание предоставить дополнительную информацию и скрины нашей техподдержке. По пунктам 1,5,7,8 желательно посмотреть на примеры, по пункту 3,4 – просим рассказать о проблеме немного подробнее. Изучим - и будем дальше работать над продуктом :)

Да общался 10 лет, еще на форуме по FineReader, и сделано было с гулькин нос, точнее почти ничего.....

1. Возможность изменения типа блока есть в 8 версии, раньше не помню....
2. Режим извлечения текста из PDF вместо распознавания тоже есть в 8 версии.

В связи с этим вопрос — а вы компетентны обсуждать вопрос? Вы свои продукты знаете? Сколько и чего вы распознали и привели в божеский вид с помощью ФР, желательно разных версий, за последний год?

1. По п. 1. Skankromsator - сложная программа. Но функции, которые в ней реализованы обгоняют ваш недоделанный редактор с вашими темпами работы на столетия.... С подходом просто посмотреть - вы ничего не увидите.
Честно говоря, чтобы не тратить силы, для грамотного приложения которых у вас я не вижу ни ума ни идей посоветую лучше договориться с разработчиком SK и просто постараться обеспечить максимально простое взаимодействие с этой программой, что не должно представлять сложности, учитывая тот факт, что в ней информация о пакете полностью открыта....

По п. 5,7,8 - что смотреть - я вам который раз говорю - возьмите любой том Шломана попробуйте распознать и вычитать и вы всё увидите...

п. З текстовый поиск - искать выше и ниже есть, а искать по кругу - т.е. с автопереходом от первой страницы к последней или наоборот и обратно до текущей - нет. Решение когда-то возможно оправданное, но на сегодняшний день — странное.

по п. 4 - рабочих языков у распознавальщиков единицы - гораздо проще вытащить наверх пяток - десяток кнопок наиболее распространённых языков и переключать их нажатием, нежели копаться в выпадающих списках. То же самое касается и свойств блоков, ячеек таблиц и т.п., тем более что в свойствах блока языки как правило только те, что выбраны для распознавания документа.....

Я когда то написал иллюстрированную статью о том, как такая передовая компания уже 20 лет лажает в доведению до ума эргономики своих программ, но, видимо из-за «хороших» отношений хабр её завернул... Нетерпимость к разумной критике - обычно серьёзный звоночек того, что компания стала на нисходящую....

Изучим - и будем дальше работать над продуктом :)

Эти пустые слова (а еще «мы передадим полученную информацию в отдел разработки») я слышу лет 10 а может и больше..... ФР пухнет, превращается в страшного тормозного монстра, а результаты лучше не становятся...... Одно радует с такой разработкой - может хоть скоро всё оцифруют и необходимость в нём отпадёт. И кстати - а где можно пообщаться не просто с передастами информации из отдела в отдел, а с людьми принимающими решение и делающими?

Кстати туда же - про ПДФ - если бы вы работали нормально - вы бы знали о проблеме кривого маппинга шрифтов в ПДФ, сделанных в старых версиях продуктов ADOBE... В них толком не работает ни поиск, ни копи-паст.. Для кириллицы это просто беда....

Автоматического решения проблемы нет до сих пор. А ремапить вручную кучу шрифтов в Инфиксе, чтобы потом только в инфиксе этот файл стал нормальным, занятие так себе.....

Очень странно, что вы этой проблемы не заметили...
Сравнение ПДФ при смещении полос, не говоря уже про полное перемакетирование одного из документов, тоже работает неидеально и непонятно, как сопоставить блоки текста, которые надо сравнивать, если программа не смогла сама корректно определить их....

Про распознавание формул, возможность экспорта изображений с наложенными блоками в версии вниз, ластик, редактирование изображений без потери расставленных блоков (и это при наличии встроенной функции сохранения и наложения блоков!!!!!) (для масштабируемых изображений нужно, по хорошему, не забыть о масштабировании и блоков) (а еще лучше просто сохранять информацию о пакете в простом текстовом файле, как это делает Кромсатор), правку встроенных словарей, перенос вклеек в книгах (подписи к таблицам, рисункам) в разрывы между абзацами или главами, минимизация Style Hell в новых версиях, возможность залочки от перераспознавания отредактированных вручную блоков текста, задание зон нераспознавания (чтобы автоматом не распознавать колонтитулы и нумерацию страниц) вместо часто некорректно работающего определения колонтитулов — это глас вопиющего в пустыне, но на работу и пути улучшения программы, я так понимаю, не тянет...... ПЕЧАЛЬНО....

Кстати по поводу рассылки от Лингво, вот такое мнение от коллег
«Коллеги, вы видели, какой дурацкий опросник рассылает Лингво? Маркетинг пытается понять, сколько можно будет брать денег за пользование их продуктом в год!»

ДУРАЦКИЙ!!!!!!! После 8 лет забивания, тихой замены части нормальных словарей на какие-то убогие при переходе X5-X6, похорон Лингводы, каким образом вы хотите вернуть былую популярность и авторитет? Вопросом - сколько денег взять? За что!!!??? Только за то, что новая версия может быть будет менее проблемно ставиться и запускаться на W10-W11, или может за добавление Шломана, которого я отослал вам - так я его и так свободно выложил, или? Может поясните?