{"id":14294,"url":"\/distributions\/14294\/click?bit=1&hash=434adac65d5ae5d3e2e945d184806550325dd9068ef9e9c0681ca88ae4a51357","hash":"434adac65d5ae5d3e2e945d184806550325dd9068ef9e9c0681ca88ae4a51357","title":"\u0412\u043d\u0435\u0434\u0440\u0435\u043d\u0438\u0435 \u0418\u0418 \u043c\u043e\u0436\u0435\u0442 \u043f\u0440\u0438\u043d\u043e\u0441\u0438\u0442\u044c \u043a\u043e\u043c\u043f\u0430\u043d\u0438\u044f\u043c \u043c\u0438\u043b\u043b\u0438\u0430\u0440\u0434\u044b \u0432 \u0433\u043e\u0434","buttonText":"","imageUuid":""}

Минобрнауки выкупило 2742 книги по технической направленности для бесплатного доступа и их уже можно читать

Что, впервые об этом слышите?

Я бы тоже не знал, если бы не мониторил иногда сайт Госзакупок. Так где же книги?

Книги министерство закупило не само, а выдав 350 млн. руб. Библиотеке естественных наук РАН (БЕН РАН). БЕН РАН и отвечает за то, как это работает и даже более того, было основным лоббистом выделения денег.

Не буду томить, лучше расскажу как попасть в каталог с книгами.

  1. Заходите на сайт БЕН РАН и видите ссылку на коллекции с книгами. Кликаете по коллекции и попадаете в каталог библиотечной системы Koha.

2. Дальше выбираете коллекцию

Теперь вы увидите список книг, чтобы понимать что примерно там есть и можно поиском попытаться найти то, что вам интересно. А когда найдете книгу и откроете ее описание, будет ссылка на чтение в плеере. Смотрите, не пропустите ее.

Ну а дальше откроется плеер и часть книги можно пролистать, а если залогинеться, то бесплатно читать. Но входить на сайт я не пробовал так как не доверяю свои персональные данные этой библиотеке.

Надеюсь вы сможете найти там что-то полезное для себя, но наверное у вас возник вопрос: какого всё так ужасно? Казалось бы проект делает библиотека РАН, то есть специально-созданный информационно-знаниевый институт Академии наук, в котором кандидаты с докторами сидят, получавшие степени за то, как они лихо умеют работать с информацией, описывать и выдавать книги и вообще, кому как не библиотеке РАН быть образцом по книжно-учебно-просветительскому сервису и предоставлению его в интернете?

Если вас это не интересует, дальше можно не читать, а если интересно что там с этими библиотеками и что это за проект с бесплатными книгами, попробую рассказать.

История

Началось все еще в 2014 году, когда Минкульт создал Национальную электронную библиотеку (НЭБ). Потратили тогда 135 млн. на Битрикс + поиск + написание веб-плеера к PDF + книги, ну а потом туда книги как покупали в аренду, так и закидывали оцифрованные и всего потратили больше полумиллиарда рублей. Правда НЭБ при запуске сильно ругали, за то, что он кривой при том большом финансировании, которое на него потратили. Даже был скандал, что не успели подключиться к ЕСИА к приезду Медведева и подключение к НЭБ через ЕСИА реализовали фишингом. Со стороны государства НЭБ делал опять же не Минкульт, а Российская государственная библиотека (РГБ, она же Ленинка). Руководил развитием НЭБ Алекснадр Вислый, а его замом по ИТ был Олег Шорин. Позже Вислого (официально за что не указывалось, но видимо за провал НЭБ) уволили из библиотек Минкульта, а его заместитель по ИТ Олег Шорин стал впоследствии директором той самой БЕН РАН, которая и реализует выше упомянутый проект.

С самого начала возникла ситуация, что НЭБ, созданный в общем-то для науки и образования, развивает Минкульт, а Минобрнауки денег в него не вкладывает, хотя в принципе НЭБ работает прежде всего для студентов, ученых и преподавателей. Ну и Минкульт предлагал Минобрнауки деньгами включиться в развитие НЭБ.

Минобрнауки согласилось и выделило под это дело 350 млн. на закупку книг, про которые выше и написано. Но эти книги купили не в РГБ, которая владеет НЭБ, а в подконтрольную Минобрнауки библиотеку БЕН РАН, а та уже должна храня книги у себя, давать возможность открывать их и в НЭБ.

При этом книги куплены не навсегда, а некоторое количество лицензий на число просмотров, поэтому книги в бесплатном доступе, но надо залогинеться, чтобы их читать полностью (чтобы роботы не потратили все лицензии).

Идея с лицензиями и тратой лицензий возникла чтобы избежать проблем с которыми столкнулся НЭБ: там купили лицензию на книги на один год, но за год народу прочитало мало эти книги, год закончился и доступ прекратился к книгам, теперь решили закупать не на год, а в количествах открытий (сессий) книжек, чтобы если книги будут читать мало, через год доступ к ним не прекратился.

Уже здесь возникают вопросы, я подсчитал стоимость аренды книг в библиотеке и получилось, что стоимость лицензии всех сессий для каждой книги составляет по 126 тыс. руб., однако за 126 тыс. руб. можно было бы не арендовать на время доступ к уже изданной книге, а заказать издание совершенно новых книг (или даже учебных курсов) с выкупом прав для распространения их в интернете под открытой лицензией (например Creative Commons) и тогда и книги (или курсы) были бы новые и авторы бы заработали и доступ был бы удобен (не через защищенный плеер) и никогда не закончился и, самое главное, знание в книгах было бы актуализировано на текущий момент (некоторым книгам больше 10 лет, что довольно много для книг про современную науку и технику). Но нет, вместо создания нового куплено старое, причем основной профит с этого получит определенно не автор, а ладно если издатель и ничего нового на эти 350 млн. руб. создано не будет.

Дальше больше: вас наверное изумил устаревший сайт БЕН РАН, отсутствие навигатора, обложек и плохой UI/UX тех сайтов, где книги предполагается распространять.

А я вот много вижу библиотечных сайтов и меня не изумляет. Да, создавать электронные библиотеки, упорядочивать книги, создавать навигацию, классифицировать и т.п. учат в вузах на библиотечных факультетах, защищают дипломы, кандидатские и докторские и БЕН РАН, как и другие крупные библиотеки, должны профессионально уметь представлять информацию, создавать удобную пользователям навигацию и т.д. Но не умеют, хоть ты тресни!

Можно было бы подумать, что Минобрнауки выделило деньги только на книги, а бедная БЕН РАН использует бесплатное ПО для автоматизации библиотек Koha и просто нет ресурсов на то, чтобы купить или заказать создание нормального ПО, но и это не так.
Минобрнауки заложило на плеер к книгам по 14 млн. руб. каждой подключаемой к БЕН РАН библиотеке (на самом деле планировалось создать внутрибиблиотечную сеть и чтобы можно было книгами в этой сети в защищенном виде обмениваться). Поверьте, за 14 млн. руб. можно было бы создать плеер получше данного, ибо в данном:

  1. Искажены пропорции текста;
  2. Не работает поиск (и в Koha полнотекстовый поиск тоже не работает, то есть найти можно только по метаданным, но не по тексту в книге);
  3. Страница вписана по высоте, поэтому текст маленький и читать его некомфортно;

При этом плеер работает фактически отдельно от электронного каталога, то есть в каталог даже нельзя обложку первой страницы передать автоматически (в электронных библиотеках обложки часто из первой страницы сами генерируются и руками их не загружают), то есть фактически книги купили, а электронной библиотеки нет и функции электронной библиотеки выполняет неприспособленная для этого система автоматизации библиотек Koha + плеер для отображения PDF.

Кстати о плеере, он называется Vivaldi, имеет защищенный просмотр и еще некоторые фичи по ограничению доступа. Вообще-то если вы захотите его себе купить, то ранее неограниченная по времени лицензия продавалась за 250 тыс. руб. Но тут он вдруг подорожал до 14 млн. -) Злые языки шепчутся, что создателем плеера является Олег Шорин, хотя якобы он стесняется это признавать и официально его создателем является компания EDISON, а Олег Шорин к EDISON якобы не имеет никакого отношения. Эти слухи не подтверждены официально и с точки зрения документов они не верны, но я склонен им доверять так как ни разу не видел, чтобы Vivaldi продвигали на библиотечных конференциях представители компании EDISON, а вот Олег Шорин продвигал плеер не раз, хотя плеер имеет очевидные недоработки с точки зрения удобства использования.

Впрочем я долго в начале рассказывал, что на самом деле эта идея потратить 350 млн. на лицензии для книг реализуется на самом деле в контексте НЭБ. Так можно ли эти 2753 книги найти в НЭБ и читать через НЭБ?

Ну некоторые можно, а некоторые нельзя. Видимо в НЭБ встроили не все, что купили, а только часть. Например эту книгу можно прочитать в НЭБ, а эту читать нельзя.

Но в НЭБ конечно тоже нет иерархического систематического навигатора, есть только поиск, поэтому походить по каталогу и посмотреть что примерно есть из интересного среди купленных книг проблематично.

Заключение

Олег Шорин и его бывший патрон Александр Вислый прекрасно знали, что покупать книги в библиотеки с точки зрения их выдачи достаточно бесполезно: целевая аудитория про них не знает и читать не будет, поэтому такого рода проекты просто обречены на провал с самого начала.

Они знали, но повторили в БЕН РАН ту же самую ошибку, что они же допустили в НЭБ и что (по видимому) стоило Вислому карьеры: потратили сотни миллионов неэффективно.

Более того, НЭБ-то по сравнению с Koha+Vivaldi ну намного лучше выглядит и работает, но все равно даже НЭБ подвергся жесткой критике за плохой UI/UX, здесь же с самого начала было ясно, что получится ещё хуже так как Koha - это профессиональный инструмент для библиотекаря, который 4 года учится в учебном заведении таким пользоваться. Koha совершенно не подходит для пользователя в том виде, в котором оно работает в БЕН РАН. И в БЕН РАН знали, что получится хуже, чем с НЭБ, но все равно предложили Минобрнауки делать именно в том виде, в котором реализовали.

В итоге малоэффективная трата Минобрнауки более чем 350 млн. бюджетных средств, которые можно было бы потратить с большим толком, если бы слушали не тех людей, которые завалили НЭБ в Минкультуре и "смогли повторить" тоже самое с Минобрнауки.

Тем не менее, книги куплены, может эта статья поможет кому-то в них найти что-то полезное.

0
95 комментариев
Написать комментарий...
Alex Chernyshev

Вам бы к Ксении Собчак на передачу, замечательно бы вписались.

По факту же вы тут написали на состав статьи под названием клевета, не знаю чего вы не поделили с г-ном Шориным но будь я им то уже готовил бы иск.
И вы бы потом судье объясняли кто чей автор и где попил казны.

И нет, 14 млн на разработку библиотечной системы с 0 это мало, также как и на свой PDF плеер. PDF это внезапно очень сложный формат, помимо того что закрытый, а то что вы видите в вебе вообще-то результат его реверс-инжиниринга.

350 млн за книги - попил ? Если чуть чуть подумать то можно догадаться что покупались лицензионные права, у издательства и на неограниченное распространение.
Ну идите купите в просвященной Европе или США таких лицензий для технической литературы на эти же 350 (6 млн долларов), при среднем ценнике книжке по той же Java в 50 баксов, я на вас посмотрю )

Ответить
Развернуть ветку
Арсен Боровинский
Автор

1. PDF открытый формат. Спецификацию можно банально нагуглить. Есть открытые библиотеки и ПО для работы с PDF, например Poppler, Apache PDFBOX, pdfium, PDF.js и несколько закрытых коммерческих библиотек.
2. Речь идет не о разработке свой библиотечной системы с нуля, а о продаже уже существующего плеера PDF с некоторым продвинутым функционалом по защите, но тем не менее уже написанного и просто плеера, а не АБИС. Даже скриншот вставил, в котором забыли удалить "Vivaldi" для доказательства того, что это Vivaldi, а ни какая не новая разработка Notio. По стоимости разработки более сложной чем плеер Vivaldi электронной библиотеке Лань я привел стоимость разработки с нуля: 15-30 млн. Я знаю стоимость разработки некоторых из перечисленных ЭБС, так как лично у владельцев спрашивал и она вполне вписывается в оценку 15-30 млн.
3. Про 350 млн. написано неэффективная трата средств.
4. По плееру написано в формате оценочных суждений и явно указано, что по документам это EDISON, а что Олег Шорин - оно только слухи.
5. Сравнивать с Европой не совсем правильно так как книгоиздание в России постепенно умирает (падение тиражей в 2 раза за 10 лет), издатели говорят, что себестоимость создания книги около 50 тыс. руб. (корректура, верстка и прочие издательские процессы), книги многие старые (больше 10 лет) и узкопрофильные, то есть имеют узкую аудиторию и уже на излете своих продаж. Тут как бы извините, если бы издателям условия были не выгодны, они бы не продали книги. Раз продали, значит выгодны. И у меня, если посмотрите, тезис был не в том, что книги очень дорогие, а в том, что если нашлось 127 тыс. на покупку временных лицензий на одну книгу, то лучше было бы эти деньги потратить иначе и на создание новых книг или курсов. Добавлю, что может имело смысл по ряду направлений даже не книги или курсы сделать, а базы знаний. Но это уже другая история, как эффективно можно было бы потратить деньги по нескольким приоритетным направлениям.

Ответить
Развернуть ветку
Alex Chernyshev

'1. PDF открытый формат.'
Нет, это проприетарный формат Adobe, описание получено путем реверс-инжиниринга.

'Есть открытые библиотеки и ПО для работы с PDF, '

Проблема современного ИТ это то что слишком много всего есть но ничего не работает. А когда начинаешь копать оказывается что вообщем-то ничего и нет.
Например в PDF есть такая штука как формы ввода: когда пользователь может какие поля в PDF заполнить и затем распечатать.
Используется в США для заполнения форм отчетности в налоговую или подачи на визу.
Есть слои, причем разного типа. Вот например страница книги - первый слой это картинка, а под ним - слой текста. Когда вы выделяете текст - он копируется не со слоя-картинки а с нижнего, где текст.
Есть электронная подпись, есть сжатие и еще дофига всего.

Вообще форматы данных у приложений, которые давно на рынке - все сложные. Что у Adobe, что у Микрософта что у Corel, чудес нет.
И говорить о том что какая-то открытая библиотека может какой-то из них полностью поддержать - дилетанство и обман.

'По стоимости разработки более сложной чем плеер Vivaldi электронной библиотеке Лань я привел стоимость разработки с нуля: 15-30 млн'

Замечательный разброс в два раза ага) Сразу повеяло экспертизой.

Я вот могу сказать что один ФОТ на средненькую команду разработки из 6 человек у вас будет 14-16 млн в год. А еще надо на что-то самому жить.

'Про 350 млн. написано неэффективная трата средств.'
Чьих средств? Ваших? Из вашего кармана забрали?
Если вы такой знающий, ну наверное в курсе что такое 44ФЗ, что есть проверки госкомиссией, что есть практика возврата затраченных средств если сумма контракта оказалась завышенной.

С тех пор как ФБК импортозаместили на ФСБ и ввели конфискацию с посадками для случаев когда чиновник не может обосновать доход - все, лафа кончилась. Договориться больше ни с кем нельзя, про откаты и попилы теперь только в кино смотрите, про Роттенбергов )

' то лучше было бы эти деньги потратить иначе и на создание новых книг или курсов.'

Если вы позиционируете себя как заинтересованного гражданина, у вас есть компетенции, знания и есть идеи как сделать лучше - ну так напишите открытое письмо или запрос в министерство.

Зачем на ВС писать да еще в форме 'скандалы-интриги-расследования' ?
Чего вы хотели добиться?

Ответить
Развернуть ветку
Арсен Боровинский
Автор

Если вы все еще реверсите PDF, то больше надо. Не благодарите: https://opensource.adobe.com/dc-acrobat-sdk-docs/standards/pdfstandards/pdf/PDF32000_2008.pdf

PDF является стандартом ISO, вот пример новости про PDF2.0: https://www.iso.org/ru/news/ref2608.html

Да, в PDF нет слоев, поэтому когда в нем надо отсканированный документ отправить с распознанным текстом, вначале выводится текст, а потом сверху накладывается оцифрованное изображение. Я более скажу, не все знают, но в PDF слов нет! Буквы есть, слов нет как объекта. Мне можно не рассказывать про PDF, эту статью я написал: https://elibsystem.ru/node/186.

PDF с формами с самого начала ориентирован на использование инфраструктуры Adobe. Если вы делаете сами софт, используйте HTML-формы и не используйте PDF для отправки форм. Да, те программы что рендерят PDF в изображения очевидно не могут на изображении сделать рабочую форму (еще поди и с ecmascript надо?). Ну и да, видео и 3Д в PDF тоже в опенсорсных библиотеках не отображается. Не устраивает? Ну так не используйте для интерактива PDF. А если заказчику надо PDF с интерактивом и чтобы не от Adobe, пусть платит сотни миллионов и 5-10 лет на разработку ПО, которое будет работать по его хотелкам.

Аргумент про 44 ФЗ не работает. Сходите, статистику посмотрите на сколько процентов снижается начальная цена контракта и сколько процентов закупок не состоялось из-за заявки единственного поставщика (что в большинстве случаев означает сговор заказчика и поставщика) так как надо 3 КП для обоснования цены контракта и те двое, кто представляют КП и знают условия конкурса, почему-то потом на конкурс не заявляются.

Про проверки - мысль интересная, что 44 ФЗ уничтожил коррупцию в госорганах, но вряд ли имеющая отношение к реальности. Проверки есть, да. Но конечно они не могут все найти, так как надо довольно высокую квалификацию иметь и многое знать именно в проверяемой отрасли, а по факту это не так.

Ответить
Развернуть ветку
Alex Chernyshev

Арсен, еще раз:
если вы считаете себя профессионалом и экспертом - берите и делайте, ваше счастье в ваших руках.
Тратить время на срачи на форумах вот вам точно ни к чему.

Демку что вы показали надо еще пилить и пилить, займитесь делом и станет хорошо - хоть завидовать чужим миллионам перестанете.

Повторяю: потенциал в этом есть, большой. Уж точно больше очередного телеграм-бота или сервиса для йоги.

Про открытие PDF не знал, насколько это совпадает с реальностью по использованию, с учетом даты 2008й год в документе - надо копать, но мне лично пока не актуально.

Ответить
Развернуть ветку
Арсен Боровинский
Автор

Ну кто видит потенциал, тот пусть и инвестирует в разработку PDF-библиотеки, а потом пусть попытается её продавать при наличии бесплатных опенсорсных аналогов. Лично я в этом потенциала не вижу и считаю необходимым от PDF уходить как слишком плохо пригодного для веба формата, который должен вытеснить HTML.

С тезисом, что это нормально, что государство заваливает очередной проект, тратя значительные средства в то, что плохо работает, а кому не нравится, тот просто завидует заработавшим на государстве миллионы и пусть такой пойдет заработать денег и все пройдет - я не согласен. Но да, по этому вопросу не вижу смысла дискутировать. Пусть каждый останется при своем.

Ответить
Развернуть ветку
Alex Chernyshev

Дело не в наличии бесплатных аналогов, что толку от них если их авторов и саму разработку нельзя контролировать?
А вот иметь такую разработку внутри РФ, полностью свою, с авторами которые здесь же живут, которые могут обеспечить поддержку и доработку - очень дорогого стоит.

Я бы вам посоветовал пообщаться с компаниями-интеграторами типа Ланита, Редсофта - у кого много гос.проектов, думаю они вполне бы помогли с финансированием такой разработки.

Ответить
Развернуть ветку
Арсен Боровинский
Автор

А что значит "контролировать"? PDF - внешний стандарт, сколько рендереров ни пиши к нему, ты все равно можешь только решить реализовывать ту или иную фичу из стандарта и в каком порядке, вот и весь выбор. Ну там какие интерфейсы к библиотеке прикрутить по формированию PDF, не более.

Если будет независимая экспертиза на тему безопасности ПО, так и все равно свой закрытый код или открытый с помощью нее проходить. Надо только понимать что написано, чтобы ответить на вопросы эксперта.

Развивать ПО можно через коммиты в основную ветку. С Poppler и PDFBox это наверняка пройдет, с pdfium не знаю, наверное тоже. С ghostscript/mupdf скорее всего нет. Если будешь пользовать библиотеку достаточно глубоко, то со временем накопишь по ней экспертизу, сможешь исправления делать.

Если твои изменения в основную ветку не берут, делаешь форк и время от времени сливаешься с основной веткой.

Это определенно лучше создания всего своего с нуля и с точки зрения начальных затрат и с точки зрения того, что ты не один будешь пилить, а с сообществом, которое и баги поможет находить и коммиты будет делать.

По поводу куда развиваться, у меня вообще много идей и они интереснее платной отечественной библиотеки PDF -). Проблема собственно не в недостатке идей, а в выборе наиболее перспективной.

Ответить
Развернуть ветку
Alex Chernyshev

Это значит что вы не начнете вставлять политические лозунги поперек отображаемой страницы, как это уже неоднократно было с опенсорсными продуктами.

Что не внедрите какой-то вредоносный код банально за оплату, зная до вас не добраться.

Даже коммерческим компаниям это важно, не говоря уж о госсекторе.

Коммьюнити - дело добровольное, это вокруг торрентов народ запросто объединяется, с реальными делами все несколько сложнее.

Самое лучшее вам это довести читалку до какого-то рабочего состояния, чтобы не было очевидных детских багов и банально сделать пилотное внедрение с кем-то из интеграторов.
Соберете фидбек от реального применения, станет понятен масштаб проблемы.

Ответить
Развернуть ветку
Арсен Боровинский
Автор

Ну пройти экспертизу на безопасность ПО некоторой версии, дальше все изменения сливаешь после ручного аудита. Писать все с нуля здесь совершенно не нужно. А даже если и напишешь, то все равно тебе без независимой экспертизы на безопасность никто не поверит, что твое ПО безопасное.

То есть для безопасности я все-таки вижу принципиальный вопрос аудита, а не то, кто код написал.

Если говорить именно про PDF, то его финансируют либо крупные компании (по видимому как происходит с PDFBox), либо какая-то компания развивает и продает платную версию для принтеров (как с ghostscript/mupdf). Эти компании форматировать диски россиянам не будут, так как это сразу все их инвестиции в ПО помножат на ноль. Ни одна компания потом не купит софт, разработчики которого уже умышленно делали уничтожающие данные закладки.

Может быть неприятность как с проникновением зловреда через внешние зависимости, ну тут да, аудит изменений и все такое будет более выигрышной стратегией, как мне кажется. То есть защита должна быть адекватна угрозе.

Ответить
Развернуть ветку
Alex Chernyshev

'То есть для безопасности я все-таки вижу принципиальный вопрос аудита, а не то, кто код написал.'

Сил никаких не хватит на такой аудит, в опенсорсе же миллионы строк. Уж молчу про соответствие исходного кода и бинарной сборки.
Поэтому разбираются все 'по факту' а не сразу, увы.

'Эти компании форматировать диски россиянам не будут'
Есть примеры с отключением телеметрии, отзыве лицензий, отключении личных кабинетов и тд и тп.
Cisco,IBM,Oracle,Microsoft,HP - сложно найти кто из крупных вендоров еще в этом не замазался.

Если вы вдруг не заметили то новости индустрии стали напоминать сводки боевых действий и хорошего в этом ничего нет.

Ответить
Развернуть ветку
Арсен Боровинский
Автор

Ну таки написать свой код определенно дороже прохождения его аудита, особенно если код сложный, как в случае с PDF.

Да, кабинеты блокируют и покупка коммерческой версии mupdf сейчас выглядит рискованным вложением, в то же время доступ к открытому ПО вряд ли удастся так просто перекрыть без опускания железного занавеса, поэтому использование открытого софта пока еще выглядит вполне допустимой стратегией.

Там же где высокие требования к безопасности и требуется сертификация софта, там аудит и так и этак проходить вне зависимости от того, сам писал код или открытый взят.

Ответить
Развернуть ветку
92 комментария
Раскрывать всегда