Держаться, Корней: как работает наш бот по поиску происхождения фамилий

В прошлый раз мы рассказывали о том, как попытаться найти онлайн то, откуда есть пошла фамилия того или иного человека. С нами были Иванов, Петров, Сидоров, Уперяка и многие другие удивительные имена и открытия.

Источник: https://family-tradition.ru/
Источник: https://family-tradition.ru/

В нашем сервисе по сохранению семейной истории Nasledie.digital мы закономерно задумались о собственном инструменте, который бы позволил любому человеку найти свою фамилию. В итоге мы создали телеграмного бота, который умеет находить запрашиваемые фамилии в составленной нами базе данных и выдавать по ним справки заранее установленного образца. Как он ищет и как выглядят эти справки, рассказываем в нашей статье.

Работа бота

Телеграм-бот Nasledie по основной своей специализации занимается тем, что ищет фамилии в той базе данных, которую мы ему создали. Сам чат-бот создан по традиции на Python, а привязана к нему база данных, написанная на MySQL. Всё как у людей.

Следуй за белым кроликом, узнай происхождение своей фамилии.
Следуй за белым кроликом, узнай происхождение своей фамилии.

В этой базе данных хранятся короткие справки о всех описанных нами фамилиях.

Эти справки поступают в базу данных из большой гуглотаблицы, где они пишутся как выжимки из словарных описаний фамилий, которые приведены там же. Первые описания мы брали из списка 500 наиболее частотных фамилий, составленных известным лингвистом Анатолием Журавлёвым, и потом дополняли их из других источников, но об этом чуть позже.

Начинает бот свою работу как большинство других своих собратьев: получает запрос и послушно тащит его в базу данных и ищет там данные для этого запроса.

Да

Если данные имеются, то бот возвращается со справкой, в которой рассказывает о происхождении фамилии, о её распространённости и об известных людях, носивших эту фамилию. Да, статистику распространённости той или иной фамилии мы брали с упомянутого в прошлой статье портала Forebears.

Иванова, Петрова и Сидорова мы всё-таки в качестве примера приводить не стали.
Иванова, Петрова и Сидорова мы всё-таки в качестве примера приводить не стали.

Однако справка это краткая, содержащая самую основную информацию по той или иной фамилии. Поэтому бот дополнительно предлагает заказать сертификат по этой фамилии, где её происхождение, особенности, распространённость и прочие носители будут расписаны уже более подробно. Как выглядит сертификат, он тоже показывает.

Нет

Если же данных для бота в таблице не находится, то он предлагает вернуться через пять дней и попробовать ввести запрос снова. В это время запрос по фамилии, которой в базе нет, автоматически попадает в гугл-таблицу и оттуда передаётся специалистам, которые работают со словарями. После проведённое исследование в виде короткой справки загружается в базу MySQL, и на повторный запрос бот уже радостно несёт свежую информацию по новой фамилии.

Добавим ещё, что бот по простоте душевной воспринимает любой запрос к нему как фамилию.
Добавим ещё, что бот по простоте душевной воспринимает любой запрос к нему как фамилию.

Где искать?

Для создания таблицы нам пришлось от души припасть к ономастике — той части языковых наук, которая занимается именами. Вначале, как мы уже немного рассказали выше, мы воспользовались известным списком из 500 наиболее распространённых в России фамилий, составленных советским и русским лингвистом, специалистом в области славянского языкознания Анатолием Журавлёвым.

Однако сразу же стало очевидным, что этого списка нам не хватит — действительно, вряд ли ботом будут пользоваться только обладатели самых популярных фамилий. Поэтому мы выделили несколько общепризнанных источников — словарей русских имён и фамилий, благо что большинство из них доступно в сети и обработали их. В некоторых случаях, правда, пришлось эти источники вытаскивать из pdf-формата, чтобы бот ими не подавился.

Разумеется, стопроцентную гарантию значения фамилии мы дать не можем — как не может её дать практически никто, кроме тех сообществ, где эта фамилия появилась, но они уже основательно скрыты в глубинах столетий. Любая этимологическая словарная статья строится на предположениях и гипотезах. Это необходимо держать в голове всякий раз, связываясь со словами и их значениями.

Словарь Никонова

Словарь русских фамилий от учёного-самоучки? Звучит подозрительно, и где-то из-за угла посмеивается Михаил Михалыч наш Задорнов, возвещая о том, что все языки пошли от русского языка. Однако нет: Владимир Андреевич Никонов — один из крупнейших мировых учёных в области науки об именах. Образования систематического он не получил, ибо в школу его приёмная мать не отдала, «чтоб мальчишки не испортили», а потом и вовсе революция случилась.

«Словарь русских фамилий» — труд поистине огромный для одного человека. Статистические подсчёты и исследования учёного охватили миллионы человек, описывая существование фамилий не только самих по себе, но и с привязкой к географии распространения этих фамилий. В общем, труд классический, надёжный и интересный. Хорошо, что бот просто ищет конкретную фамилию и не зависает на попутных именах — иначе бы он справку выдавал сильно позже, чем за секунду времени.

Популярный этимологический словарь

По названию становится кристально ясно, что словарь в научные дебри с мачете не углубляется, а доносит любопытные сведения своим читателям простым языком. Здесь можно найти более 2500 фамилий — от самых распространённых до самых неочевидных. Впрочем, Уперяки из нашей прошлой статьи тут нет.

Однако словарь не только рассказывает истории об именах – он также знакомит интересующихся с самим принципом формирования русских фамилий. После этого предисловия, например, станет ясно, почему фамилия Юровский вовсе и не образована напрямую от имени Юрий. А потому что суффикс!

Ономастикон

«Ономастикон. Древнерусские имена, прозвища и фамилии» — ещё один труд, на основе которого мы создавали нашу базу данных. Написал этот словарь известный учёный Степан Борисович Веселовский, который по основному занятию своему был историк — например, он писал об опричнине и об азартных играх как источнике дохода Московского государства.

Если предыдущие два словаря довольно легко читать человеку неподготовленному — поскольку они и созданы были для такого читателя – то «Ономастикон» скорее предназначен для историков. В словарных статьях здесь перечисляются не только возможные значения фамилий — например, что «баклан» это не обязательно «дурак» в переносном значении, но и морской ворон, и чурбан, и вообще верша из ивовых прутьев — но и те, кто в старинных документах Древней Руси носили такие прозвища. Ибо, как известно, прозвища появились сильно раньше фамилий.

Мультифора, поребрик и другие

Использовали и используем мы, разумеется, и другие источники — не только узкоспециализированные словари имён и фамилий, но и этимологические словари в принципе. В основном, из классического набора — Этимологический словарь русского языка Макса Фасмера, Этимологический словарь славянских языков, который обширен настолько, что всё ещё выпускается, а также множество региональных словарей. Что логично: разница в использовании слов в разных регионах России вовсе не ограничивается поребриком и бордюром, парадной и подъездом, файлом и мультифорой.

Не только лишь все фамилии

Наш бот — это наш виртуальный помощник. На самом деле он не только ищет фамилии, но и занят многими другими вещами — например, рассказывает о Nasledie.digital, о цифровой капсуле времени и вообще выдаёт всяческую информацию о нашей деятельности. Но полезен он не только этим.

Вот что предлагает наш бот по части ответов на самые частотные вопросы.
Вот что предлагает наш бот по части ответов на самые частотные вопросы.

Например, он хранит ответы на самые частые вопросы, которые касаются сохранения семейной истории — от маркировки семейных фото и видео до поиска родственников хоть в архивах, хоть за границей.

Информацию бот выдаёт порционно, чтобы её удобно было просматривать с экрана смартфона.

Держаться, Корней: как работает наш бот по поиску происхождения фамилий

Однако он может предложить скачать инструкцию — к примеру, о том, как начать поиск своих предков. Этот вопрос действительно ставит в тупик многих, кто только начинает интересоваться своей семейной историей и не привык работать с историческими источниками.

Кроме этой инструкции, у бота в запасе есть гайды по маркированию семейных фото и видео, организации архивов — как бумажных, так и электронных, по поиску пропавших родственников и многое другое. Эти инструкции полезны не только с точки зрения семейной истории, но и со стороны организации и поиска информации в принципе.

Наш бот рад всем фамилиям и готов предоставить свои справки, исследования и гайды всем, кто интересуется Цифровой капсулой времени. И работой разнообразных ботов тоже, разумеется.

33
4 комментария

Очень интересно, я давно хочу узнать историю своего рода. Но кажется, что уже никак не узнать, и не проверить

1
Ответить

Спасибо, Ирэн! Наш бот может предложить вам инструкцию, с чего начать поиск родственников и как собрать историю своей семьи. В любом случае – удачных поисков!

Ответить

Че то разводиловом пахнуло

Ответить

Добрый день. Мы лишь создали инструмент, который упрощает всем интересующимся поиск происхождения своей фамилии. Данные пользователей мы ни в коем случае не собираем. Попробуйте использовать нашего бота и узнаете сами :)

Ответить