Программа по обезличиванию/анонимизации документов от персональных данных
Устали замазывать ФИО и реквизиты организаций в документах? Я написал приложение, которое делает это за Вас (работает офлайн) и абсолютно бесплатно.
Скачать актуальную версию программу можно в моем Telegram-канале.
Программа DOCXдодыр представляет из себя — небольшую утилиту (900 мб) для Windows и macOS, которая автоматизирует процесс анонимизации документов.
Как работает?
Приложение анализирует Ваши .docx файлы (doc не поддерживается!) и заменяет найденную конфиденциальную информацию на стандартизированные [Маркеры ввода] вроде [ФИО] или [ОГРН].
Как пользоваться?
1. Запустите приложение. Важный момент: убедитесь, что Microsoft Word на Вашем компьютере в этот момент закрыт, чтобы избежать конфликтов.
2. Перетащите .docx файлы в окно программы или выберите их через кнопку. Можно сразу несколько.
3. Дождитесь. Полоса прогресса покажет, что идет анализ. Это может занять от нескольких секунд до минуты на большой документ.
4. Готово! В той же папке, где лежат ваши оригиналы, появятся их обезличенные копии с припиской _cleaned.docx. или _cleaned.pdf. В зависимости от того какой формат Вы выберите.
Какие персональные данные обезличивает?
👤 ФИО и инициалы (Иванов Иван Иванович, Петров И.С.)
🏢 Наименования организаций (ООО "Ромашка", ПАО "Сбербанк", ИП и т.д.)
🏦 Реквизиты организации (Адрес, ИНН, ОГРН, КПП, БИК, р/с, к/с)
📞 Контактные данные (номера телефонов, email-адреса, сайты)
🛂 Паспортные данные и свидетельства о рождении
📱 Никнеймы в соцсетях (@username)
Особенности программы
Модель может ошибаться: принять редкое название компании за ФИО или, наоборот, пропустить что-то специфическое, вроде номера лицензии.
Поэтому я сделал упор на полную кастомизацию:
Огромная база исключений. В программу уже вшито более 2500 слов и фраз («Заказчик», «Исполнитель», «Российская Федерация» и т.д.), которые он не должен заменять.
⚙ Ваши собственные правила. Через меню «Настройка списков» Вы можете легко добавлять свои исключения (например, "название Вашей компании") или, наоборот, фразы для принудительной замены на [***]. Я специально сделал так, чтобы можно было открыть списки в формате .txt и вставить туда сразу большой объем данных, например, сгенерированный нейросетью.
Вы можете также выбрать какие [Маркеры ввода] необходимо обезличивать и также в [] или в \\ заключается Маркер ввода.
📄 Сохранение в PDF. Поставьте галочку, и на выходе получите не только .docx, но и готовый .pdf файл. Удобно, если нужно сразу отправить документ на проверку или загрузить в Google AI Studio для дальнейшей работы.
А что с безопасностью?
Это был мой главный приоритет.
DOCXдодыр работает на 100% офлайн. Программа не требует подключения к интернету, не отправляет Ваши документы или их части ни на какие серверы. Все данные обрабатываются исключительно на вашем компьютере. Информация из документов никуда не утечет.
Совместимость
Версия для macOS должна работать на большинстве современных систем, начиная с Ventura. Версия для Windows также максимально универсальна.
Где скачать?
Скачать актуальную версию программу можно в моем Telegram-канале. Там можно задать вопрос, предложить идею или сообщить об ошибке.
Буду невероятно рад вашим отзывам и предложениям прямо здесь, в комментариях на VC. Если же приложение оказалось для Вас действительно полезным и сэкономило кучу времени, Вы можете поддержать проект через кнопку «Поддержать автора» в самой программе. Это очень мотивирует на дальнейшую разработку!