реклама
разместить

Разработчик создал инструмент Depix, который восстанавливает «пиксельный» текст в документах и скриншотах

Алгоритм подбирает похожие блоки пикселей по алфавиту и воссоздает по ним исходное изображение. Поэтому лучше удалять личные данные на скриншотах или прятать под несколькими черными плашками.

Иногда требуется отправить скриншот, на котором есть личные данные: пароли или данные банковской карты. Чтобы скрыть лишнюю информацию, компании и пользователи размывают или пикселизируют информацию, а не закрашивают её.

Теперь это может быть небезопасно. Специалист по информационной безопасности Сипке Меллема разработал инструмент на базе Python, позволяющий восстановить пикселизованный текст на изображении и опубликовал его на Github.

Сверху вниз: пикселизированный текст, восстановленный и оригинальный
Сверху вниз: пикселизированный текст, восстановленный и оригинальный

Что делает Depix

Обычно изображение пикселизируют с помощью блочного фильтра. Он делит изображение на прямоугольники и усредняет цвет пикселей.

Фильтр разбивает картинку на области и перезаписывает данные о пикселях в каждой
Фильтр разбивает картинку на области и перезаписывает данные о пикселях в каждой

Два расположенных рядом символа будут одинаково пикселизироваться на разных изображениях, а значит, их можно расшифровать. Чтобы восстановить номер банковской карты, нужно сгенерировать все возможные номера банковских карт, пикселизировать их и затем сравнить результат с нужной картой.

На входе Depix получает пикселизированное изображение (то, на которое нужно расшифровать) и алфавит, набранный похожим шрифтом. Затем алгоритм пикселизирует алфавит и ищет совпадающие блоки пикселей.

В качестве алфавита Depix использует последовательность де Брёйна: в ней уникальна любая комбинация символов.

Так выглядит последовательность де Брёйна
Так выглядит последовательность де Брёйна

Сначала алгоритм находит один совпадающий блок, а затем подбирает похожие соседние блоки, которые находятся на том же расстоянии, что и на исходном изображении.

Разработчик создал инструмент Depix, который восстанавливает «пиксельный» текст в документах и скриншотах

Каждый совпадающий блок помечается как «правильный». Подбор идет до тех пор, пока у «правильных» блоков не будет новых геометрических совпадений. После выводится результат.

Для блоков с несколькими совпадениями алгоритм выведет средние значения.

Разработчик создал инструмент Depix, который восстанавливает «пиксельный» текст в документах и скриншотах

Как воспользоваться Depix

  • Установить Python.
  • Скачать Depix (Code → Download .zip).
  • Вырезать прямоугольный пикселизированный кусок из нужного изображения.
  • Сгенерировать последовательность де Брёйна с предполагаемыми символами и создать файл с теми же настройками шрифта, что и в пикселизованном фрагменте (размер, цвет, шрифт, цветовая модель HSL).
  • Сделать скриншот последовательности де Брёйна, по возможности — тем же инструментом, которым создавался пикселизованный текст.
  • Запустить в Python код python depix.py -p [название пикселизированного куска изображения] -s [образец алфавита] -o output.png
  • Готовый результат будет в изображении output.png

Чтобы было проще разобраться в работе алгоритма, автор приводит готовый пример строки. Его можно запустить сразу после скачивания Depix и посмотреть в работе.

python depix.py -p images/testimages/testimage3_pixels.png -s images/searchimages/debruinseq_notepad_Windows10_closeAndSpaced.png -o output.png

Как защитить изображения

Меллема рекомендует полностью удалять конфиденциальную информацию из изображений, а не пользоваться графическими редакторами для размытия или пикселизации.

Алгоритмы восстановления хотя бы частично, но могут распознать текст, и в будущем методы будут только совершенствоваться.

6262
реклама
разместить
8 комментариев

Комментарий недоступен

8

«Ты пид*ор»? Ну блин

10

А как же... просвет чёрной плашки через контрастность?

Если вы про замазывание данных через встроенный редактор iPhone — там есть хитрость. Стандартно прозрачность всех инструментов меньше 100%, поэтому можно покопаться в фотошопе и отрегулировать параметры так, чтобы прочитать замазанное. 

7

Комментарий недоступен

2

Комментарий недоступен

Кто вообще так замазывает? Обычно просто одним цветом закрашивают 

Жители домов от застройщика ПИК остались без интернета из-за DDoS-атаки на единственного провайдера

Кроме того, не работает связь, а жильцы не могут открыть двери подъездов и попасть к себе домой.

2626
44
33
11
Цифровое рабство 21 века. Куда смотрит фас. Это позор конечно. Карманные УК гоняют других провайдеров. )
реклама
разместить
Альфа-банк ответит за убытки клиента

Верховный суд рассмотрел спор о взыскании убытков с банка за неисполнение поручения клиента.

Альфа-банк ответит за убытки клиента
3434
99
44
Триггерные рассылки: как они помогают продавать без менеджеров
Триггерные рассылки: как они помогают продавать без менеджеров

Здравствуйте! На связи Виктория — контент-менеджер компании Altcraft. В этой статье разберём, как триггерные рассылки помогают бизнесу оптимизировать коммуникацию, чем отличаются от массовых email-кампаний и могут ли заменить функции менеджеров по продажам.

Правительство разрешило добывать криптовалюту в регионах, где введён запрет на майнинг — но генерировать электричество надо самим

Майнинг запрещён в 13 регионах России.

Источник: Thegeekpub
1818
День 1123: российские застройщики начали привлекать рабочих из Индии

Собираем новости, события и мнения о рынках, банках и реакциях компаний.

Источник: DR
1616
22
22
11
Все лишь бы не поднимать зарплату для местных )
LinkedIn — не просто соцсеть для бизнеса. Это золотая жила для тех, кто умеет копать глубже (а ИИ умеет)

Линкедин — это не просто платформа, где все публикуют резюме, ищут сотрудников или хвастаются офисными кактусами. Это гигантская база данных, где каждый профиль — открытая дверь для холодных, но горячих сделок.

LinkedIn — не просто соцсеть для бизнеса. Это золотая жила для тех, кто умеет копать глубже (а ИИ умеет)
77
33
11
Как эмигранты портят себе жизнь: 5 главных ошибок.
Как эмигранты портят себе жизнь: 5 главных ошибок.
130 лет мы писали сценарии, снимали людей и монтировали, пока не пришла нейросеть

Первый кадр фильма показывает человека с плакатом, протестующего против пришельцев. Этот репортаж прямо с улицы, мы прямо на пикете.

1414
33
11
11
"Главный ресурс 21-ого века" На чем люди зарабатывают миллионы?

Ну создаст человек бизнес, наймет тонну сотрудников, а клиентов все равно нет. В чем проблема? Ответ: отсутствие человеческого внимания к вашей компании. Да, именно внимание людей сделает тебя финансово-независимым. В этой статье я хочу рассказать все о том, почему внимание человека - это важнейший ресурс нашего времени.

"Главный ресурс 21-ого века" На чем люди зарабатывают миллионы?
55
реклама
разместить
Китайская Baidu оказалась в центре скандала — 13-летняя дочь топ-менеджера «сливала» данные пользователей, которые критиковали корейскую поп-звезду

Компанию заподозрили в нарушении конфиденциальности данных.

Источник фото: Kr Asia
2727
99
55
22
22
Дочь совсем уже *@%*&. Думает что она типо крутая может что-то. Не понравилось ей что-то. Да пошла ты *****
Почему [ НЕ ] стоит внедрять AI в отдел продаж? 5 весомых причин

Все сейчас говорят, что нужно внедрять AI в отдел продаж и в целом в бизнес. Я же написал 5 причин, почему не стоит внедрять их и работать спокойно

Почему [ НЕ ] стоит внедрять AI в отдел продаж? 5 весомых причин
33
33
22
22
Пошаговый гайд по созданию лендинга с помощью AI

________________
Время создания сайта: 40 минут
Стоимость: 1000 руб
________________

▪— Планирование и структура
▪— Генерация сайта в Durable
▪— Наполнение контентом
▪— Кастомизация
▪— Публикация сайта

Пошаговый гайд по созданию лендинга с помощью AI
4343
1313
99
11
[]