Я скормил нейросети архив фото за 10 лет...
У каждого из нас есть это кладбище воспоминаний...
«Проблема: Цифровой Плюшкин»
...Я попробовал сортировать вручную. Меня хватило ровно на 15 минут
Танцы с бубном и 10 Гб боли
Попытка №1. «Я у мамы хакер» (Провал)
Я слышал, что на Python есть популярная библиотека face_recognition. Интернет говорил: «Это просто! Поставь одной командой и пользуйся».
Ага, конечно. Как только я ввел команду установки pip install face_recognition, мой Windows показал мне, кто в доме хозяин. Терминал выплюнул 40 строк кроваво-красного текста. Ошибка сборки dlib.
Гугл объяснил: библиотека dlib, на которой всё держится, написана на C++. Чтобы она заработала, моему компьютеру нужны "инструменты сборки C++".
Решение? Скачать Visual Studio Build Tools от Microsoft. Я открыл установщик и обомлел. Мне предложили выкачать 10 Гигабайт софта. Ради одного маленького скрипта для сортировки фоток!
Я скрипнул зубами, поставил на закачку и пошел пить чай. Прошел час. Установка завершилась. Я перезагрузил компьютер, затаил дыхание и... снова получил ошибку.
По отдельности ничего не получалось. Я пробовал ставить готовые колеса (wheels), менял версии, читал форумы пятилетней давности. Я убил на это весь вечер. В какой-то момент хотелось просто удалить эту чертову папку с фотографиями вместе с Питоном.
(Продолжение): Спасение и Магия
Попытка №2. Смена тактики
Я выдохнул и решил: если старый инструмент не работает, ищем новый. Я пошел гуглить и наткнулся на библиотеку DeepFace.
Это современный «комбайн» на базе TensorFlow, который под капотом использует модели от Google и Facebook, но для пользователя выглядит как одна кнопка «Сделать хорошо».
Установка заняла одну строку: pip install deepface tf-keras
И, о чудо, никаких ошибок компиляции, никаких требований поставить половину софта Microsoft. Я почувствовал, что шанс есть.
Магия кода (30 строк, которые спасли выходные)
Я адаптировал скрипт. Логика у него как у фейс-контроля в клубе: берет моё «эталонное» фото, сравнивает с фото из кучи, и если похоже — копирует в нужную папку.
Самое интересное: для эталона я специально взял свою старую фотографию, сделанную больше 10 лет назад. Это был риск. Я сильно изменился, качество фото было так себе. Я был уверен, что ИИ затупит.
Заодно я настроил скрипт так, чтобы он создавал папки с понятными русскими именами.
Вот тот самый код (можете забирать себе):
Момент истины Я запустил скрипт. Сначала побежали полоски загрузки — нейросеть скачивала свои «мозги» (веса моделей). Это выглядело масштабно. А потом... Началось.
Итоги
За час скрипт сделал то, что я откладывал 5 лет. Я открыл целевую папку и увидел идеальный порядок.
Самое крутое в автоматизации — это не только результат, а процесс, когда ты пьешь чай, а компьютер делает за тебя грязную работу.
А вы как разбираете свои фотоархивы? Храните всё подряд «на память» или безжалостно удаляете?