CheckCV — сервис оценки резюме на основе AI
Попытка стать Grammarly на рынке проверки резюме. Сервис успел эволюционировать из ручной проверки в проверку на основе нейронных сетей и даже обзавестись версией бота в Telegram.
Преамбула
В начале прошлого года у меня была попытка создать сервис проверки резюме на основе ручной оценки каждого резюме экспертами. Сервис был бесплатным (по крайней мере именно оценка резюме проводилась бесплатно) и за короткий срок пришло неимоверное количество резюме.
Мы никак не привлекали траффик - были только пост на vc и в канале "Золото Бородача". С таким потоком за бесплатно мы не могли справиться. К сожалению, только за первую неделю удалось обработать около 80 резюме. Много пользователей присылало резюме на английском, что тоже немного усложняло работу. Обработку всех резюме в тот раз мы так и не успели закончить - это оказалось совершенно непосильно.
Но после работы с резюме родилась идея научиться делать это автоматически - база резюме у нас уже была, оставалось только обучить модель, сделать лейблирование "хороших" и "плохих" резюме и добавить к этому веб-интерфейс. Разработка сервиса заняла несколько недель, благо на рынке open-source решений оказалось достаточно, нужно было только обучить модель.
Функции сервиса
На данный момент сервис работает более-менее с резюме на английском - checkcv.info и выводит общюю оценку и параметры, которые алгоритм смог найти в резюме для своей работы.
Сайт с сервисом был суперпозитивно встречен на PH и почти удалось влететь в топ-10 продуктов дня :)
Сервис поддерживает на данный момент 2 формата - PDF и docx.
Работает сервис только с англоязычными версиями резюме и может быть полезен тем, кто хочет попробовать себя в работе с зарубежными компаниями.
Телеграм бот
Недавно выпустили телеграм-бота, который выводит чуть побольше информации, но работает только с PDF-версией резюме
Нужно просто отправить боту pdf-версию резюме и дождаться результата проверки.
Пока что к рейтингу не стоит относиться серьезно, база резюме составляет порядка 5000 резюме разных профессий, так же алгоритим требует доработок (всё это в планах на этот год!).
Дальнейшие планы
Как было написано в заголовке - хочется стать Grammarly, но только для создания резюме, для этого мы работаем над созданием редактора, который в режиме реального времени подсказывает как можно улучшить резюме.
По факту механизм работы будет очень похож на тот же Grammarly - будут подсказки, что можно заменить, как можно заменить, так же будет показана общая оценка резюме.
Релиз данного сервиса планируется в этом году, если интересно - подписывайтесь на канал
там в ближайшее время будут появляться новости о новых сервисах.
Так же в сам CheckCV хочется добавить поддержку русского языка в резюме, новая модель пока что наполняется данными (чего уж скрывать, ваше резюме скорее всего попадет в обучающую выборку алгоритма и сделает его только лучше).
Все сервисы на данный момент бесплатные
Бонус
Первым 10 пользователям, которые отправят резюме в сервисы на английском языке будет предоставлена расширенная версия обзора резюме.
Также много вопросов по разработке, которая здесь совершенно не представлена.
Что является целью?? Что значит плохое или хорошее резюме??
Откуда датасеты и чья разметка?? Релевантность разметки??
Критерии оценки??
Наверное ведь должны выявляться признаки, по которым производится оценка.
+ Оценка для кого?? Соискателей или hr-ов??
Если соискателей, то это одно.
Если hr-ов, то там море вопросов.
Да и вообще море вопросов. В целом мало что понятно и суть сервиса в разных смыслах не раскрыта.
на данный момент - сервис для соискателей, не для HR-ов. Про признаки писал в одном из комментариев выше.
Датасеты - резюме отправленные в сервис + набор резюме в открытых источниках (есть много групп в linkedin и facebook, где кандидаты выкладывают свое резюме в открытый доступ для получения фидбека).
Если честно, для меня сомнительно, что у вас есть нейронная сеть, которая оценивает по указанным вами признакам.
Как минимум это должен быть ансамбль нейронных сетей, в котором каждая нейронная сеть оценивает резюме со своей стороны. Одна нейронная сеть - один признак.
Парсинг данных, подготовка, обработка нейронными сетями всё это занимает время.
Я сомневаюсь, что у вас есть что-то сложнее простенькой сети.
Более того, вы так и не ответили по поводу датасетов. Линкедин вообще заблокирован.
У вас есть поле признаков, которое вы рассчитываете для каждого резюме, а потом по нему выдаёте консолидированное значение.
Как вы получаете это значение?? Среднее арифметическое?? Что вообще оно означает??
В общем, нужно смотреть вашу методику. Выглядит какой-то полной дичью.
Я могу понять, когда оцениваются разделы. И как минимум понятны разделы требующие доработки.
Но у вас всё слишком странно. Да и пишите вы слишком поверхностно.
Ну, зайти на linkedin не так то и сложно
LinkedIn в России заблокирован. Так что, зайти сложно.
ну вот я зашел и нужные мне данные получил, если у вас не получается, то попробуйте через VPN
Комментарий недоступен
VPN и наличие дома - разные штуки
Я вам про данные писал не с точки зрения того, чтобы зайти. А с точки зрения адекватности датасетов и релевантности разметок.
Банально, в идеале резюме пишется пож вакансию. И ставится соответствие резюме, опыта, квалификации и прочего у человека вакансии компании.
Сформировать датасет, это не тупо надергать данных.
Уже несколько лет сидим на vpn, а вы не вкурсе? Вы видно не из it, раз такие мелочи не понимаете
Ну сидите вы, и дальше что?? Мне вас с этим поздравить??
Кто вас обидел? Я не пью и не курю и на диване меня редко увидишь!
Причём здесь обида?? Я говорю как есть.
Есть поговорка, у кого что болит, тот о том и говорит. У вас видимо проблемы с диваном и пивом, и вы видимо человек опытный в этом вопросе, раз с этой вершины проводите сравнение.
И я вас с этим поздравляю. Вы 100% идете к успеху, и я не буду этому мешать
Всего наилучшего.
Разметку датасета делал я и несколько HR-ов. Все найденные резюме вначале прогонялись через сервис обнаружения ключевых слов в резюме и других параметров.
Далее под определенный набор ключевых слов, которые встречаются чаще всего для определенной позиции берутся резюме и им проставляется рейтинг вручную.
Примерно в таком формате:
index name full_name education_years work_years score
Ну, а дальше уже происходит обучение модели, валидация и прочее.
У вас происходит сравнение резюме для какой позиции??
скорее не с позицией, а с похожим набором скиллов
Знаете, я понял. Вы даже не понимаете что пишите чушь. Всего вам доброго и успехов в развитии проекта.
хорошего вам вечера
Чего бомбишь-то? Люди делают проект, а не на диване с пивасиком экспертничают.
Вам виднее, вы видимо опытный. Не то, что мы, здоровые и активные люди.