Технологические тренды дейтинга: как нейросети и машинное обучение помогают развивать индустрию

Алгоритмы совместимости и поведенческая аналитика: Twinby, Mamba и LovePlanet — о том, какие технологии помогают развивать дейтинговые сервисы.

Технологические тренды дейтинга: как нейросети и машинное обучение помогают развивать индустрию

В 2010-х годах интернет-знакомства начали набирать популярность благодаря появлению Tinder, Badoo и Bumble. Так, согласно отчёту Pew Research Center, в 2015 году 15% взрослых американцев пользовались сервисами онлайн-знакомств, что на 4% больше, чем в 2013 году. А в 2022 году в США приложениями для знакомств пользовались уже 30% совершеннолетних, при этом 53% пользователей были моложе 30, а 37% — от 30 до 49 лет.

В России похожая ситуация. Согласно исследованию Аналитического центра НАФИ, проведённому в 2023 году, 69% россиян от 18 до 35 лет хотя бы раз заходили в дейтинг-сервисы, а 25% пользовались ими на момент опроса. При этом за 2023 год уникальная месячная аудитория таких приложений выросла на 6–10%, подсчитали операторы t2 и МТС.

Также растёт и мировая выручка платных сервисов онлайн-знакомств. По данным Statista, в 2015 году она составила 1,55 $ млрд, а в 2023 году увеличилась в два раза, до 3,01 $ млрд. Вместе с ростом мирового рынка и активностью пользователей увеличивается нагрузка на серверы дейтинговых приложений, а разработчикам приходится оптимизировать архитектуру.

Мы опросили игроков российского рынка и узнали, какие технологии помогают делать сервисы онлайн-знакомств быстрее, безопаснее и удобнее для пользователей.

Тренд 1: улучшение алгоритмов совместимости

Чтобы помогать людям с общими интересами быстрее находить друг друга, сервисы знакомств совершенствуют алгоритмы совместимости. Учитывать пару совпавших факторов из анкеты, как раньше, уже недостаточно: если оба любят бегать по утрам и путешествовать, это ещё не значит, что у них получится построить отношения.

Приложение Twinby предлагает пользователям пройти психологические тесты, а исходя из ответов алгоритмы подбирают лучшую пару. Для расчёта совместимости сервис использует популярные методики, которые могут дать представление о личности потенциального партнёра. Сейчас в приложении можно пройти три адаптированных теста: Big Five («Большая пятёрка»), «Тип личности» (тест на тип личности по Майерс — Бриггс) и Attachment Style Questionnaire (теория привязанности). Чтобы улучшить завершаемость тестов, количество вопросов сократили в четыре раза. Методика адаптации, как и валидация одного из тестов, проводилась в Международной лаборатории прикладного сетевого анализа НИУ ВШЭ. Так пользователь получил лёгкую и доступную механику, а Twinby — больше данных для качественных мэтчей.

Примеры результатов теста «Большая пятёрка» и «Тип личности» 
Примеры результатов теста «Большая пятёрка» и «Тип личности» 

Twinby запустился летом 2023 года и за первый год работы привлёк более 3 млн пользователей, из-за чего нагрузка на серверы и потребности в вычислительной мощности выросли в 10 раз. Расчёт процента совместимости также сильно нагружает ленту приложения: процент высчитывается для каждого партнёра (хоть и потенциального). Чтобы обеспечить доступность и отказоустойчивость приложения, компания перенесла данные в Yandex Cloud. Сейчас на облачной платформе размещены все сервисы и базы данных Twinby.

Тренд 2: анализ вовлечённости

Дейтинг-сервисам важно улучшать UX, чтобы удерживать аудиторию. С каждым годом бороться за неё всё сложнее: появляются всё новые площадки для знакомств. В LovePlanet разработали систему, которая анализирует поведение и оценивает вовлечённость пользователей — расчётный показатель, видимый только программистам и модераторам. А для пользователей она формирует более релевантную выдачу, как во всех популярных поисковых системах: у каждого пользователя «своя» первая страница, основанная на истории поиска.

Система рассчитывает более 50 параметров, включая:

  • вероятность ответа на сообщение;
  • количество непрочитанных сообщений;
  • количество поставленных лайков;
  • успешность общения (показатели активности и взаимодействия с другими пользователями);
  • привлекательность профиля;
  • общая вовлечённость.

Так компания ограничила количество входящих сообщений для перегруженных пользователей — тех, кто получает лайков и сообщений значительно больше, чем отправляет ответов. А в поиске и рекомендациях сервис приоритизирует активных и отзывчивых. Например, количество нежелательных сообщений у популярных пользователей снизилось на 30%, а общее число успешных диалогов, в которых более 10 входящих и исходящих сообщений, выросло на 15%.

Благодаря этому улучшилось качество взаимодействия пользователей. Такой подход, во-первых, защищает пользователей от информационной перегрузки, снижает риск выгорания и помогает эффективнее взаимодействовать с сообществом. Во-вторых, для других участников повышается шанс того, что им ответят, и сообщение не затеряется в потоке.

У каждого пользователя — уникальная лента и список людей поблизости 
У каждого пользователя — уникальная лента и список людей поблизости 

Тренд 3: использование нейросетей для защиты пользователей

Помимо людей, ищущих друзей или партнёра, на сайтах знакомств регистрируются и злоумышленники. Они создают поддельные профили, чтобы обманывать людей, злоупотреблять личной информацией или получать деньги. Например, предлагают вложиться в криптовалюту, пытаются выманить компрометирующие факты о человеке или фотографии для дальнейшего шантажа, просят купить билет в театр на фишинговом сайте. Для борьбы с мошенниками дейтинговые сервисы внедряют алгоритмы для проверки фотографий и переписки.

Как анализируют фотографии

На старте проекта Mamba модерировала фотографии в профилях вручную. Аудитория росла, и делать это стало проблематично. Чтобы сократить ручной труд и ускорить процесс, разработчики подключили ML-модель. Выбирали между Yandex Cloud и зарубежными аналогами и остановились на российском решении из-за нескольких факторов:

  • высокое качество и скорость работы технологии;
  • есть опыт реализации похожих проектов для других компаний;
  • все расчёты производятся в рублях — удобно прогнозировать бюджет и нет зависимости от курса валют.

Сейчас с помощью ML-модели Яндекса Mamba проверяет 2,5 млн фотографий в профилях ежемесячно. Из них всего 15% уходит на ручную модерацию, когда нейросеть не может понять: перед ней фото этого человека или кого-то из интернета. При этом 11% фотографий автоматически распознаются как нежелательные. Ошибки составляют 2,2% на 2,5 млн фотографий. Если пользователь не согласен, он может оспорить решение через поддержку.

Некоторые из причин, по которым могут отклонить фотографию в Mamba 
Некоторые из причин, по которым могут отклонить фотографию в Mamba 

Сначала нейросеть оценивает фотографию по пяти ключевым факторам:

  • пол человека;
  • наличие на фото детей;
  • наличие на фото порнографии;
  • наличие на фото текста;
  • качество снимка.

Дополнительно модель оценивает цитируемость изображения — насколько часто оно встречается в интернете.

Модель проверяет цитируемость снимка, и если всё хорошо, определяет координаты лица и пол, а потом анализирует другие части изображения 
Модель проверяет цитируемость снимка, и если всё хорошо, определяет координаты лица и пол, а потом анализирует другие части изображения 

Как анализируют сообщения и другие тексты

Mamba с помощью ML-модели проверяет и текстовый контент, чтобы узнать, мошенник это или нет. Например, описание профиля, имя, сообщения, комментарии. Если алгоритм посчитал, что человек нарушил правила сервиса, то ему отправляется системное сообщение. Какое поведение не понравится ML-модели:

  • логин в соцсетях вместо рассказа о себе в профиле;
  • предложение лёгкого заработка;
  • приглашение купить билет в театр или кино на подставном сайте;
  • негативные комментарии.
Всем, кого алгоритмы заподозрили в нарушениях, отправляется автоматическое письмо-предупреждение 
Всем, кого алгоритмы заподозрили в нарушениях, отправляется автоматическое письмо-предупреждение 

Раньше информацию модерировали вручную после жалоб пользователей. Сейчас несколько ML-алгоритмов проверяют активность пользователя по заданным критериям, а потом оценивают его действия. За полтора года работы алгоритмы распознали более миллиона недобросовестных пользователей, ошибки составили около 1%.

Марат Гарафутдинов
CDO Mamba

Для нас главное, чтобы пользователи максимально комфортно знакомились в приложении. Мы используем собственные решения совместно с готовыми продуктами, например с ML-моделью Yandex Cloud.

Что дальше?

Начальник отдела разработки LovePlanet Анатолий Лютин выделяет три главных технологических вызова, стоящих перед индустрией дейтинга:

  • Гонка внедрения ИИ-технологий, таких как GPT. С одной стороны, дейтинговым сервисам важно улучшать пользовательский опыт, персонализировать контент и выступать помощниками для подбора идеальной пары. С другой — мошенники и спамеры активно используют GPT для генерации поддельных анкет и переписки от лица фейков.
  • Поиск баланса между монетизацией и удержанием пользователей. Стоимость внедрения новых функций постоянно растёт, расходы на оборудование и зарплаты разработчиков — тоже. Чтобы компенсировать затраты, сервисы повышают стоимость подписок, что может приводить к оттоку пользователей.
  • Адаптация к меняющимся требованиям регуляторов в области обработки персональных данных и конфиденциальности. В последние годы появились законы о работе с персональными данными, которые нужно соблюдать в том числе и дейтинговым сервисам.

Хотите узнать больше о возможностях облачных технологий для бизнеса? Подписывайтесь на телеграм-канал Yandex Cloud и будьте в курсе трендов.

Другие статьи о пользе облачных решений для компаний:

33
Начать дискуссию