Яндекс
8343

«Помогите найти фильм» — пробуем алгоритмы «Яндекса», чтобы закрыть болезненный вопрос

Тестируем алгоритмы и выдачу поисковой системы на примерах запросов по поиску кинофильмов.

В закладки

Многим знакома ситуация: видели фильм много лет назад, но запомнились лишь отдельные кадры, персонажи или сюжетные линии. Найти фильм целиком по случайным деталям, если не помнишь ни названия, ни режиссёра, ни актёров, очень трудно.

Сотрудники vc.ru решили провести эксперимент и проверить, как работает поиск «Яндекса» по разным запросам. Мы попросили друзей поделиться обрывками воспоминаний о фильмах. И попробовали найти эти видео через «Яндекс».

Ищем фильм по одному эпизоду

Как-то видела фильм по телевизору, комедию. Давно уже, лет 10 назад, если не больше. Там еще колокол упал на монашку. Вроде и чушь, но раньше смотрела такое после работы для разгрузки мозгов.

Валентина
Смотрела комедию и не запомнила название

По запросу «фильм где колокол упал на монашку» находится английская комедия 1990 года «Монахини в бегах» (Nuns On The Run, встречается перевод названия «Монашки в бегах»). Совпадает и сюжет, и жанр, и эпоха (фильм 30-летней давности вполне мог идти по телевизору «лет 10 назад, если не больше»).

Еще один фильм, который подходит под этот запрос — «Три балбеса». Это кино не про монашек, так что результат не такой явный, зато в нём есть похожий эпизод: как раз с колоколом. Остаётся только решить, какой из фильмов больше соответствует воспоминаниям, а ещё лучше — посмотреть оба, потому что они явно подходят под описание и точно относятся к комедиям.

Часто люди обращаются к «Яндексу», чтобы найти фильм, название которого вылетело из головы. Описывают сюжет, запомнившиеся сцены, яркие детали: за 2017–2019 годы было сделано более 30 миллионов таких запросов, в которых встречались формулировки типа «фильм в котором» или «триллер где».

Уровень развития Поиска на данный момент позволяет искать и достаточно успешно находить информацию даже по неявным запросам. Это стало возможным благодаря применению нейронных сетей на все более и более ранних этапах ранжирования данных, а также серьезным изменениям в архитектуре для экономии ресурсов и сокращения времени поиска.

Впереди еще много работы, иногда мы сталкиваемся с определенным количеством запросов, найти ответ на которые не представляется возможным. Например, [фильм в котором змея молилась вместе с человеком]. Совершенно неясно, что за фильм имеется в виду, хотя до сих пор очень интересно. Или [комедия в которой как правило не наблюдается никакого смысла]. Чтобы свести количество таких случаем к минимуму, мы продолжаем обучать нейросети, тренируем выявлять неявные закономерности в порядке слов и их взаимном расположении, смысловую схожесть текстов на разных языках.

Андрей Данильченко
Отвечает за качество объектного поиска в Яндексе

Ищем фильм по основной интриге

Фильм, в котором люди становятся карликами. Видела пару лет назад краем глаза, даже актёры знакомые, «звёзды», но я не помню, как их всех зовут — у меня плохая память на имена.

Женя
Не помнит, как зовут актёров

Вбиваем в поисковик.

Первым результатом идёт ссылка на фильм 2017 года «Короче» (Downsizing) режиссёра Александра Пэйна. По сюжету, учёные решают сделать население земного шара карликами и решить тем самым проблему с перенаселением планеты. Главные роли в картине исполнили Мэтт Дэймон, Кристоф Вальц и Хонг Чау.

В аннотации к фильму слова «карлики» нет, но он занимает первую позицию в выдаче, а его содержание полностью соответствует запросу. Такое точное попадание возможно, потому что поисковые системы постоянно улучшаются: специалисты используют всё большие массивы данных, обучают нейросети, тестируют разные способы контроля качества. С 2014 года документы аннотируются характерными запросами. К примеру, для популярного сериала Breaking Bad одной из аннотаций станет запрос [американский сериал про то как варят метамфетамин].

Если у двух запросов множество общих слов, то велика вероятность того, что результаты первого будут подходить и второму. Если же выдача совпадает у совершенно разных запросов, нейросеть берёт во внимание историю поиска. Когда таких статистических данных недостаточно, эффективно работает контент-анализ с помощью нейросетей.

Ищем фильм по характеристике героя

Фильм, в котором девушка подглядывала за чужими жизнями. Новый, судя по картинке. Смотрели вдвоём с подругой, но не досмотрели до конца. В общем, до сих пор интересно, чем там все закончилось.

Алексей
Прервался на середине фильма

В результатах поиска мы видим такие фильмы, как «Подглядывающий», «По ту сторону двери», «Боже мой, как низко я пала!», «Кожа, в которой я живу». Но первый и самый новый фильм в подборке — «Девушка-невидимка» Клаудии Майерс. Скорее всего, Алексей с подругой смотрел именно его, если судить по году выхода — 2019.

Яндекс предлагает и другие варианты фильмов, которые могут подходит под запрос. Тот или не тот фильм — можно определиться, посмотрев трейлер прямо на странице поисковой выдачи. Без дополнительных переходов по ссылкам и без перемещений между вкладками.

В поисковой выдаче можно смотреть не только трейлеры, но и весь фильм целиком, бесплатно или по подписке. Если её нет, оплатить просмотр можно всё на той же странице, прямо в выдаче.

Ищем фильм, сами не знаем какой

Я люблю смотреть фильмы, но часто не понимаю, что именно хочу посмотреть. Решений мне и на работе хватает, а вечером хочется, чтобы просто всё придумали за меня.

Марина
Любит кино, но не всегда находит на него время

Если пользователь не знает, что конкретно посмотреть, в Яндексе есть подборки фильмов: «Что посмотреть после работы перед сном» и «Что посмотреть с девушкой». А есть более персонализированные подборки — по годам или по жанрам, которые поиск составляет, основываясь на том, какие именно видео понравятся конкретному пользователю.

Персонализированные подборки строятся на сложном алгоритме рейтингов. У каждого фильма и пользователя в Яндексе есть профиль. Они хранятся на платформе для обработки больших объёмов данных и регулярно обновляются. Профили фильмов содержат параметры, которые помогают соотносить их с профилями пользователей. Когда нужно выдать рекомендацию, начинают работать алгоритмы быстрого поиска подходящих видео: в подборку включаются фильмы, профиль которых подойдёт профилю конкретного пользователя. То есть поиск ориентируется не только на рейтинги и отзывы.

Пользователи уже давно могут ставить оценки фильмам и видео — как на «Кинопоиске», так и прямо в результатах выдачи «Яндекса». В итоге у сервиса за годы существования накопилась большая база данных о том, кто и как оценивает видео. На основании этих оценок каждому фильму в выдаче Яндекса проставляется рейтинг в процентах, который показывает, насколько то или иное видео понравится пользователю. Это сделали специально, чтобы пользователь не путал, например, оценки критиков с персонализированной рекомендацией. Чтобы подобрать функцию, которая будет высчитывать эти проценты, разработчики запустили задание в «Яндекс.Толоке» и анализировать ожидания пользователей от фильмов и персональные рейтинги.

Если человек не знает, что конкретно хочет посмотреть, мы порекомендуем ему подборки фильмов — например, если человек спросит про комедии 2020 года, мы покажем персонализированную подборку на основе его предпочтений. Чем больше фильмов человек ищет и смотрит на Яндексе, тем лучше и точнее работают наши рекомендации и персональный рейтинг фильмов и сериалов. Оценки можно ставить прямо в списке, не переходя на просмотренные фильмы.

Андрей Данильченко
Отвечает за качество объектного поиска в Яндексе

Персонализированные результаты поиска можно фильтровать. Для большинства подборок доступны фильтры по году, стране и ранжирование по популярности, при поиске фильмов за конкретный год возможен также выбор по жанрам. Так что можно сказать, что теперь Яндекс умеет выбирать кино на вечер для своих пользователей точнее, чем сами пользователи.

Основная цель Яндекса — решать задачи людей. Любые задачи: в сети и в реальном мире, повседневные и редкие, бытовые и научные, за третий класс и за пятый курс. Именно для этого мы совершенствуем свой поиск и создаём новые сервисы.
{ "author_name": "Яндекс", "author_type": "editor", "tags": [], "comments": 36, "likes": 21, "favorites": 12, "is_advertisement": false, "subsite_label": "yandex", "id": 168894, "is_wide": true, "is_ugc": false, "date": "Thu, 22 Oct 2020 11:00:14 +0300", "is_special": false }
Объявление на vc.ru Отключить рекламу
Трибуна
Бесплатные XML-выгрузки недвижимости на сайты недвижимости
Добрый день, я делаю сервис, который позволяет выгружать объявления на крупные сайты недвижимости и обновлять…
0
36 комментариев Накачай стартап
Популярные
По порядку
Написать комментарий...
2

вчера искал фильм по главному саундтреку - вот это челлендж) 

Ответить
0

интереса ради проверила яндекс - надо же, так тоже могут

Ответить
2

Звучит многообещающе, мне прям нравится

Ответить
1

Фильм, где обезъяна разбивала костью череп. Увы, ничего релевантного.

Ответить
2

А нет, Гугл находит, но только если задать запрос на английском

Ответить
0

А какой фильм вы хотели бы увидеть по этому запросу?

Ответить
4

По описанию похоже на первую сцену Космической одиссеи 2001 (простите, алгоритмы)))

Ответить
1

В точности). Фильм, где есть чёрный монолит, нормально находит.

Ответить
1

Этот фильм редко описывают именно по сцене с обезьяной, поэтому для наших алгоритмов это пока сложновато) Но мы обязательно учтем этот пример в обучении!

Ответить
2

Не поверите, буквально на днях размышлял о том, как было бы здорово, чтобы кто-нибудь сделал приложение, аналог шазама для музыки, только для поиска фильмов по сюжету. Если яндекс сделает такое, будет очень здорово

Ответить
0

От запроса «Фильм, где обезьяна на скале играет с девушкой» или «Фильм, где обезьяна поднимает девушку рукой» ожидал увидеть фильм «Кинг Конг».

Ответить
1

Для таких запросов алгоритму надо переводить текст в картинки, а затем искать уже по кадрам фильма. Ни Яндекс, ни Гугл так не умеют

Ответить
0

Что ж поделать, если фильмы запоминаются яркими зрительными образами?)

Ответить
0

Сделать такой алгоритм первыми. Я в детстве (конец 80-х начало 90-х) видел сериал. Там был ворон который научился называть одного из героев по имени. Имя запомнилось - Спиро. Ещё кажется они там всей семьёй строили лодку. И ещё припоминаю, что родители в этой лодке оказались в открытом море после шторма.

По данным "воспоминаниям" ничего не находится.

Ответить
1

Космическая одиссея 2001

Ответить
0

А что за устройство стоит на заглавном изображении справа от ноутбука?

Ответить

Офицерский жар

Егор
3

Кальян

Ответить
1

Это не ноутбук, это просто монитор с клавиатурой) Пусть ниже указали что это акустическая штука, я подумал что это освежитель воздуха)

Ответить
1

Видно же что миксер

Ответить
1

Люблю когда делают такие простые, но в то же время облегчающие какие-то моменты штуки. Ещё не пробовал, но обязательно это сделаю, ибо звучит как что-то годное

Ответить
0

Где ссылка на сервис?

Ответить
1

yandex.ru)

Ответить

Комментарий удален

Комментарий удален

Комментарий удален

Комментарий удален

0

Этап 1: "Мы попросили друзей поделиться обрывками воспоминаний о фильмах."

Этап 2:

"Скорее всего, Алексей с подругой смотрел именно его"
"Остаётся только решить, какой из фильмов больше соответствует воспоминаниям"
"Совпадает и сюжет, и жанр, и эпоха (фильм 30-летней давности вполне мог идти по телевизору «лет 10 назад, если не больше»)."

Это так в Яндексе учат проверять результаты теста - предположениями? Спросить про описание фильмов смогли, а переспросить, то ли нашлось, нет?

Ответить
0

Спрашивал не Яндекс. Это сотрудники vc спрашивали своих знакомых. Просто на момент выхода статьи герои не пересмотрели фильмы и не определились, то или не то нашел поиск. А выдумывать за них мы не стали.

Ответить
0

Алексей
Прервался на середине фильма
"В общем, до сих пор интересно, чем там все закончилось."

Ответить
0

Ищу фильм по кадрам из трейлера к нему. https://youtu.be/Iv4CuIIspdE Названия фильма нет, только композитор и его трек. Этот же трек есть в другом трейлере к другому фильму "Битва за Лос-Анжелес. Инопланетное вторжение" (отличный фильм) , но ищу я первый)) Спасибо!

Ответить
0

В целом кинопоиск хд накидал много правильных рекомендаций. Но никак не могу отделаться от Де Фюнеса. Терпеть не могу его с детства, но мне его упорно кидают в рекомендации. Решил заминусить штук 10 фильмов с ним. Это ни на что не повлияло. Борьба продолжается :)

Ответить
0

Ищу фильм 90тых. Там короче вечеринка у кого то дома. Вот некоторые моменты: На этой вечеринке, негр-качек, убивает парня ударами банкой бобов об лицо. Так же в фильме присутствует сцена, в которой чернокожая девушка на этой вечеринке бросает своего белого парня, ради двух блондинов близнецов, и уходит тусить с ними. А парень, которого она бросила, нашел себе друга, с которым хотел переспать, так как его разочаровали девушки, и привел его в спальню. Но после поцелуя, тот превратился в гиганского инопланетного жука, и уполз в окно. Так же в фильме есть сцена, где парень делает куни, своей подруге в кабриолете, а потом подруга ему отсасывает, а он во время оргазма давит педаль газа. И последний момент: Богатый малолетний нигер, и его малолетняя подруга блонда, хотели попасть на эту вечерину, но никак не могли из за своего возраста.
    В прокате этот фильм назывался "Живи и умри". Но по данному названию, никакой инфы сейчас нету.
    Прошу вашей помощи...  Фильм стоещий.

Ответить
0

Комедия про то, как выбирали невест на острове папуасов. Все невесты были толстые, а он увидел стройную и красивую, и привёз её в Европу...

Ответить
0

Подскажите фильм: сюжет заключается в том, что в древнем Китае был мастер или полководец, который хотел покорить Китай, но его остановила группа других мастеров владеющих способностями (медитация в воздухе, управление силой магии..) , и теперь в современном м мире он снова возвращается, у одних из мастеров была дочка, которая вначале фильма хотела прогнать хулиганов, но магией попала в полицейского (Хилый, батан), он потерял сознание, она привела его домой, её родители провели тест ему, и оказалось, он может научится тому что они знают.

Ответить
–1

И яндекс не нашёл. Фильм довольно старый, в котором показана закрытая школа для мальчиков в Англии. Туда приезжает один парень, потом они переплывают через озеро в девичью школу и купаются там. Он не хочет учиться и его учитель звонит отцу, который отчитывает и учителя, и сына. Потом он становится одним из лучших учеников. Никак не могу найти. Судя по всему, фильм до 2000 года. 

Ответить
–1

фильм который показывает средневековую жизнь, где из седла выбивают

(История рыцаря 2001) Сниппета нет, в результатах нашелся

фильм о настоящей любви когда девушка забыла всю историю

(Дневник памяти) Сниппета нет, в результатах нет

мультик где два брата идут хз куда через лес

(По ту сторону изгороди) Сниппета нет, в результатах есть

аниме где девочка и мальчик просыпаются в телах друг друга и хотели узнать имена

(Твое имя) Сниппета нет, в результатах нет

фильм где мужик всех убил и хранил тела в холодильнике

(Дом, который построил Джек) Впервые за пять запросов появился сниппет, но он не угадал фильм

0/5 не рекомендую

Ответить
0

Справедливости ради, под первое определение попадают вообще куча фильмов, почему именно история рыцаря?
а про двух братьев - если убрать "хз куда", то мультик находит.

Ответить
0

Я не знаю, как писать «правильно», я лишь привел пример, как это искал бы я.

К тому же, в выдаче название мелькает (а то, что Яндекс не показал в выдаче, показал Гугл), поэтому найти по моим запросам можно, но сниппет сомневается. 

Ответить

Комментарии

null