Как мы оценили эффективность «Фонда кино» и победили на хакатоне Министерства культуры

Рассказ победителей соревнования на основе открытых данных.

Министерство культуры организовало первый хакатон по созданию информационных проектов на основе открытых государственных данных. Победители соревнования рассказали редакции vc.ru о своём проекте и работах других команд, а также поделились собственными выводами и оценками о прошедшем мероприятии.

Хакатон Министерства культуры — не первое мероприятие, в котором ведомства предлагают создавать проекты на основе своих данных. В 2015 и 2016 годах Министерство финансов организовывало многоэтапный конкурс работ, которые бы наглядно объясняли распределение бюджетных средств. Подобный хакатон устраивало и Министерство спорта. В основном от команд ждут идеи приложений и журналистских расследований, а также красивую и оригинальную визуализацию данных.

Работа над проектом

Этап 1. Поиск идеи

Около четырёх часов мы просматривали данные, которые предоставляет Минкульт, и формулировали тему. Была идея посмотреть, как коррелирует расположение культурных объектов (театров, музеев, парков, библиотек и цирков) со стоимостью жилья в Москве. У нас были координаты и данные с сайта «ЦИАН». Но в итоге от этой идеи отказались, потому что зависимость очевидна: чем ближе к центру, тем больше музеев и тем дороже недвижимость.

Также отказались от идеи сервиса, который рассчитывает стоимость «литературного культурного тура» по стране. Например, человек из Тулы хочет попутешествовать и узнать всё о Есенине. Для составления маршрута он заполняет два поля — своё местоположение и имя писателя. Сервис показывает, что пользователь должен съездить в Рязань, Москву и Санкт-Петербург, потому что в этих городах больше всего памятников и музеев Есенина.

В идеале сайт или приложение также рассчитывают стоимость такого тура и показывают, на что нужно будет потратить деньги: переезд, гостиница, билет в музей. Из-за сложности и проблем с интеграцией сторонних сервисов мы решили отказаться и от этой задумки.

Последняя идея — та, которую мы реализовали, — связана с эффективностью работы «Фонда кино». Эта тема знакома и понятна всей команде. Актуальности добавила шумиха в медиа, связанная с фильмом «Взломать блогеров». В январе 2017 года видеоблогер Евгений Баженов (Badcomedian) сделал обзор этого фильма. Он раскритиковал кинокартину и обратил внимание на то, что её финансировал «Фонд кино». В видео Баженов также сказал, что считает работу фонда неэффективной.

После выхода обзора на проблему обратили внимание ряд СМИ — телеканал «Дождь», издание «Канобу» и другие. Министр культуры Владимир Мединский на пресс-конференции ТАСС назвал «Взломать блогеров» творческой неудачей и призвал в будущем ужесточить критерии отбора фильмов.

Мы оценивали эффективность «Фонда кино», основываясь на открытых данных. Разделили цели фонда на части, формулировкам присвоили показатели эффективности.

Основными целями Фонда являются: поддержка отечественной кинематографии, повышение её конкурентоспособности, обеспечение условий для создания качественных фильмов, соответствующих национальным интересам, популяризация национальных кинофильмов в Российской Федерации и за рубежом.

официальный сайт «Фонда кино»

Например, для «повышения конкурентоспособности» сравнивали средние рейтинги (по IMDb) и сборы фильмов, которые получили от фонда финансовую поддержку, с показателями остальных российских кинолент. Ещё посмотрели на главные темы и жанры в целях «поддержка фильмов, соответствующих национальным интересам». И примерно посчитали, какая доля фильмов, поддерживаемых ФК, окупается. Последнее не входит в задачи фонда, но нам было интересно.

Небольшое отступление о том, что вообще такое «Фонд кино». Это созданная в 1994 году некоммерческая организация, которая помогает финансировать и продвигать российские фильмы. Однако до 2010 года фонд находился в замороженном состоянии. В том году Правительство Российской Федерации подписало указ о Федеральном фонде социальной и экономической поддержки отечественной кинематографии («Фонд кино»). Министерство экономического развития и Министерство культуры определяют, сколько денег (и другого вида федерального имущества) передавать в эту организацию.

Этап 2. Работа с данными

Когда мы сформулировали тему, главной задачей стало составление основной базы с информацией о фильмах, которые поддерживал «Фонд кино». Также мы работали с базой IMDb для сравнения кинолент, поддержанных фондом, со всеми прокатными фильмами, выпущенными в России.

Сначала мы попытались составить необходимую базу, основываясь только на данных Мункульта. У ведомства есть открытые данные со всеми прокатными удостоверениями, выданными в России, и сборами всех фильмов на территории страны. Проблема была в том, что первая база заканчивается данными за 2014 год, а вторая содержит информацию только о 2015 и 2016 годах. То есть соединить вместе эти базы нельзя.

Поэтому (и ещё потому что у «Кинопоиска» нет открытого API) мы решили составить таблицу вручную. В совокупности с 2010 года «Фонд кино» поддержал выпуск примерно 150 фильмов, поэтому каждый член команды заносил данные о 20−30 фильмах. В итоге у нас получилась таблица, в которой для каждого фильма были графы: название, рейтинг «Кинопоиска», рейтинг IMDb, бюджет, сборы, жанр и тема. На получившуюся базу можно посмотреть здесь.

В этой таблице уже можно было посмотреть на окупаемость фильмов, которые поддерживал «Фонд кино». Этот показатель мы рассчитывали приблизительно, потому что не знали, сколько создатели получили от рекламного размещения (product placement и прочего) и как именно выручка от сборов распределялась между кинотеатрами и создателями картины.

Эксперт в области кинопроката подсказал, что от общих сборов кинотеатры оставляют себе примерно половину, а от зарубежных сборов остаётся ещё меньше. Таким образом, мы сравнивали бюджет и сумму от половины сборов в России и трети за рубежом. Если первый показатель был больше, то считали, что фильм не окупался. Наглядно это представлено на схеме:


На этапе визуализации мы начали страдать от того, что в команде нет дизайнера. Из-за этого некоторые графики строили в R и Python, но при этом они оставались неинтерактивными. С помощью инструментов Infogr.am и Tableu Public мы могли визуализировать все данные «красиво» и «живо», но совместить несколько видов графиков вместе не получалось.

Поддержка окупаемых фильмов в задачи «Фонда кино» не входила. Поэтому визуализацию окупаемости мы сделали просто потому, что нам это показалось интересным. Для оценки конкурентоспособности нужно было сравнить средние рейтинги российских фильмов и поддержанных фондом картин. На этом этапе нам пригодились открытые данные IMDb и колонка «рейтинг IMDb» в нашей таблице.

На график мы наносили средний рейтинг всех российских фильмов, вышедших в определённый год (порядка тысяч кинолент), по IMDb и рейтинг фильмов с поддержкой фонда. Получилась такая картина:

Поддержка «Фонда кино» никак не повлияла на популярность российских кинолент. Более того, поддержанные фондом фильмы получили в среднем более низкие оценки. Точками на графике показаны рейтинги каждого из фильмов с поддержкой. Самая низкая точка — фильм «Взломать блогеров», а самая высокая — «Легенда № 17».

Для того, чтобы проверить выполнение цели «соответствие национальным интересам», мы анализировали жанры и темы фильмов. Ожидали, что фонд поддерживал фильмы в основном о патриотизме и войне. Но оказалось, что чаще организация вкладывает в любовные комедии, реже — в мультфильмы для всей семьи.

Интерактивная инфографика: слева и справа

Проваленной оказалась и цель фонда «популяризация российского кино за рубежом». Данных о зарубежных сборах оказалось так мало, что мы даже не стали строить отдельных графиков. Зарубежные сборы редко превосходили сборы в России. Самыми успешными фильмами в прокате вне страны оказались «Метро» и «Хардкор».

Чтобы разбавить выводы из статистики, на презентации проекта мы рассказали о побочном открытии исследования. Оказалось, что почти все фильмы, вышедшие при поддержке «Фонда кино», в которых снялся Сергей Светлаков, окупились. Вне зависимости от бюджета и рейтинга. Единственным финансово неудачным оказался фильм «Ёлки 1914». Но мы его не смотрели — возможно, внутри есть рекламные интеграции, которые принесли дополнительный доход.

Выше описана лишь часть работы. Например, попытка извлечь все данные о фильмах с поддержкой «Фонда кино» только из базы IMDb не привела к результату. Таблица на основе этой базы содержала вдвое меньше строк, чем нужно было для составления полноты картины.

О том, как сравнивали российские сборы всех отечественных фильмов и поддержанных фондом лент, невозможно рассказать в двух словах. Аналитик, который работал над этой задачей, собрал базу из нескольких разрозненных таблиц, построил гистограму и сгладил её «одним математическим методом». В итоге получилось, что сборы не сильно различаются.

Мы работали над проектом вшестером. В команде собрались два редактора (студенты факультета «Журналистики» в НИУ ВШЭ), которые искали дополнительную информацию к материалу, чтобы он не выглядело сухо. Студентка экономического факультета ВШЭ, которая скрупулезно проверяла базу и заполняла пустые ячейки информацией из других источников. Ещё трое — работающие аналитики, которые обрабатывали разные части базы и строили графики. По меркам хакатона это большая команда. Идеально, когда над проектом работают программист, дизайнер и журналист.

За «Полный KPI» все члены команды получили (ещё нет) годовые абонементы в ГМИИ им. А. С. Пушкина. Таким же пропуском наградили автора исследования, занявшего второе место.

Другие проекты

В целом интересных проектов на хакатоне было не очень много. Сказывалась нехватка программистов и дизайнеров. Некоторые пробовали наносить данные Минкульта на карту, но серьёзных осмысленных результатов это не дало. Примечательными были работы, которым жюри дало призовые места. Это исследование доходов и расходов музеев Санкт-Петербурга, анализэффективности финансирования новых технологий в библиотеках и перспектив привлечения аудитории с помощью социальных сетей, а также обзор культурного взаимодействия России с другими странами.

Первая работа показывает, что музеи Санкт-Петербурга, несмотря на популярность у туристов, остаются убыточными. Единственный государственный музей в городе, приносивший прибыль — Исаакиевский собор — передают в безвозмездное пользование Русской православной церкви. Главная проблема, считает автор исследования, состоит в том, что музеи не считают нужным вести себя как бизнес-единицы и приносить прибыль. Основная часть финансирования государственных музеев — дотации из госбюджета.

В исследовании, связанном с библиотеками, команда детально показала, что организациям есть куда расти. Также авторы проекта посмотрели, на какие сообщества подписаны участники сообществ библиотек Москвы и Саратова во «ВКонтакте». Пожалуй, такие исследования должны проводить SMM-специалисты этих библиотек.

Приглянулась также находка одной из команд — для оформления проекта участники использовали кадры из фильма «Карты, деньги, два ствола», обработанные в Prisma. Все изображения выглядели стильно, и визуально работа запомнилась.

Все проекты хакатона (включая наш) не выглядят законченными. Где-то не успели просчитать все параметры с учётом мелочей, где-то — построить красивые графики, в других случаях — просто написать связный текст, который выстроил бы результаты исследования в законченную историю.

Во всех проектах сказывается нехватка программистов и дизайнеров и затруднённое взаимодействие специалистов из разных областей внутри команды. По крайней мере, они пробуют работать вместе и быстро создавать дата-журналистские проекты.

0
9 комментариев
Написать комментарий...
Lili Lala

Идея реальна крутая.
Все орут, что Фонд Кино не справляется с работой, но эти ребята в цифрах показали и доказали. И самое главное - дали инструмент, при помощи которого можно в дальнейшем оценивать работу ФК и соотвественно корректировать.

Ответить
Развернуть ветку
Konstantin Kharitonov

Интересно как сам фонд кино оценил ваши выводы? Мин. культ это просто одно фонд кино другое .

Ответить
Развернуть ветку
Оля Королёва
Автор

Нет уверенности в том, что кто-нибудь из фонда видел исследование. Скорее всего, там и без него всё знают.

Ответить
Развернуть ветку
Konstantin Kharitonov

Эх... Надеюсь им покажут у вас получилось достаточно наглядно.

Ответить
Развернуть ветку
Αндрей Κозлов
Главная проблема, считает автор исследования, состоит в том, что музеи не считают нужным вести себя как бизнес-единицы и приносить прибыль.
все члены команды получили (ещё нет) годовые абонементы в ГМИИ им. А. С. Пушкина.

Вот всё и срослось.

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Valentin Dombrovsky

Победители пожелали остаться анонимными или я что-то пропустил?

Ответить
Развернуть ветку
Оля Королёва
Автор

Информация в пределах находимости, просто в колонке акцент на работе, а не на команде.

Ответить
Развернуть ветку
Valentin Dombrovsky

Отличный ответ как для журналиста. Буду мотать на ус.

Ответить
Развернуть ветку
Sergei Erjemin

Еще бы наложить зрительские оценки через twitter... Есть методика оценки и изменения этих оценок во времени. Тогда, было бы возможно узнать от каких фильмов получили больше удовольствия (с поддержкой фонда или без).

Фестивальный потенциал тоже интересно отследить.

Ответить
Развернуть ветку
6 комментариев
Раскрывать всегда