Это разработка питерская: топ технологий ВКонтакте за 2021 год

Уже 15 лет мы развиваем ВКонтакте в духе времени — и сейчас время требует качественного видео, высоких скоростей и ML-технологий.

Если в 2006-м было нормой загружать ролик 240p полчаса, то сейчас стриминговые сервисы предлагают контент в разрешении 4К и конкурируют за доли секунды. 2021 год был богат на технологические решения, которые родились внутри команды, — рассказываем о некоторых из них в статье.

Ускорили ВКонтакте на базе QUIC и расширенной сети доставки контента

Заметнее всего в метро или на Дальнем Востоке

Думать про слабые сети в эпоху появления 5G на первый взгляд может показаться странным. В крупных городах привыкли, что почти повсеместно ловит 4G. Но на самом деле даже 3G есть далеко не везде — и его уже недостаточно для быстрой работы многим сервисам.

Зона покрытия сотовой связью 3G в России на февраль 2019 г. Все операторы

До внедрения QUIC мы замеряли время появления картинок в Санкт-Петербурге (где находится наша штаб-квартира) и в Петропавловске-Камчатском. Выяснили, что четверть пользователей с Дальнего Востока могут замечать задержку загрузки изображений от 933 мс — это почти целая секунда. Deloitte заявляет, что ускорение времени загрузки страницы всего на 100 мс может увеличить конверсию на 8%. Конечно, и мы ВКонтакте боремся за каждые 100 мс, чтобы пользователи тратили как можно меньше времени на ожидание и проводили свои миллисекунды продуктивно.

Поэтому в сентябре ВКонтакте первой среди крупных сервисов в России переехала на новый интернет-протокол QUIC — и доставка контента ускорилась в два раза. Это значит, что обмениваться фотографиями и другим контентом в соцсети теперь получается гораздо быстрее. Даже при слабом интернете, например на даче, в метро или в регионах, где далеко не везде ловит 4G.

Один из первых наглядных тестов: мы запустили QUIC на iOS, включили 3G-интернет и посмотрели, как это работает

Люди, у которых не очень хороший интернет и которые из-за этого в принципе не очень активно пользуются интернет-сервисами, стали смотреть ВКонтакте на 10% больше контента.

Продолжая битву за скорость, мы расширили свою геораспределённую сеть доставки контента (Content Delivery Network, или CDN). Cейчас она включает в себя больше 50 узлов — серверов, которые расположены в разных точках России и мира, — как можно ближе к пользователю, чтобы он получил быстрый доступ к видеоконтенту. Благодаря этому решению видео и трансляции ВКонтакте стали стартовать в среднем в 1,5 раза быстрее. На Юге России с использованием CDN загрузка начинается на 10–20% быстрее, чем без, в Сибири — на 30–50%, а на Дальнем Востоке видео стартует в два раза быстрее, чем если бы его пришлось скачивать с центрального сервера.

Сделали звонки без ограничений

Без лимитов по времени, платных функций или ограниченного числа участников

Звонки ВКонтакте на 128 человек появились ещё в 2020 году — в разгар пандемии, когда вся команда работала удалённо. В середине 2021-го максимальное число участников увеличилось до 2 048, а недавно мы полностью сняли лимиты на количество присутствующих — первые в мире. При этом все собеседники могут видеть и слышать друг друга, а не только смотреть трансляцию. Незаменимая функция, чтобы собрать в звонке совещание со всеми сотрудниками компании или устроить встречу выпускников.

Создать сервис звонков — амбициозная задача со множеством сложных моментов. Задержки передачи данных в звонках могут портить жизнь больше, чем при загрузке изображений. Люди начинают перебивать друг друга и сбиваться — не хотелось бы столкнуться с чем-то подобным на важной деловой встрече или экзамене. Особенно актуальной эта проблема становится, когда в конференции много участников. Поэтому мы с особым вниманием отнеслись к оптимизации звонков и при выборе любых решений думали об их влиянии на передачу данных — даже написали об этом целую статью.

В первую очередь снять ограничения на число участников помогла технология горизонтального масштабирования звонка. Транскодирование видео в разные разрешения, обработка аудио, а также работа нейросетей (например, для шумоподавления) происходит независимо. Таким образом большой звонок можно масштабировать на сколько угодно серверов, а не ограничивать количество участников производительностью одного сервера — это ликвидирует все потенциально узкие места системы.

Измерение задержки в интерьерах Дома Зингера: снимаем секундомер, фотографируем вместе экраны с исходящим и входящим видео

А ещё на помощь пришла CDN-сеть, которая уже упоминалась выше. Дело в том, что из-за особенностей работы операторов может получиться так, что звонок двух абонентов во Владивостоке может пойти через Москву. Чтобы починить это для наших пользователей, мы установили конференц-серверы, которые напрямую соединяем с разными операторами. За счёт этого мы можем запустить звонок во Владивостоке через Хабаровск или хотя бы Новосибирск — задержка наверняка будет меньше, чем через Москву.

Избавились от лишнего шума в звонках

Чтобы пользователи могли сосредоточиться на главном

Каждый, кто проводил рабочие встречи в видеозвонках, сталкивался с ситуациями, когда окружающий мир слышно лучше, чем говорящего. Поэтому мы сделали технологию шумоподавления на основе нейросетей: участники онлайн-встречи услышат друг друга, даже когда вокруг гудит улица, носятся машины или соседи внезапно затеяли ремонт. Шумоподавление в звонках включено по умолчанию и работает в автоматическом режиме, подстраиваясь под внешние обстоятельства. Функцию можно отключить — если хочется дать собеседнику услышать окружающие звуки.

Мы предусмотрели разные повседневные ситуации и использовали для обучения нейросети широкий набор звуков — от шума пылесоса и газонокосилки до стука молотка и звонка в дверь. При этом спроектировали сервис таким образом, чтобы он не создавал существенной нагрузки на устройство. В результате шумоподавление хорошо работает не только на мощных компьютерах и флагманских телефонах, но даже на распространённых моделях смартфонов.

Улучшили качество видео, создав технологию NeuroHD

Даже старых роликов, снятых много лет назад

Мы заметили, что фильтр «Высокое качество» становится всё популярнее в поиске по видео, и разработали собственную технологию NeuroHD. С её помощью можно двукратно повысить разрешение, восстановить детали и убрать появившиеся после сжатия шумы и дефекты на видео.

За время существования видеораздела ВКонтакте люди загрузили миллионы своих роликов. Многие из них завирусились и стали культовыми, их пересматривают до сих пор. Правда, в 2021 году то, что было снято ещё на какой-нибудь Sony Ericsson K750, больше напоминает размытые двигающиеся пиксели. NeuroHD поможет смотреть в лучшем качестве и любительский контент, и профессиональные ролики. В будущем высокое разрешение получит весь контент библиотеки VK Видео — а это свыше 250 миллионов видео в год, 80% из которых загружают сами пользователи социальных сетей.

Журналисты TJ тестировали технологию на старых мемах. Питерская разборка стала чётче

Прокачали поиск по видео

Чтобы было проще найти нужный ролик в море контента

Новая рекомендательная система для видео ВКонтакте учитывает тысячи сигналов и в реальном времени строит персональный топ роликов — чтобы пользователи получали именно то, за чем пришли на платформу. Это может быть лёгкое кино на вечер или образовательные курсы — в любом случае рекомендации помогут не тратить время на поиск релевантного контента. При этом для поиска и просмотра видео не обязательны регистрация и авторизация ВКонтакте.

Чтобы точнее подстроиться под интересы пользователя, система рекомендаций опирается и на ручную разметку видео по жанрам, и на автоматическую — нейросетевую. Разработчики ВКонтакте научили модель различать более 1 000 категорий: например, видео со спортивных соревнований получает не просто тег «спорт», а помечается как конкретный вид — футбол, хоккей или, скажем, верховая езда. Кроме того, с помощью собственной технологии распознавания лиц ВКонтакте умеет предлагать пользователю посмотреть видео с участием его любимых знаменитостей.

Это не интерфейс, это иллюстрация, чтобы наглядно показать идею

А чтобы пользователю не наскучил просмотр и он всегда смог найти что-то под настроение, при построении рекомендаций большое внимание уделяется разнообразию выдачи. Вкладка «Для вас» в разделе с видео ВКонтакте никогда не будет однообразной: с роликами только из пары категорий или клипами одного артиста. Этого помогают избежать умные алгоритмы ранжирования и ИИ-технологии распознавания лиц и сюжетов. Также в список персональных рекомендаций деликатно добавляются новые виды роликов. Благодаря этому пользователь постепенно знакомится со всем разнообразием доступного ВКонтакте контента, находит новые интересы и подаёт рекомендательной системе новые сигналы, что в результате делает выдачу ещё более точной.

Научили нейросеть определять угрозы и оскорбления

И сделали фильтр для администраторов сообществ, помогающий автоматически удалять такие комментарии

ВКонтакте сотни тысяч сообществ разной тематики: от абстрактных мемов и уродливых растений до фанатских комьюнити и пабликов мировых брендов. В каждом своя атмосфера, которую поддерживают сами подписчики и админы. У владельцев сообществ есть целый набор инструментов для модерации: например, фильтры по нецензурным выражениям и ключевым словам (их выбирают сами админы).

В этом году мы запустили ещё один — фильтр враждебных высказываний. Хоть угрозы в комментариях часто не несут реальной опасности, они создают агрессивную атмосферу в паблике и порой могут провоцировать на насилие в офлайне. Мы сделали фильтр, который автоматически удаляет угрозы: например, пожелания смерти или обещания причинить вред здоровью. Администратор сообщества может включить и выключить его в любой момент, а ещё посмотреть все отсеянные комментарии, восстановить любой из них или отправить автора в чёрный список.

Подсказка, где найти фильтр в настройках сообщества

Для создания алгоритмов, которые хорошо понимают разговорную речь, использовалось большое количество текстов на русском языке — например, субтитры из фильмов, сериалов и видео. Нейросеть содержит специальный механизм внимания, позволяющий принимать решения на основе важности слов и их комбинаций. Разработчики изучают логику принятия решений алгоритмами — это позволяет исправлять ошибки, учитывать контекст и эффективнее обучать нейросети. Уже на момент запуска алгоритмы правильно определяли угрозы в 80% случаев, и команда продолжает работать над их улучшением.

Это далеко не все технологии, которые появились ВКонтакте в 2021 году. Мы успели гораздо больше, например:

  • Создали автоматические субтитры на русском языке. Эта технология автоматически генерирует текст, распределяет его по кадрам и синхронизирует с произнесённой фразой. Главное отличие от других решений в том, что наше умеет проставлять в субтитрах знаки препинания и заглавные буквы, а в ближайшем будущем научится разделять речь разных спикеров на реплики.
  • Открыли SDK VK звонков для разработчиков. Это готовый набор инструментов от ВКонтакте, чтобы создать голосовые и видеозвонки в своём IT-продукте — в веб-версии и в мобильных приложениях.
  • Запустили автоматический перевод текста в публикациях на русский, английский и другие языки — да-да, опять с помощью нейросетей.
  • Ещё мы прокачали AR-технологии: в звонках — для возможности ставить виртуальный фон (в том числе и в веб-версии), а в клипах — для создания новых эффектов, например масок для котов.
  • И многое другое :)

Больше цифр и фактов об итогах этого года смотрите в специальном разделе: vk.com/2021.

0
61 комментарий
Написать комментарий...
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
x_FeNiX_z

А ты можешь объективно сказать, что не так с вк с точки зрения функционала?
Отбросим все эти кукареки насчёт конфиденциальности, ибо её нигде нету, это очевидно, а оценим именно продукт, что не так?

Ответить
Развернуть ветку
Станислав Мокеев

Я больше года назад удалил страницу в ВК и странно то, что даже не тянет снова там обитать. Сидел только из-за расписания и беседы с группой. И вроде ВК отличный сервис с множества функций, но сидеть в нём вообще не хочется. Музыка теперь в Я.Музыке, новости и переписки в телеграме. Мне кажется, что они его перегрузили и сильно засрали рекламой, а контентмейкеры уходят из-за цензуры.

Ответить
Развернуть ветку
Матяс

Теперь-то засрётся рекламой ещё и тг, за которую причём сами каналы, на которых она показывается, ничего не получают)
Честно, не понимаю, кто ещё в этом мире не смирился с тем, что сейчас в каждый утюг вставляют рекламу
Да и новости в тг из разных каналов, если честно, тоже не понимаю, просто превращают ленту диалогов в помойку)
Как по мне так гораздо удобнее когда разные разделы есть под сообщества и диалоги - ни то ни то не превращается в мусорку

Ответить
Развернуть ветку
wavewithme

Ничто не мешает создать папки в Telegram:)

Ответить
Развернуть ветку
Матяс

Ничто не мешает телеграму сделать отдельную вкладку "каналы", отдельную от диалогов
Что это за сервис в котором пользователь должен выполнять работу за разработчиков?
Да и если папку создать, то из общего списка каналы не исчезают и всё такое же говно остаётся

Ответить
Развернуть ветку
Кирилл

а в вк прям не так,хахахах

Ответить
Развернуть ветку
Алексей Штейн

Токсичная аудитория

Ответить
Развернуть ветку
Матяс

а чего на vc тогда делаешь?

Ответить
Развернуть ветку
Алексей Штейн

Тут лучше , тут токсики и душнилы не умеют общаться , только ставить бесполезные плюсы/минусы которые ничего не дают , они изначально проигрывают. Поэтому тут проще

Ответить
Развернуть ветку
Матяс

Значит, вк нужно просто добавить, к уже имеющимся лайкам на комменты, просто ещё дизы, чтобы быть ничуть не хуже vc?)

Ответить
Развернуть ветку
Алексей Штейн

Такое давно они обещали кстати

Ответить
Развернуть ветку
Матяс

Сейчас сами лайки уже есть, но дизов реально не хватает, может люди и правда меньше токсить бы стали, если бы дали возможность просто заминусить)
Но сейчас есть хотя бы разные реакции на посты - это тема

Ответить
Развернуть ветку
Дмитрий Милюков

Продукт оценивают пользователи. Я хз про например звонки ВК. Ими пользуются? Какая статистика? Не факт, что это надо допиливать, если оно мертвое.

В этой статье нет главного: на сколько метрики коммерческие выросли.

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Матяс

Пока вижу только что "ВК - мёртв" пишет небольшая, но громкая часть, на ресурсах у которых посещаемость в тысячи раз меньше, чем у вк)
99.9% людей ничего не мешает вполне себе сидеть в вк постоянно)

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Матяс

А то есть твоё мнение полностью состоит из чьего-то мнения описанного в статье? Но из-за того, что ты очень вдохновился этой статьей, теперь считаешь свой кругозор настолько широким, что думаешь, что он покрывает весь спектр объективных мнений, а все другие мнения это нечто настолько узкое, что лишь случайно не попало в твой невероятно мощной ширины кругозор?)

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Матяс

Значит, тебе просто нужно смотреть шире, чтобы понять, что я хочу сказать этим, вот если бы ты не думал лозунгами, то научился бы смотреть шире, чем "ВК умирает, была тут статься на vc")

Ответить
Развернуть ветку
Blisk

Да, технические детали уже у продуктов плюс минус похожи, приходится чем то другим завлекать… но в России разве есть альтернативы? Например вот удалил кто то профиль в ВК — куда он пойдёт? На ютуб или тикток? Но как ВК развивает альтернативные механики — никто не пишет. Видно, что никак (раз не признаются) — тогда можно сделать вывод что они давно ушли от экспериментов и инвестируют в оптимизации.

Ответить
Развернуть ветку
Дмитрий Милюков

но в России разве есть альтернативы? Например вот удалил кто то профиль в ВК — куда он пойдёт?/// действительно куда. Ведь нет ничего (дикий сарказм)

Ответить
Развернуть ветку
Blisk

Одноклассники! (дикий сарказм)

Ответить
Развернуть ветку
Дмитрий Милюков

Точно. А мессенджер (ну как без ВК жить) - icq

Ответить
Развернуть ветку
Ленин-гриб

Я могу. Видео вообще грузиться нормально перестали, время работы видеоплеера увеличилось на х3 раз. Они просто залезли и своими рукожопыми руками создали RuTube вконтакте, когда все прекрасно работало.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
x_FeNiX_z

Что значит перегрузили?
Если тебе что-то не нужно, ты просто этим не пользуешься и всё

Ответить
Развернуть ветку
Матяс

Хз, каким мессенджерам проиграли
Нет нормального поиска людей + попытка сымитировать сообщества вк в тг превратила очень быстро ленту диалогов в помойку
Единственный норм мессенджер - слак, и то он исключительно рабочий)
А по всем личным, ежедневным, дружеским и бытовым делам я быстро вернулся из тг в вк
Ну а инста стала помойкой из голых жоп и тупых тик-ток видосиков
В вк можно хотя бы не пользоваться этим фунционалом, а там он просто единственный)

Ответить
Развернуть ветку
58 комментариев
Раскрывать всегда