Офтоп
Андрей Фролов

Руководитель «Яндекс.Браузера» запустил поиск по архивам «Живого Журнала» на основе данных «Яндекса» Статьи редакции

Руководитель «Яндекс.Браузера» Роман Иванов запустил сервис поиска по архивам «Живого Журнала», которые сохранились в «Поиске по блогам» «Яндекса». В разговоре с vc.ru он сообщил, что это его личный некоммерческий проект, не связанный с поисковой системой.

Проект предназначен для исследователей, которым будут интересны «культурные пласты нулевых годов», а также пользователей ЖЖ, желающих найти информацию тех лет, говорит Иванов. В сервисе собраны данные с 2000 года по осень 2015 года — 340 млн заметок и 1 млрд комментариев, всего более терабайта информации.

Я считаю, что в ЖЖ случилась или как минимум нашла своё отражение почти вся русскоязычная культура нулевых годов. Культурное значение этого архива трудно переоценить. Когда «Яндекс» закрыл поиск по архивам, я очень огорчился, поскольку убеждён, что этот архив должен быть сохранён для человечества. Ну и попросил у «Яндекса» архивы. А «Яндекс» внезапно согласился и дал их. Последние полгода я с несколькими другими волонтёрами программировал этот самый поиск и вроде бы довёл его до вменяемого состояния.

— Роман Иванов

Разработкой сервиса занимался сам Иванов при поддержке волонтёров — в частности, дизайн сервиса создавал основатель закрытого сейчас сервиса Eviterra Николай Заярный. Поисковик расположен на хостинге Servers.ru, который предложил безвозмездную помощь Иванову.

Поскольку новые записи не индексируются, то аудитория, на которую я рассчитываю — исследователи. Как в прямом смысле слова исследователи культурных пластов нулевых годов, так и просто настоящие или бывшие пользователи ЖЖ, которые хотят найти что-то, что было написано в те годы. Исходя из этого, например, я не стал ограничивать максимальное время выполнения поискового запроса — исследователь может подождать выполнения сложного запроса и минуту, и две. При этом, конечно, простые запросы выполняются быстро, а если сервис обнаруживает, что запросов сейчас задаётся много, он включает управляемую деградацию, в том числе, ограничивает таймаут запроса.

— Роман Иванов

Сейчас создатель сервиса планирует переиндексировать архив и добавить поиск по точным словоформам, а также дать возможность искать комментарий одного пользователя в журнале другого.

Чтобы предотвратить претензии со стороны правоохранительных органов, Иванов решил не показывать сохранённые копии уже удалённых записей пользователей с российских IP-адресов. «Так сказать, заранее ограничил русских детей от возможной пропаганды суицида, гомосексуализма, наркотиков, шоплифтинга, неуплаты штрафов и перехода улицы в неположенном месте», — сказал он. Администрация ЖЖ, к которой обратился Иванов с предложением сотрудничества, не проявила интереса к проекту.

Представитель «Яндекса» Ася Мелкумова в разговоре с vc.ru не исключила того, что компания может дать архивы «Поиска по блогам» и другим пользователям, которые заинтересуются ими для своих сервисов.

«Яндекс» объявил о закрытии рейтинга блогеров в «Поиске по блогам» в апреле 2014 года — это произошло из-за инициативы о приравнивании блогов с посещаемостью свыше трёх тысяч пользователей в сутки к СМИ. C сентября 2015 года сервис ищет только по материалам, которые младше одного месяца. В компании объяснили это тем, что «подавляющее большинство наших пользователей ищут свежие записи, а к архивам обращаются достаточно редко».

{ "author_name": "Андрей Фролов", "author_type": "editor", "tags": ["\u044f\u043d\u0434\u0435\u043a\u0441","\u0440\u043e\u043c\u0430\u043d_\u0438\u0432\u0430\u043d\u043e\u0432","\u043f\u043e\u0438\u0441\u043a_\u043f\u043e_\u0431\u043b\u043e\u0433\u0430\u043c","\u043d\u043e\u0432\u043e\u0441\u0442\u044c","\u043d\u043e\u0432\u043e\u0441\u0442\u0438","\u0436\u0438\u0432\u043e\u0439_\u0436\u0443\u0440\u043d\u0430\u043b"], "comments": 4, "likes": 15, "favorites": 0, "is_advertisement": false, "subsite_label": "flood", "id": 16210, "is_wide": true, "is_ugc": false, "date": "Tue, 14 Jun 2016 14:05:34 +0300", "is_special": false }
0
4 комментария
Популярные
По порядку

Слава Кукуцу!

4

дизайн сервиса создавал

Дизайн чумовой, да

1

502

0

Уже наладилось.

0
Читать все 4 комментария
Как получить искреннюю обратную связь от сотрудников и улучшить работу компании?

Как-как… попросить инфу на личном уровне. Дать слово, что критика не будет наказана. Быть командой, в которой не страшно сказать свое фи. Мы попробовали, и вот что у нас получилось.

«2ГИС» представил обновлённый навигатор с мини-картой на экране, данными о камерах и парковках Статьи редакции

Его уже подключил «Ситимобил».

Обновлённый интерфейс навигатора  «2ГИС»
Как имиджевый проект о безопасном вождении привлёк лиды и расширил маркетинговую воронку страховой компании

А игра с виртуальной фарфоровой статуэткой помогла 6,5 тысячам водителей не превышать скорость.

Qlik представляет гибридную облачную аналитику с помощью решения Qlik Forts

Qlik объявляет о запуске Qlik Forts – нового гибридного облачного сервиса на базе Qlik Cloud, который поможет воплотить концепцию Active Intelligence, обеспечивая аналитику всего объема данных в полном соответствии с нормативными требованиями.

ITeaConf - 2021 / Python, Ruby, Rust, Java, Go, Node.js, .NET, Frontend

Мы знаем лучший способ провести воскресенье, если вы работаете в IT.

Волна «Кальмара»: как бренды прокатились на тренде и какие выводы можно сделать маркетологам

С выхода южнокорейского сериала «Игра в кальмара» прошёл месяц. Шумиха вокруг него утихает, и можно подводить итоги.

Как программист-интроверт стал СЕО стартапа, сделал MVP за один месяц и заработал 12 млн за год – история Revvy

SaaS-сервис Revvy, который помогает бизнесу общаться с клиентами и умеет «перехватывать» негатив.

Пример позитивного отзыва и “перехвата” негатива
Хакасия первой из регионов ввела комендантский час во время «нерабочих» дней Статьи редакции

В трёх городах перестанет работать общественный транспорт, а таксисты смогут работать только со справкой о вакцине.

Как не угодить в мышеловку бесплатного аудита контекстной рекламы? Немного советов от йогуртного сомелье

Не все аудиты одинаково полезны. Не так давно один знакомый маркетолог потерял работу, доверившись аудиту контекстной рекламы известной компании, а те слили в трубу его пухлый бюджет из-за ошибки в расчетах. Как не влипнуть в такую же историю и получить отличные результаты? Инфа в статье.

Как UX-дизайнерам и редакторам писать уместные и этичные тексты

Меня зовут Маргарита Хохлова, я занимаюсь продуктовыми текстами больше трёх лет. Сначала казалось, что можно стать хорошим редактором, если отлично разобраться в синтаксисе интерфейсов, прокачать продуктовое мышление, научиться строить пользовательские сценарии и бодро подстраиваться под tone of voice. Сейчас я вижу, что всё намного сложнее.

null