Сервисы
Aydar Musin

Нейронная сеть генерирует заголовки статей для vc.ru

На выходных стало скучно, и я решил поиграться с моделью GPT-3 для русского языка, которую опубликовал «Сбер» в 2020 году. Результаты порадовали, читайте ниже подробнее о результатах и потестируйте сами ;)

Стоит сказать спасибо Сберу, что инвестировал вообще в это направление и сделал результаты работы общедоступными.

Оригинальная модель от OpenAI(Основателем которой является Илон Маск) показывает впечатляющие результаты. Думаю, все уже слышали, что она может писать стихи, код, но также её во всю применяют для решения бизнес задач. Модель у Сбера меньше по количеству параметров. Но, судя по опубликованным результатам, она тоже что-то может. И можно даже попробовать применить её для решения какой-нибудь серьезной задачи.

Но начать я решил с не такой уж и серьезной задачи.

Как постоянный читатель vc.ru, подумал, что будет интересно поиграться c его контентом. Решил собрать заголовки статей. Сделать это просто, потому что контент-ориентированные сайты публикуют sitemap со всеми ссылками на статьи. Собрал ~100K статей, подготовил обучаю выборку и запустил обучение модели на AWS. Ну и чтобы можно было тестировать, сделал бота для Telegram.

Чтобы сгенерировать тексты, достаточно передать категорию статьи(по другому Название подсайта). Также можно задать "затравку" для названия статьи.

Результат оценивайте сами :) Проект был сделан ради фана, а заголовки, на мой взгляд, иногда получаются интересные.

Вот некоторые примеры

Самое интересное, что если выбрать подсайт "Трибуна" (где часто рассказывают про свои проекты) и ввести какое-нибудь название, можно получить описание

Как потестировать?

Вот ссылка: Бот

Чтобы сгенерировать заголовок нужно передать категорию статьи(Название подсайта) первой строкой, а второй строкой передать затравку для заголовка.

Если у вас возникли вопросы, можете связаться со мной здесь.

Ну и на всякий случай: Бот обучен на материалах из интернета без фильтрации контента. Генерируемый текст не должен восприниматься всерьез и интерпретироваться как оскорбление. Торговые знаки и слоганы принадлежат правообладателям и не используются для коммерческих целей.

Что дальше?

Варианты продолжения фана:

  • Можно сделать конкурента местного Олега от Тинькофф.
  • Можно генерировать целые статьи
  • Предложите свой вариант в комментариях
{ "author_name": "Aydar Musin", "author_type": "self", "tags": [], "comments": 23, "likes": 15, "favorites": 29, "is_advertisement": false, "subsite_label": "services", "id": 238757, "is_wide": false, "is_ugc": true, "date": "Mon, 26 Apr 2021 16:46:11 +0300", "is_special": false }
0
23 комментария
Популярные
По порядку
Написать комментарий...
9

Подтвердили мои догадки, что 50% статей здесь пишет нейросеть.

Ответить
7

Честно говоря, некоторые генерируемые заголовки выглядят настолько реалистично, что начинаешь проверять не правда ли это...

Ответить
1

Вы натренируйте сеть на статьях Аязов, Портнягиных, Роббинсов и Бизнес Молодости )))

Ответить
2

бот-мотиватор? хм, почему бы и нет

Ответить
0

да проще простого, в том то и дело. Так же как и современные фильмы. Техническая жвачка.

Ответить
1

она же их и читает, потому что подобные вещи разве что ее заинтересуют, человек с критическим мышлением не поведется)

Ответить
0

Не поведётся на что? Имеете ввиду поймёт что это написано компьютером?

Ответить
3

Предлагаю вариант: Генерацию комментариев к статье от разных личностей с большой базой уже существующих комментариев (чтобы у каждого комментатора был свой стиль).

Ответить
2

Илья Максимов vs Александр Свергун

Ответить
1

Интересный вариант :)

Ответить
1

да что здесь интересного, из той же серии как мултьяшние аватары сбера. Только отвращение.

Ответить
2

Это точно бот?

Ответить
1

Даже слишком хорошо

Ответить
0

Человек бы не смог в таком количестве генерировать ;)

Ответить
1

Истории
Как я объелся
...
Как я объелся гречкой и стал «невидимкой»: история одного из первых российских инвесторов в недвижимость Сергея Гордейчика

Что ж за гречка?))

Ответить
0

очевидная греча с курой, сударь

Ответить
1

Поржал с обычного спутника

Ответить
0

Гениально! Спасибо автору, сделал мой день))

Ответить
0

А может ли система пересказывать статью без потери смысла исходного?

Ответить
0

Да, задача в направлении NLP называется text summarization. Если дообучить эту же модель специальным образом, то может что-то получиться

Ответить
0

Если был смысл ))

Ответить

Комментарии

null