#Нужноделать: генератор краткого содержания статей и веб-страниц на основе ИИ

В сети много полезной информации, объём которой постоянно растет. При этом растёт количество потенциально интересного и полезного пользовательского контента от людей, у которых нет репутации экспертов в своей области.

В закладки

Проблемы:

1) Читать все подряд долго и иногда реальность не соответствует ожиданиям.

2) Быстро отделить важное от неважного вызывает сложность и требует времени.

Многие потенциально интересные статьи бывают очень длинные и неструктурированные: неудачный слог и стиль, несоблюдение последовательности изложения, недоработка оформления статьи. Поэтому стремление мозга оптимизировать затраты на чтение подталкивает к таким сценариям:

  • закрыть и забыть (а значит возможно упустить какую-то полезную информацию);
  • сходить в комменты (если есть) и оценить годность материала не читая статьи на основании чужого мнения;
  • даже если статья годная, но не сильно актуальная, то сохранить в закладки до лучших времен, осквернив храм умных и полезных ссылок потенциально бесполезной статьей (которую потом все равно придется разбирать).

Решение:

На основе ИИ генерировать синопсис материала в формате списка тезисов +/- 1-2 простых предложения (структуры выдачи предстоит определить).

Пример:

Статья будет полезна специалистам по продажам промышленного оборудования, sales директорам и владельцам таких бизнесов.

В этой статье:

  • генерация лидов;
  • работа с возражениями;
  • важные детали при закрытии сделки;
  • удержании клиента после продажи;
  • ключевые ошибки менеджеров.

Актуальность:

Возражение: Люди могут оформлять статьи самостоятельно.

Ответ: Могут, но далеко не все.

Число людей, умеющих грамотно и четко структурировать текст составляет некоторый процент от общего числа пользователей web и этот процент будет снижаться по следующим причинам.

  • Такие нативные человеческие особенности как 1) лень, 2) "мне понятно, значит всем понятно" никуда не денутся.
  • Общедоступное (прежде всего высшее) образование, которое приучает к правильному изложению и оформлению текстов деградирует. Даже если вы отличник и не покупаете готовые курсовые работы, то переход на тесты вас все равно настигнет;
  • Самостоятельное оформление синопсиса требует времени.
  • Человеческий фактор: автор может что-то забыть, а ИИ подскажет.

Профит:

1) читающему:

  • экономия большого кол-ва времени на чтение;
  • возможность оперативно каталогизировать потенциально интересную, но не злободневную информацию;
  • увеличение лояльности юзера к автору (его продукту или компании), так как человек поймет, что не потратил бесценное время на бесполезны для него материал и будет счастлив;
  • анкор с пунктов синопсиса к той часте статьи, которая посвящена вопросу даже если нет h2/h3.

2) пишущему:

  • экономия времени на подготовку статьи;
  • проверка структуры статьи.

Способы доставки продукта:

1) Генерация синопсиса по ховеру/клику в поп-апе при ховере на заголовок или брендированный специальный символ рядом с заголовком (второе лучше с точки зрения распространения продукта).

2) Генерация синопсиса в начале статьи после h1.

Монетизация:

1) Реклама (аккуратная!) в конце синопсиса. Плюсы: фокус внимания и хороший таргет.

2) Ad-free платная версия.

Фичи и потенциал развития продукта за счет увеличения его ценности тоже есть, но текст и без того длинный.

#нужноделать

Материал дополнен редакцией

Материал опубликован пользователем. Нажмите кнопку «Написать», чтобы поделиться мнением или рассказать о своём проекте.

Написать
{ "author_name": "Александр Александр", "author_type": "self", "tags": ["\u043d\u0443\u0436\u043d\u043e\u0434\u0435\u043b\u0430\u0442\u044c"], "comments": 12, "likes": 8, "favorites": 14, "is_advertisement": false, "subsite_label": "contest", "id": 48002, "is_wide": true, "is_ugc": true, "date": "Sat, 13 Oct 2018 16:50:50 +0300" }
{ "id": 48002, "author_id": 82219, "diff_limit": 1000, "urls": {"diff":"\/comments\/48002\/get","add":"\/comments\/48002\/add","edit":"\/comments\/edit","remove":"\/admin\/comments\/remove","pin":"\/admin\/comments\/pin","get4edit":"\/comments\/get4edit","complain":"\/comments\/complain","load_more":"\/comments\/loading\/48002"}, "attach_limit": 2, "max_comment_text_length": 5000, "subsite_id": 208252, "possessions": [] }

12 комментариев 12 комм.

Популярные

По порядку

Написать комментарий...
5

"Ты ж программист. Сделай так, чтобы комп понимал книгу и кратко пересказывал. Ну что тебе стоит, там же работы на пять минут? Что, не умеешь? Хреновый ты, видать, программист".

Ответить
2

Бред, гуглите парня который такое сделал, лет 8 назад.
Сейчас работает в Yahoo

Ответить
0

Тоже видел что-то подобное, насколько я помню - не очень успешная тема была.

Ответить
1

8 лет назад многое было по-другому
1) насколько были развиты технологии?
2) сколько пользователей было в интернете и какова была их вовлеченность?
3) какова была потребность в самообучении в интернете?
4) объем ugc и доля полезного контента в общей массе?

ps
yahoo еще жив?

Ответить
2

автор не понимает что такое ИИ и как это работает сейчас

Ответить
0

если бы я понимал как работает ИИ, то не стал бы публиковать идею, а пошел ее реализовывать

Ответить
1

Даже самые навороченные сети не могут понять текст, поэтому выжимка будет бессмысленная.

Ответить
0

Это делает gensim либа на питоне, блок называется summarization.summarizer. На выходе получается выжимка, но отчасти бредовая. Если вы не читали исходный текст, то summary скорее собьет вас с толку. Пока ИИ не будет понимать смысл текста, а не просто технический набор корпуса, не сможет его сформулировать и закодировать эффективно в новый текст не потеряв смысл, это не сработает.

Ждите квантовых вычислений. Это явно не стартапчик за выходные :)

Ответить
0

вы все правильно написали, но только квантовые вычисления тут не причем, их нет и не будет

Ответить
0

Называется суммаризатор. Работает в Google/ Yandex

Ответить
0

коммерчески успешные продукты в этой области есть?

Ответить
0

Тоже ходил с подобной идеей какое-то время назад. Даже находил подобный сервис из далёких ранне-интернетных дней. Лень опять искать, но идея была такая:
- Подсчитываем, какие слова чаще всего встречаются в тексте (за исключением предлогов).
- Раз какие-то слова часто встречаются, значит они важные. А значит, предложения с ними важнее, чем предложения без них. Убираем из текста наименее важные предложения, оставляя наиболее важные.

Такой подход и в самом деле работает лучше просто случайного выкидывания предложений. Но недостаточно лучше, чтобы это приносило пользу. Часто выкидывало важное, часто оставляло похожие/одинаковые предложения.

Ответить
0
{ "page_type": "article" }

Прямой эфир

[ { "id": 1, "label": "100%×150_Branding_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox_method": "createAdaptive", "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfl" } } }, { "id": 2, "label": "1200х400", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfn" } } }, { "id": 3, "label": "240х200 _ТГБ_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fizc" } } }, { "id": 4, "label": "240х200_mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "flbq" } } }, { "id": 5, "label": "300x500_desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "ezfk" } } }, { "id": 6, "label": "1180х250_Interpool_баннер над комментариями_Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "bugf", "p2": "ffyh" } } }, { "id": 7, "label": "Article Footer 100%_desktop_mobile", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjxb" } } }, { "id": 8, "label": "Fullscreen Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjoh" } } }, { "id": 9, "label": "Fullscreen Mobile", "provider": "adfox", "adaptive": [ "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fjog" } } }, { "id": 10, "disable": true, "label": "Native Partner Desktop", "provider": "adfox", "adaptive": [ "desktop", "tablet" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyb" } } }, { "id": 11, "disable": true, "label": "Native Partner Mobile", "provider": "adfox", "adaptive": [ "phone" ], "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "clmf", "p2": "fmyc" } } }, { "id": 12, "label": "Кнопка в шапке", "provider": "adfox", "adaptive": [ "desktop" ], "adfox": { "ownerId": 228129, "params": { "p1": "bscsh", "p2": "fdhx" } } }, { "id": 13, "label": "DM InPage Video PartnerCode", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox_method": "createAdaptive", "adfox": { "ownerId": 228129, "params": { "pp": "h", "ps": "bugf", "p2": "flvn" } } }, { "id": 14, "label": "Yandex context video banner", "provider": "yandex", "yandex": { "block_id": "VI-223676-0", "render_to": "inpage_VI-223676-0-1104503429", "adfox_url": "//ads.adfox.ru/228129/getCode?pp=h&ps=bugf&p2=fpjw&puid1=&puid2=&puid3=&puid4=&puid8=&puid9=&puid10=&puid21=&puid22=&puid31=&puid32=&puid33=&fmt=1&dl={REFERER}&pr=" } }, { "id": 15, "label": "Плашка на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byudx", "p2": "ftjf" } } }, { "id": 16, "label": "Кнопка в шапке мобайл", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "adfox": { "ownerId": 228129, "params": { "p1": "byzqf", "p2": "ftwx" } } }, { "id": 17, "label": "Stratum Desktop", "provider": "adfox", "adaptive": [ "desktop" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fzvb" } } }, { "id": 18, "label": "Stratum Mobile", "provider": "adfox", "adaptive": [ "tablet", "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "pp": "g", "ps": "bugf", "p2": "fzvc" } } }, { "id": 19, "label": "Тизер на главной", "provider": "adfox", "adaptive": [ "desktop", "tablet", "phone" ], "auto_reload": true, "adfox": { "ownerId": 228129, "params": { "p1": "cbltd", "p2": "gazs" } } } ]
Голосовой помощник выкупил
компанию-создателя
Подписаться на push-уведомления
{ "page_type": "default" }