{"id":13506,"url":"\/distributions\/13506\/click?bit=1&hash=27fcb5113e18b33c3be66ae079d9d20078d1c30f1b468cdc86ecaeefa18446c2","title":"\u0415\u0441\u0442\u044c \u043b\u0438 \u0442\u0432\u043e\u0440\u0447\u0435\u0441\u0442\u0432\u043e \u0432 \u043f\u0440\u043e\u0433\u0440\u0430\u043c\u043c\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u0438? \u0410 \u0435\u0441\u043b\u0438 \u043d\u0430\u0439\u0434\u0451\u043c?","buttonText":"\u0423\u0436\u0435 \u043d\u0430\u0448\u043b\u0438","imageUuid":"2c16a631-a285-56a4-9535-74c65fc29189","isPaidAndBannersEnabled":false}

Неваляшка AiSEO - сервис генерации статей для сайтов. Кейсы и этика

Мы в Аватар Машина запускаем проект Неваляшка ИИ для SEO: нейросеть напишет статью для сайта.

Слоган у нас такой: "Искусственный интеллект для SEO оптимизации вашего сайта: поможет написать статью на любую тему с упоминанием ваших ключевых слов. Никогда не устает и дешевле услуг копирайтера".

Пример генерации статьи сервисом Неваляшка AiSEO
Содержание скрыто
Показать
Цифровое искусство в России получило второе рождение. Об этом корреспонденту «[источник]» рассказал руководитель департамента цифрового искусства Минкульта Михаил Пиотровский, передает ТАСС со ссылкой на пресс-службу ведомства. В настоящий момент насчитывается около 20 миллионов копий картин из коллекций Эрмитажа и Третьяковки по всему миру, а также копии произведений живописи и графики. К настоящему времени цифровой мир насчитывает более 30 миллиардов изображений, что составляет примерно 25 процентов мирового рынка. Цифровое искусство в России получило вторую жизнь. Об этом сообщается на официальном сайте Федеральной службы по интеллектуальной собственности (Роспатент). «Появилась возможность использовать цифровые технологии для создания произведений искусства и рекламы», — говорится в пресс-релизе, который поступил в редакцию «[источник]» во вторник, 15 апреля. Отмечается, что это первый случай использования цифровых технологий при создании картин с использованием цифровой подписи. Ранее сообщалось о том, что в Москве будет установлен памятник художнику Владимиру Маковскому. Цифровое искусство в России получило широкое распространение, так как оно позволяет делать фотографии людей с помощью нейронных сетей. Об этом говорится на сайте Минкомсвязи России. По данным аналитической компании IDC, за последние десять лет число пользователей цифровых устройств выросло примерно вдвое по сравнению со всеми предыдущими поколениями смартфонов и планшетов. Это связано с тем, что многие из них работают под управлением операционной системы Android 4.0 Marshmallow или той же ОС Windows Phone 5.1. В то же время большинство пользователей мобильных гаджетов используют другие браузеры и приложения для работы с ними.

Что умеет

А в чем фишка? Отличие нашего решения от просто моделей, которые вы наверняка уже пробовали(имею ввиду Балаболу от Яндекса или сервис Сбера) в том, что вы сможете указывать ключевые слова, и эти слова появятся в сгенерированной статье.

Статья при этом будет тематическая - на любую вашу тему, просто дайте примеры текстов при покупке тарифного плана. Это дает вам больший контроль над содержанием, чего при обычном тюнинге(обучении нейросети) добиться не выйдет.

Сейчас для Беты мы поддерживаем всего 6 тем для генерации: Экономика, Реклама, Техника(Гаджеты), Стиль, Квартира, Культура(Искусство). Это значит, что на другие темы нейросеть тоже будет писать, но качество и логичность будет ниже.

Мы проверили качество сгенерированного текста в сервисе https://text.ru Уникальность в среднем от 70% до 90%, правда есть вопросы по другим метрикам.

Стоимость сгенерированной статьи при этом в 5 раз ниже, чем в среднем у человека.

Что под капотом

Внутри находится ruGPT3 от Сбера. Мы затюнили ее с разными параметрами и запускаем 3 модели, генерируем сразу 9 статей, а затем выбираем 3 лучших. Сейчас статьи похожи на фейк-ньюс, но, если дадите другой набор данных для обучения(например с сайтов нужной тематики), то можно получить генератор любого стиля: хоть статьи про недвижимость, хоть сказки, рекламные тексты, описания товаров и тп.

Пример генерации статьи про недвижимость

Этика

Как вы могли бы предположить — первое, что мы внутри команды обсуждали, когда задумывали запуск — это собственно вопросы этики. Мне бы не хотелось, чтобы сервис использовали для "замусоривания" интернета. Вот мы и пытаемся понять: для чего он будет полезным?

Хочу спросить у сообщества: как вам такой сервис? Будете пользоваться?
Мне хочется понять, а какой рынок у такого сервиса? Кажется, что рынок максимально широкий: мы при анализе рынка только в РФ насчитали объем копирайтинга около 100млн руб в год. Хотим понять, какие ниши приоритетные, какие сайты захотят генерировать статьи в нашем сервисе, с кем партнериться, чтобы быстрее без затрат на рекламу продвинуть такой сервис? Вообще, всякая критика приветствуется. Тем более, тема искусственного интеллекта на хайпе, а подобного сервиса еще в РФ нет(для товарных описаний видел только).

Для кого

Мы провели небольшой кастдев и есть ощущение, что сервис будет полезен там, где нужно будет быстро рерайтить новости, где не так важна аналитика и оригинальность, как скорость. Это готовы читать и сервисы, и люди, нужна информация, информация структурированная. Плюс простые статьи под SEO запрос, например, для первичного продвижения и индексации сервиса/продукта.
Возможно, таким сервисом могут пользоваться и сами копирайтеры — сервис генерит рыбу, размечает ключи, а ты потом сверху второй волной накатываешь то, что заставляет людей читать тексты. У роботов есть проблема — смысловые акценты в контексте и эмоциональные акценты им расставлять очень сложно. Еще одна проблема — фактология, сейчас генеративные нейросетки намешивают факты в кучу, среди них есть устаревшие или совсем несуществующие факты и даже фантастические названия компаний и сервисов. Это можно исправить, но интересует именно "порог", начиная с которого копирайтеру легче будет исправлять статью, а не писать новую, забив на сложные исправления.
Если возникнут вопросы или предложения, заходите на сайт http://aiseo.ru/ или в нашем чате Телеграм https://t.me/newton_ai_chatbot

0
43 комментария
Написать комментарий...
Казенный спрей

Да, ваш сраный сервис будет использован для замусоривания интернета.
Итак, чтобы найти крупицу полезного, приходится порой прорываться сквозь мегатонны пустой и бесполезной информации.

Ответить
Развернуть ветку
Виктор Носко
Автор

Возможно, вы хотели бы сервис, отличающий одно от другого как надстройка к браузеру?

Ответить
Развернуть ветку
Game Topia

Да, точно. Сначала усрите весь интернет а потом продавайте решения. Вы реально больны.

Ответить
Развернуть ветку
Виктор Носко
Автор

Вы минус дали, что я ваш коммент похожим на бота назвал, но разве вы опять не повторяете то же самое?
С чего вы взяли, что мы будет засорять? Интернет, батенька, вообще-то уже засорен, проблема УЖЕ есть, чуете разницу? Я задаю вопрос: если мы ее решим, было бы полезно? А вы этого не понимаете и продолжаете обвинять.

Ответить
Развернуть ветку
Евгений Кирьянов

Мы делаем новый автомат, но очень надеемся, что его не будут использовать, чтобы стрелять! 

Однозначно подобные сервисы будут использовать для создания разного рода кликбейтных сайтов для получения копеечных трафиков. Прикрутите еще генератор кликабельных заголовков с a/b тестированием и у вас готов рерайтный генератор новостных сайтов. 

Ответить
Развернуть ветку
Виктор Носко
Автор

Я бы не хотел уходить в философский холивар, а то мне минусов дадут). Но по вашей логике выходит, что любые работники металлургических заводов, а также горнорудных виноваты в том, что поставляют металл на оружейные. Они что, не знают, что оружие там делается и для чего оно делается? Знают, ну вот и виноваты. Должны ли они перестать поставлять металл? Как к ответу призывать будете?
Вы так далеко зайдете, в эзотерику и во всеобщую вину. Лучше посмотрите фильм Калашников и в каком свете его история подана.
А по существу: мы каждого клиента будем знать и сами контролировать что кому продаем. Если бы этого не написал - я бы понял ваш коммент. Но это прямо написано в разделе Этика - что мы в курсе проблемы.

Ответить
Развернуть ветку
Евгений Кирьянов

металл не только для оружия делают. 
А вы в разделе этика пишете, что делаем не для сео спама, а потом в разделе для кого пишите - мы делаем для сео и быстрого рерайтинга, где не очень важно качество. 
Вы уж сами разберитесь) 

Ответить
Развернуть ветку
Виктор Носко
Автор

Так мы и разбираемся)
Тут нет противоречия: для seo, но не для seo спама. Мне писали те, кто в seo работает, из диджитал агентств, они сразу поняли места и процессы, которые оптимизировать можно.
Так а можно ответ на мой вопрос: я про металл именно для оружия. И еще про тепловую энергетику, которая природу загрязняет - давайте откажемся, а то карму испортим себе. Кто хочет побыть Сахаровым и повыступать против бомбы - велкам, но тяжкая это ноша.

Ответить
Развернуть ветку
Евгений Кирьянов

А по делу - не работает. Кинул запрос и ждал минут 15 ничего не произошло. 
Зашел через пару часов вообще бесконечная загрузка страницы.

Ответить
Развернуть ветку
Екатерина Растворова

Отличная идея! Почему так все ругаются в комментах? Вместо копирайтеров тексты для роботов будет писать АИ - по-моему отличный вариант. Круг замкнется: тексты читают роботы, АИ их пишет, а люди наконец пойдут обратно в библиотеку:)
Для стартапов тоже плюс, вместо того, чтобы тратить свою энергию на тексты, можно сосредоточиться на продукте.

Ответить
Развернуть ветку
Виктор Носко
Автор

Как я думаю причины 2:
1. Одну все озвучили, что некачественные тексты будут мешать читать людям сайты и мешать поисковикам. Я дал свой ответ на это: можно найти такие темы, где засорения не будет. Плюс, в фб уже несколько раз спросили, как побороть неправильные факты, решение тут тоже есть, правда, его нужно разрабатывать.
2. Вторая причина менее очевидна, тк многие не разбираются в ИИ и стартапах: выпущена бета, это значит, что а) не факт, что мы будем генерировать полные статьи и б) можно найти одни или 2 элемента в процессе работы копирайтера, которые можно автоматизировать. То есть генерируемый результат будет не готовой статьей а какой-то заготовкой. Пока изучаем рынок, какой именно.

Ответить
Развернуть ветку
Marat Nigametzianov

Котаны, давно пора!
Еще перевод всего этого в подкасты и засрем еще все подкастами!
И ютуб надо засрать. 
Это неизбежно и это надо делать обязательно.
Дальше надо утилиты сделать, чтоб заменить всякие курсы (типа юнитов Дашкиева), генераторы рекламы (уже есть иностранные).

Я сам нагенерил сейчас 200 песен прекрасной музыки и выпускаю 16го 6 альбомов.

Все должно генерится!

Ответить
Развернуть ветку
Виктор Носко
Автор

Неистово плюсую)))
До ютуба мы еще не добрались - а ведь нейросетки, которые генерят клипы, не намного хуже, чем LittleBig уже есть, да и рекламные видео тоже. Кто хочет их похейтить легко их нагуглите)).
Ну а если серьезно, автоматизация научных исследований, помощь композиторам в создании сэмплов музыки нужного звучания(на шарю в этом, но что-то типа крещендо на заказ - вот люблю торжественные, где кульминация есть и нужно это для фильма например - да круто же, заюзал бы такой сервис).
Скоро медиа индустрия изменится до неузнаваемости.
Советую такой новый сериал по теме, 2я часть вышла: Любовь, смерть и роботы https://www.kinopoisk.ru/series/1228254/

Ответить
Развернуть ветку
Game Topia

Чтобы руки отсохли у того программиста который создаст подобный сервис и при этом мне не посчастливится потратить свое время на чтение бото-статьи. Мне и так кажется, что здесь одни боты со схожими именами и фото созданных ИИ, так ещё теперь я на всех джунов буду также срываться и минусовать, думая что это боты. Вы только посмотрите сколько за последнее время здесь нелогичной  фигни написали. Читаешь и ум ломается, так как логики либо вообще нет, либо она протеворичива. 

Почему нет закона заставляющего помечать ботов и их продукты. Я не хочу тратить время на чтение херни и пустых диалогов с ними. Их создатели реально бездушные алчные уроды.

Ответить
Развернуть ветку
Виктор Носко
Автор

Вы имеете ввиду проблема на самом сайте vc.ru? Ну про vc отвечать не могу - не знаю. Мне кажется в вашем сообщении ну тоже конструктива не хватает - даже я мог бы подумать, что это типично сгенерированный хейт-коммент, наша нейросетка такое может.
По поводу закона - только недавно вышли ГОСТЫ по ИИ, проблема есть, согласен, что такое нужно.
Ну и хотелось бы услышать позитивные кейсы применения.

Ответить
Развернуть ветку
Game Topia

Позитивные? Могу несколько написать! Но они вам покажутся позитивными, только если вы под словом позитив подразумеваете  запихивание ботов куда подальше. 

Ответить
Развернуть ветку
Виктор Носко
Автор

Напишите), одну идею уже нам подтвердили: что рерайт любых сложных статей(скажем научных) очень помог бы ученым любых сфер делать обзор отрасли. Сокращение времени и следовательно затрат на разработку продуктов.
Я вижу что негатив он связан с непониманием как работает технология: ведь можно нейросеть обучить понимать разные темы, можно взять не rugpt3 а другую и сделать спинофф продукта.
Еще?

Ответить
Развернуть ветку
Game Topia

Я хочу читать опыт реальных людей, а не в сотый пересказ бота по имени Василиса Лампочкина и фото голивудского лица на фоне декораций. Исходя из этого - мне безразлично как будет написано, поскольку я не хочу читать БОТОВ!

Ответить
Развернуть ветку
Виктор Носко
Автор

Вы думаете я от вас отстану тк вы хейтер? Нет, я вас смогу переубедить.
Вот смотрите: берем некую сложную тему, про отношения, скажем и генерируем что-то типа ответа на вопрос. Польза очевидная.
Генерация статей про культуру - тоже особых проблем с фактами там быть не должно, тк в ней они не так часто обновляются. Но круто было бы читать сжатые мнения на фильмы, книги, отзывы например.
Вот этого я от вас хочу - расширьте сознание, не упирайтесь в одну тему

Ответить
Развернуть ветку
Vladimir Batenev

в чем готов поддержать автора, что не попробовав, поскольку эта шляпа  из-за ошибок в коде у меня и за 5 минут ничего пока не родила, критикуете :) было бы что

Ответить
Развернуть ветку
Виктор Носко
Автор

Сейчас попробовал, работает, минуту генерировал, параметр поставил 200 слов.
Возможно сейчас идет наплыв людей на демку, тк мы везде запостили анонс, а сервер не сильно мощный, как видите, такое время генерации связано с тем, что она на CPU работает (на GPU было бы за 1-2 сек, но это дороже)

Ответить
Развернуть ветку
Виктор Носко
Автор

Сегодня отвечал на более чем 100 комментов в ФБ про этот сервис).
Мы вообще-то ИИ игру еще запустим - думаю там хейта особо не будет. Но почему: потому что игроиндустрия просто уже прошла эту стадию. Вспомните, как наши родители относились к тому что мы за компом торчим и в клубы ходим(я был студентом ходил на ночь играть). Как обвиняли игры в насилии(стрелялки и др). А сейчас все в мире играют, Рокстар миллиарды заработал на гта5, все их уважают, инвесторы вкладывают в Доту2, в киберспорт. А запускали бы игру лет 15 назад - были бы врагами народа. Сейчас же у основателей Playrix все интервью берут и хвалят, какие они классные - а они казуальные игры делают, ага, ровно те, в которых просто убивается время на планшете. Казанский директор ставок на спорт в Что Где Когда спонсором стоит и никто его не хейтит, уважаемый.
Ау, да это же игры, да это же ставки на спорт?? А вот приняло их общество. И Сбер тоже будет игры делать. Да не просто делать - а детей к ним приучивать, у них это в программе.
Так и с ИИ будет. Сейчас понемногу начинают все плакать, что ИИ заберет работу, погодите - еще увидим, что мы в этом виноваты))

Ответить
Развернуть ветку
Александр Ерёмин

Если этот комментарий сгенерирован вашим ИИ, то вышло не очень 😂

Ответить
Развернуть ветку
Виктор Носко
Автор

Если взять большую модель - будет похоже, у нас взяты модели поменьше.
Ну и второе, как можно оценить, что коммент настоящий: в нем есть целеполагание, то есть в сжатом тексте есть разные по сути "стили повествования": посыл, аргументы и вывод. Пока gpt трудно такое делать, нужно ее хорошо дорабатывать.
Это я серьезно ответил чтобы не спамануть шуткой, тут и за шутку минусанут я так вижу))

Ответить
Развернуть ветку
Александр Ерёмин

Это была ирония. Вы смешали в кучу все что только смогли.

Вы сделали какашку, но если она поможет вам заработать денег, то вы молодцы. Кроме засирания поисковой выдачи никакой "ценности" этот продукт иметь не будет. Так какой смысл оправдываться, что у тех казуальные игры, а вот у этих ставки на спорт? Это никак не умаляет того, что продукт, о котором вы рассказали, привнесет больше вреда, чем пользы. Да, людям в комментариях это не нравится, потому что никому не хочется читать сгенерированный бред.

Так и с ИИ будет. Сейчас понемногу начинают все плакать, что ИИ заберет работу, погодите - еще увидим, что мы в этом виноваты))

Люди не против ИИ, им просто не нравится ваш продукт)))

Ответить
Развернуть ветку
Виктор Носко
Автор

Я с вами не согласен, и у меня есть факты:
1) Уже поступило несколько обращений, есть обращения и по генерации статей и по рерайту. В каждом обращении задачи разные, но в целом хотят использовать часть генерации для дальнейшей ее доработки уже в ценную статью. То есть как ценность это убрать рутину при написании статей. Там есть даже потребность из сухих табличных фактов генерировать повествовательный текст. Это к вопросу о замусоривании - если текст по фактам, то этой проблемы уже нет.
2) Продукт бета, я думаю, людям не нравится позиционирование продукта. Но мы с этим поработаем, поверьте, у меня есть опыт запуска разных сервисов и всегда удавалось людям объяснить суть, не сразу, но удавалось.
А я не оправдывался: я описал то, как меняется мораль общества, когда сервис вырастает, зарабатывает миллионы и когда технический прогресс влияет на мораль. Так будет и здесь: стоит нам показать пользу и несколько кейсов полезности, как вы тут же из критика станете нашим последователем) - исторически такие критики как раз и являются потом самыми рьяными защитниками и early adopters

Ответить
Развернуть ветку
Vladimir Solovev

Это аналог writesonic, но хуже?  Вообще, за этими сервисами будущее. И ничего тут не поделаешь, надо извлекать выгоду.

Ответить
Развернуть ветку
Виктор Носко
Автор

Да, в целом аналог, причем пару таких сервисов уже видел зарубежных, там прям много типов генерируемых текстов с нужными данным предлагают.
Сейчас сервис проще. Также, как правило англоязычные делают генерацию с помощью GPT3 от OpenAi, ее в открытом доступе нет, то есть мы как разработчики не можем ее взять и обучить, они дают избранным компаниям доступ и то, ограниченный.
На английском повторить сервис технически - проблемы нет, появились аналоги, например GPT-Neo и в целом там качество генерации сопоставимое с оригиналом.
Так что будем изучать рынок и может быть сделаем и английскую версию

Ответить
Развернуть ветку
Vladimir Solovev

Русские тексты, на мой взгляд, плохо генерируются, практически не читаемы, белиберда. В отличии от выше сервиса (я им пользуюсь). Хотелось бы, чтобы и на русском языке были отличные тексты. Думаю, многие люди будут за это платить.

Ответить
Развернуть ветку
Виктор Носко
Автор

Это вопрос времени и денег. Русские тексты также могут быть хорошими.
Основное, базовое решение: обучить на вашу тему. Это и указано в тарифных планах. Однако я допускаю, что людям это пока непонятно, что это дообучение исправляет проблему. Им наверное хочется уже много готовых сеттингов, как в том сервисе - но это разработка и она стоит денег.
По сути сейчас один сеттинг - похожий на новости.
Мы сейчас занимаемся выявлением сегментов, для русскоязычного рынка возможно не все те сегменты будут нужны массово: то есть рекламные тексты или описания товаров да, но по остальным пока думаем.

Ответить
Развернуть ветку
Vladimir Solovev

Сколько вы вложили средств и времени, если не секрет, на создание такого сервиса?

Ответить
Развернуть ветку
Виктор Носко
Автор

1мес,тут небольшой рисеч был

Ответить
Развернуть ветку
Aleksei Shabelskii

пока у ИИ проблемы с логикой и фактологией, их рыбы райтерам бесполезны, даже для поиска какой-то фактуры по теме. 

Ответить
Развернуть ветку
Антон

Цитата из появившейся статьи: "Ранее стало известно о том, что ФНС зарегистрировала торговую марку «Тройка Диалог», которая является официальным дилером Apple Watch". Как же я ржал над результатом. Понимаю, что это бета, но все равно смешно.

Ответить
Развернуть ветку
Антон Кузиленков

Не так давно видел подобную штуку как объединение отзывов, Яндекс вроде анонсировал (могу соврать, уже не помню). Что то вроде: под товаром на сайте 9 тыс. отзывов и понятно что из никто читать не хочет, но все хотят знать суть, а нейронка собирает средний отзыв в один абзац. Интересная штука, мне кажется будет полезна в крупном е-commerce. Тут можно подумать в этом ключе…

Ответить
Развернуть ветку
Виктор Носко
Автор

Да, тоже видел, там правда результат у Яндекса иногда бывает противоречивым.
В целом такая задача называется суммаризация (и еще есть смежная задача paraphrasing - перефразирование). Мы думаем в эту сторону.

Ответить
Развернуть ветку
AVAKS Comp

Вам просто нужен чувак(скорее всего из Ваших, кто умеет или обучить и законтрактить), который настроит все для получения хороших вариантов для определенной ниши и будет предлагать настроить ваш продукт под клиента, до получения стабильного результата, за денежку.
Ну и конечно вести какой-нибудь информационный поток(видео скорее всего) про то, как он это делает, где сложности, что, мол, ошибкой станет и так далее...
Ну и в итоге побольше таких чуваков, готовых настраивать(обучать) под клиента, а там глядишь и комьюнити образуется и люди сами смогут все под себя настроить)

Ответить
Развернуть ветку
Виктор Носко
Автор

Да, спасибо, норм идея

Ответить
Развернуть ветку
Саша Марфицин

Нравится это кому-то или нет, за подобными сервисами будущее. 

Ответить
Развернуть ветку
Alex Dok

Чет не работает сервис. Что туда написать чтобы чтото выдалось?

Ответить
Развернуть ветку
Виктор Носко
Автор

Сейчас проверил - работает. Генерация просто не быстрая, тк там 3 модели сразу по очереди пишут.
Цифровое искусство в России получило
картина нейросеть генерация

Выдал:

Цифровое искусство в России получило второе рождение. Об этом говорится в пресс-релизе, который поступил в редакцию «[источник]» во вторник, 20 марта. Речь идет о картинах с цифровыми образами людей и животных. Среди них — «Котенок», написанный художницей Ириной Шнайдер (Irina Schnader), а также «Снежная королева». Третьяковская галерея пополнилась новыми произведениями художников: «Птица счастья» Сергея Соловьева, «Дерево желаний» Андрея Рублева, «Молот ведьм» Казимира Малевича, а также «Охотники за привидениями» Ильи Репина.

Ответить
Развернуть ветку
Alex Dok

Вам надо тогда пример показать а то непонятно что где писать

Ответить
Развернуть ветку
Виктор Носко
Автор

http://109.248.175.145:8501/
Обновили демку, перевели ее на streamlit
Демка теперь работает быстро.

Ответить
Развернуть ветку
Читать все 43 комментария
null