Как нейросети помогают писать книги

Как нейросети помогают писать книги

Прямо сейчас мы наблюдаем явление мировой культуры, сопоставимое с появлением печатного станка Гутенберга: нейросети ворвались в нашу жизнь, причем в ту ее сферу, где искусственный интеллект ждали меньше всего — в искусство.

Делимся опытом, как с помощью новейших технологий создавать литературу, публицистику, да и вообще контент в широком смысле.

Что такое Rideró и причем здесь нейросети

Rideró — это издательский сервис, который позволяет любому человеку создать, сверстать и опубликовать свою книгу так, чтобы ее могли купить люди по всей России в печатном и электронном виде.

Почему я, человек из Rideró, здесь говорю о нейросетях? Потому что Ridero построен на системе распознавания текста нейросетью. Эта система работает 8 лет и с ее помощью авторы опубликовали 130 000 книг.

Нейросети — убийцы творческих профессий?

Здесь мы не станем распространяться о том, как устроены нейросети и как они изменят нашу жизнь в целом — про это и так много говорят.

Мы сомневаемся, что креативные профессии — сценаристы, писатели, художники — на самом деле пострадают. И этому есть две причины.

Люди на самом деле хотят читать людей. Для многих читателей и зрителей важно, что контент, который они смотрят и читают, создал другой человек — это произведение не просто «выпало» из нейросети.

Нейросети тоже переживают естественный отбор. В отрасли останется небольшое количество самых конкурентоспособных инструментов с высоким порогом доступа. Даже среди людей далеко не каждый умеет создавать классные книги и сценарии. Например, в Голливуде сотни тысяч сценаристов. Но фактически все лучшие сериалы, которые мы смотрим, пишет маленькая группа людей, просто потому что они этому лучше всех научились. И я думаю, что с нейросетями будет примерно то же самое.

Как нейросети применяют в книжной отрасли

Важно понимать, что нейросети, которые я упоминаю, в основном англоязычные — над русскоязычным текстом с ними будет непросто работать, но других пока нет.

Инструменты для подготовки к написанию книги

Hive World. Инструмент помогает даже не столько придумать, сколько дать автору идеи и выйти из творческого ступора. Hive World генерирует сюжетные линии на основании популярных тем и тропов в литературе. Еще он отслеживает географические названия, имена, сюжетные ветки и арки.

Plottr. Оптимизирует структуру книги, пути развития сюжета и расположение глав. Все, кто профессионально занимается литературой, знают, что у книг есть общепринятая структура, которая лучше всего работает на сюжет — делает его понятным и последовательным. Plottr помогает автору сформировать из набора эпизодов связанный плавный сюжет.

Plottr уже обучен на популярных книгах по построению сюжета и делает работу за автора
Plottr уже обучен на популярных книгах по построению сюжета и делает работу за автора

GPT-4. Это одна из наиболее обширно мыслящих нейросетей, которые сейчас доступны обычному потребителю. Технологию можно широко применять в работе с текстом: редактировать и корректировать текст автора, генерить какие-то идеи.

Нейросети для генерации изображений

Ключевые — это Midjourney, DALL-E и Stable Diffusion. Они, например, могут помочь автору визуально прототипировать персонажа, какую-то локацию из книги или сценария. Потому что, когда нужно придумать много персонажей, особенно второстепенных, мозг может исчерпать ресурсы. А тут нейронка визуализирует персонажа, которого потом можно описать и прекрасно использовать.

Ниже представлены генерации Midjourney (изобр. 1), Stable Diffusion (изобр. 2) и DALL-E (изобр. 3) по запросу "a warrior with a sword" (воин с мечом).

Инструменты для работы над текстом

Quillbot. Это штука, которая помогает чистить текст и делать его более читабельным: перефразировать, сокращать, дописать, искать фактологию и цитировать. Quillbot работает с уже существующим текстом.

Интересует ваше мнение!

Как вы думаете, заменит ли Quillbot редактора? Поэкспериментируйте и напишите в комментариях, как он справился.

Grammarly. Популярный плагин-помощник, который может помочь авторам улучшить свои рукописи, предоставляя отзывы и предложения по грамматике, орфографии и пунктуации в режиме реального времени.

ProWritingAid. Инструмент редактирования и корректирования с поддержкой ИИ. Может помочь авторам улучшить свои тексты, обнаруживая грамматические, орфографические и пунктуационные ошибки, а также проблемы со стилем.

AutoCrit. Сервис, разработанный специально для писателей. Использует алгоритмы машинного обучения для анализа текста и предлагает улучшения в грамматике, стиле и сюжете.

Microsoft Copilot. Совсем новый сервис на базе GPT. Встроен в привычные программы. Функционально аналогичен GPT. Это пока что единственный сервис, который может работать и с русскоязычным текстом. Это фактически внедрение инструментов нейросетей в наши привычные повседневные программы, которыми мы пользуемся в работе. Это Word, PowerPoint, Excel.

При подписке Microsoft 365 в них всех уже внедрен этот сервис. Он помогает в привычном окне Word делать те же самые вещи, которые может GPT: редактировать текст, сокращать его, переписывать, делать краткие содержания. Все это можно делать внутри Microsoft. Остальные перечисленные тут инструменты тоже в принципе неплохи, но не буду на них так подробно останавливаться.

Инструменты для верстки книги

Rideró. Это наш сервис. Нейросеть помогает авторам в верстке книг уже очень давно, с самого основания сервиса. Особенность в том, что вы можете загрузить вообще не сверстанный файл, и встроенные в редактор нейросети распознают структуру, выделят заголовки, смысловые элементы, поэзию, эпиграфы и так далее.

Metranpage. Еще один классный российский инструмент. Это тоже сервис для автоматизированной верстки книг. Его большое преимущество, на мой взгляд, в том, что результат его работы можно выгрузить в формате InDesign. InDesign — это основная программа, которая используется для верстки в издательствах и полиграфии. Можно дать Metranpage возможность сверстать на сайте, потом выгрузить текст в InDesign и там дальше доработать, если что-то нужно.

Adobe Sensei. Adobe сделала точно так же, как у Microsoft. Взяли нейросеть и внедрили ее в уже привычные пользователям InDesign и Photoshop. Она делает не то чтобы очень много, но помогает как-то ускорить процессы: подогнать картинки побыстрее, улучшить сочетаемость шрифтов. Хороший инструмент, который также упростит и ускорит работу профессионалов.

Инструменты для работы с изображениями

Midjourney. На мой взгляд, это сейчас самый развитый инструмент для генерации картинок по текстовому описанию. На примере ниже — результат наших тестов по созданию книжных иллюстраций с помощью этой нейросети. Как вы видите, все эти изображения довольно абстрактные: на них есть какие-то узнаваемые образы, но это не слишком реалистично.

Нейросеть ускоряет создание иллюстраций и обложек в сотни раз. Если работа иллюстратора над обложкой занимает 1-2 недели, то Midjourney в умелых руках сгенерирует 10 вариантов за час. И книга получит обложку хоть в стиле аниме, хоть в стиле Айвазовского.

Этот сервис очень сильно вырос за то время, которое мы за ним наблюдаем. На примере ниже вы видите изображение, созданное по одному и тому же запросу: «маленькая рыжая лиса читает книгу». Лиса — это наш символ, мы их очень любим, поэтому делаем с лисами все тестовые изображения.

Крайняя левая картинка — это результат от самой первой версии Midjourney. При желании это можно принять за лису, но не более. Вторая и третья картинка — работы второй и третьей версии соответственно. Видно, как нейросеть развивается: лиса все больше походит на лису, книга все больше походит на книгу.

А потом вышли четвертая и пятая версии Midjourney. За последние полгода нейросеть превратилась из рисовальщика каракулей в художника-реалиста. На картинках из пятой версии книжка и лиса устроены правильно и выглядят очень реалистично.

Такой генератор картинок дает писателю

  • обложки,
  • иллюстрации для внутренней части книги,
  • картинки к постам в соцсетях,
  • буктрейлеры
  • баннеры для рекламы.

Главный минус Midjourney в том, что исчезла бесплатная версия.

Stable Diffusion. В отличие от Midjourney инструмент полностью бесплатный, у него открытый исходный код. У Stable Diffusion пока не такие впечатляющие результаты, но если что, можно пользоваться.

Ниже представлены генерации по двум запросам: "soft watercolour realistic illustration of handsome longhaired man playing guitar — no anime" (длинноволосый привлекательный мужчина играет на гитаре, акварель, не аниме) и "soft watercolour realistic illustration of a laughing little girl playing with a puppy — no anime" (смеющаяся девочка играет с щенком, акварель, не аниме).

Инструменты для маркетинга

API Personality Insights от IBM Watson. Это приложение для суперкомпьютера IBM Watson. Оно может анализировать активность человека в социальных сетях, чтобы определить качества его личности и предпочтения. Эти данные можно использовать для создания целевых маркетинговых кампаний.

C одной стороны, это прекрасное приложение, а с другой — пугающее. Оно очень точно анализирует социальные сети человека и помогает по его социальным сетям сделать его потребительский портрет. Это то, что интересует любого рекламодателя. Личные качества, предпочтения — все, что можно использовать для того, чтобы максимально хорошо попасть в вас рекламой.

Publish Rocket. Раньше он назывался Book Rocket. Это инструмент на основе алгоритмов поиска Amazon, который делает так, чтобы вашу книгу легче находили в поисковиках и онлайн-магазинах. Publish Rocket помогает найти лучшие ключевые слова для названий и описаний книг. Читатели привыкли видеть конкретный набор тегов на определенном жанре в магазине, читать типичные для жанра аннотации. И чтобы лучше попадать в их ожидания, можно воспользоваться этим инструментом.

BookCore. Это аналитическая платформ на базе ИИ, которая помогает авторам отслеживать продажи их книг по различным каналам, а также анализировать отзывы читателей для улучшения будущих книг. Например, можно запустить в продажу одну и ту же книгу, но с разными названиями, немного разными обложками и посмотреть, какая лучше будет продаваться. Это типичные АБ-тесты, и с помощью этой платформы их удобно делать. Тем более, что собирать статистику руками с кучи разных площадок не очень приятно.

GPT. Рассмотрим эту платформу уже как маркетинговый инструмент. Вот самые очевидные варианты применения:

  • Подготовка аннотаций для книги в нескольких вариантах — для разных площадок, разных аудиторий и т. д.
  • Создание теглайнов. Теглайн — это рекламное высказывание в одну строку, которое позволяет читателю легко понять, о чем книга.
  • Создание текстов для рекламных объявлений и соцсетей.
  • Анализ жанров и расстановка тегов по небольшому фрагменту текста. Отличный сценарий для человека, который работает с большим количеством книг, но не пишет сам. Очень удобно, если нужно, например, подготовить выставочный стенд и каким-то образом его отсортировать.
  • Подготовка синопсисов для экранизаций.

Озвучивание книг

Озвучивание развито сейчас чуть-чуть меньше, чем генерация текста или изображения, но оно развивается тоже быстро. Я уверена, что уже в ближайшие годы роботизированные голоса будут практически неотличимы от человека.

  • Много инструментов: Yandex Text-to-Speech, Aimyvoice, Tinkoff, Sber, Google, Amazon и прочие.
  • Озвучивание в десятки раз дешевле, чем работа живого диктора.
  • Диапазон голосов разных полов, эмоциональных окрасок и языков.

Мы в Rideró пользуемся в основном Yandex Text-to-Speech. Это штука, в которую ты загружаешь текст, помечаешь, где нужно правильно поставить ударение, паузы, указать, какие слова произносятся особым способом. Последнее актуально для писателей, которые пишут, к примеру, в жанре фэнтези: там много имен, которых нет в реальном мире. Таким образом обучаешь нейросеть, как тебе нужно это прочитать, и она великолепно читает.

Это очень дешево по сравнению со стоимостью услуг профессионального актера озвучивания. Понятно, что профессионал задает качеству книги совсем иной уровень. Я знаю примеры книг, которые озвучены живым актером очень хорошо: артист привносит в авторский текст так много, что аудиоверсия сама по себе становится отдельным художественным произведением.

Поэтому я не думаю, что нейросети окончательно заменят здесь живых людей. Но в прикладных целях озвучивание роботом точно гораздо удобнее. Делюсь записанными фрагментами озвучивания.

Первые три записи — это как раз Yandex TTS. Там можно выбрать много разных голосов, c десяток. И у каждого есть еще встроенные эмоциональные окраски. Например, второй пример называется «angry», то есть злой голос. По мне он просто звучит в традициях СМИ.

Четвертый вариант — гугловская озвучка — сейчас работает с наихудшим качеством, но, с другой стороны, она и полностью бесплатная. Через инструменты Google можно озвучить любой фрагмент текста бесплатно. И это окупает более низкое качество.

Инструменты для перевода текстов

Мы уверены, что человек-переводчик всегда работает лучше, чем любая нейросеть. Но нейросеть поможет этому человеку-переводчику сделать свою работу быстрее. И в конечном итоге оптимизирует его работу.

Яндекс. Translate, Google. Translate и переводчик Microsoft. Это наиболее базовые, общедоступные, но при этом наименее качественные варианты. Они посредственно работают с идиомами, сложносочиненными, сложноподчиненными предложениями и вообще не понимают контекст. То есть у них нет функции хранения контекста.

Deepl. Более профессиональный инструмент перевода с ИИ. Его создатели одни из первых стал использовать нейросети для обучения переводчика. В итоге Deeple отлично работает со сложной структурой, идиоматическими предложениями, понимает контекст.

Увы, для художественных текстов он не подходит. Потому что Deepl берет структуру предложения в одном языке и полностью дублирует ее в другом. Живые люди так не говорят. Например, структура предложений в японском и русском языках различна. И японец, который откроет перевод русской книги от Deeple, сразу заметит изъян.

SDL Trados. Самый продвинутый на сегодня инструмент. Он умеет обрабатывать большие тексты, интегрироваться с другими программами, но для любителя будет сложноват. Trados очень много лет используют профессиональные переводчики — он сильно ускоряет им процесс перевода. Правда, это скорее база переводческой памяти, чем переводчик.

Краткий список сервисов и инструментов, которые помогут авторам работать над книгой:

Rideró — верстает текстовый файл в готовую книгу во всех форматах за несколько минут. На выходе получается электронная книга, пригодная для чтения на любых устройствах и макет для печати бумажной книги.

Hiveword — генерация сюжетных линий на основании популярных тем и тропов в литературе. Отслеживание географических названий, имен, сюжетных веток и арок.

Plottr — оптимизация структуры и организации книги, путей развития сюжета и расположения глав. Платформа использует алгоритмы машинного обучения для анализа структуры и организации романов.

GPT-4 — наиболее универсальный ИИ. Первый черновик: выход из творческого тупика, текстовое прототипирование персонажей, мозговые штурмы, поиск сюжета.

Midjourney / Dall-E-2/ Stable diffusion — визуальное прототипирование персонажей и локаций.

QuillBot — ускорение процесса написания книги: перефразирование, сокращение, дописывание, поиск фактологии и цитирование в одном окне.

Grammarly — это популярный помощник по написанию текстов с искусственным интеллектом, который может помочь авторам улучшить свои рукописи, предоставляя отзывы и предложения в режиме реального времени.

ProWritingAid — это инструмент редактирования с поддержкой ИИ, который может помочь авторам улучшить свои тексты, обнаруживая грамматические, орфографические и пунктуационные ошибки, а также проблемы со стилем.

AutoCrit — использует алгоритмы машинного обучения для анализа текста и предлагает улучшения в грамматике, стиле и сюжете.

Microsoft Copilot — совсем новый сервис на базе GPT. Встроен в привычные программы. Функционал аналогичен GPT.

Статью подготовила директор производства издательского сервиса Ridero Мария Рявина.

55
Начать дискуссию