«Мы экономим компаниям 150 000 рублей»: как ReText.AI создал текстовую нейросеть для профессионалов

Всего за год сервис ReText.AI вырос из экспериментального синонимайзера в платформу, которую Tele2 назвала самой востребованной нейросетью. Как это удалось и какую роль в этом сыграло облако, рассказывают соосновательницы сервиса Ольга Шкряба и Елена Райтс.

<i>Сооснователи ReText.AI: СМО Елена Райтс, Head of Data Science Богдан Салып, CEO Ольга Шкряба, CTO Алексей Набережный</i>
Сооснователи ReText.AI: СМО Елена Райтс, Head of Data Science Богдан Салып, CEO Ольга Шкряба, CTO Алексей Набережный

ReText.AI — сервис перефразирования на основе нескольких нейросетей с умным синонимайзером. С его помощью за несколько секунд можно разнообразить, сжать или увеличить текст без потери смысла, а также проверить уникальность и проанализировать. Платформой пользуются копирайтеры, редакторы, блогеры и предприниматели.

С чего всё началось

Ольга Шкряба
CEO ReText.AI

Пока пользователей было мало — работал собственный сервер, и это было ненапряжно.

Наша компания специализировалась на SDK (software development kit — набор средств разработки), нейросетях и создавала сложные библиотеки под разные решения для заказчиков. Например, мы делали SDK для фото- и видеоредактора, который позволяет разработчикам встраивать готовые инструменты для редактирования медиаконтента — от простых операций вроде обрезки и цветокоррекции до сложных эффектов. Ещё мы делали аналог TikTok для создания коротких видеороликов. Наше решение объединяло инструменты для съёмки, редактирования и публикации видео.

Год назад мы исследовали несколько текстовых нейросетей для нашей студии разработки. Получили достаточно данных для машинного обучения и начали работать над синонимайзером для автоматизации собственных задач. В итоге он не пригодился. Но поскольку мы потратили много времени и сил, решили сделать его продуктом.

Мы попросили нашего дизайнера создать сайт под этот проект. Результат получился забавным — как будто страницу делал школьник, который только научился программировать. Тем не менее платформу зарелизили на своих серверах. Анонсировали выход сервиса в паре Telegram-каналов и стали ждать.

Где-то неделю была тишина. Потом начали приходить пользователи — всё больше и больше. Видимо, запустилось сарафанное радио, и бесплатный текстовый сервис внезапно стал популярным. Наши серверы уже тогда перестали вывозить такую нагрузку.

За 3–4 месяца мы разработали новую платформу. Это было непросто: раньше у нас была другая специализация — мы решали сложные математические задачи. Сейчас же нужно было создать с нуля целый сервис и нанять для этого новых специалистов.

Елена Райтс
CMO ReText.AI

Для продвижения сервиса мы подготовили PR-кампанию на основе SEO-ключей. Количество брендовых запросов за месяц выросло в 12 раз, а через три месяца — в 40 раз. Но проблема оставалась: мощностей своих серверов не хватало, нужно было умещаться в рамках небольшой инфраструктуры. Наши разработчики пытались ужимать модели, но скоро стало ясно, что для масштабирования необходимо переходить в облако. И мы начали подбирать подходящие варианты. Одной из сложностей было найти и распланировать бюджет.

Как искали бюджет и почему пришли в Yandex Cloud

Без поддержки стартапу развиваться трудно. Поэтому мы выбирали те облачные платформы, которые выдают гранты.

Мы рассматривали несколько предложений от крупных компаний, но ни одно из них не подошло: то условия были не те, то бюджет. Опасались, что в процессе миграции потребуется много доработок, на которые нужно будет потратить ещё больше денег, и суммы гранта не хватит.

В итоге пришли в Yandex Cloud. ReText.AI попал в программу Yandex Cloud Boost, и сейчас мы переносим решение в облако. Финансирование покрывает расходы и на маркетинг, и на исправление ошибок, и на самое болезненное — миграцию.

Сейчас на инфраструктуре Yandex Cloud работают кластеры систем управления базами данных РostgreSQL и Redis, а также виртуальные машины для Kubernetes. Мы используем Yandex Object Storage для внутренней инфраструктуры — в нём хранятся обученные модели, registry с образами, логи проекта и бэкапы баз данных. Уже начали миграцию в Yandex Managed Service for Kubernetes® — в итоге перенесём туда 80% сервиса. У нас есть и свои серверы — они выполняют статичные задачи для сервисов, требующих доступа к GPU круглые сутки, но они не могут масштабироваться.

Эффективность облака сейчас сложно оценить, но уже можно сравнить затраты, которые бы понадобились на переход к другому облачному провайдеру. Они оказались бы на 15–20% больше.

Как ReText помогает бизнесу

Один язык — одна нейронка. Это дорого, но качественно.

Когда сервис только запускался, им в основном пользовались студенты, которым нужно было повысить уникальность дипломных работ на 5–10%. Со временем проект стали тестировать и профессионалы: копирайтеры, редакторы, блогеры. Ещё год назад отзывы были не очень хорошими: говорили, что текст получается «картонным» и его нельзя использовать для подводок к статьям, постов и прочих форматов.

Тогда мы провели исследование и поняли, что именно не нравится авторам. Им было важно качество перефразирования. Наша первая нейросеть строилась на ограниченных данных — соответственно, получившийся результат приходилось глубоко редактировать.

Сейчас ReText.AI использует для разных задач разные нейросети — они сами понимают, какой из них какую задачу забрать, какая с чем лучше справится. Мы задействовали текстовые сети трёх основных типов: кодирующие, генеративные и «текст в текст». Модели работают в связке: например, кодирующая модель анализирует результаты генеративной. А ещё в сервисе используются отдельные нейронные сети для создания и аугментирования датасетов. Поэтому контент получается качественным.

Мы часто проводим A/B-тестирования и собираем статистику по вариантам, которые выбирают пользователи. Поэтому данные регулярно обновляются и уровень текстов растёт.

Наш сервис вошёл в топ нейросетей, по данным исследования Tele2. Сейчас продуктом гораздо охотнее пользуются профессионалы: их аудитория выросла до 35%.

Судя по трафику, на платформу нередко заходят малые, средние и крупные компании. Мы посчитали, что ReText.AI экономит бизнесу 100 000–150 000 рублей на этапе развития. Для сайтов нужно много контента, и писать его с нуля дорого. Наш расширитель текстов помогает делать материалы стилистически разнообразнее, быстрее выполнять заказы и генерить новые идеи.

<i>Результат работы модели при выборе сильного уровня перефразирования</i>
Результат работы модели при выборе сильного уровня перефразирования

Что в планах

Переезжать на новую инфраструктуру сложно и долго, так как нужно переписывать весь код. Но мы планируем расширять платформу с упором на работу в облаке. Один из таких проектов почти готов — в ближайшее время запустим Telegram-бота для анализа доступных источников и суммирования результатов по ним.

Мы будем двигаться в сторону профессиональной платформы, чтобы люди могли оптимизировать время, получать качественные тексты для своих задач и анализировать результаты.

Подписывайтесь на Telegram-канал Yandex Cloud, чтобы узнавать еще больше новостей и историй об IT и бизнесе.

Другие истории наших партнеров и клиентов, которые активно читают наши подписчики:

2020
16 комментариев

Комментарий удалён модератором

Действительно удивительно, как человек, даже на минуту, может представить, что международная корпорация с выручкой в 200 млрд рублей, которая завоевала доверие миллионов клиентов по всему миру, будет заниматься 'продажей' публикаций. Пожалуйста, прежде чем делать такие беспочвенные обвинения, удостоверьтесь в достоверности вашей информации. Ведь недобросовестные обвинения и распространение ложной информации могут подпадать под статью 128.2 УК РФ о клевете. Хотя, возможно, некоторым это и не страшно...

2

Мораль такова, что какие бы гениальные, талантливые и амбициозные ни были разрабочики, за результат отвечают финансы.

1

Ага, я так понимаю, такие проекты у нас никак не поддерживаются государством. Не удивительно, что многие из них переезжают за границу...

Один из первых моих обзоров был об этом сервисе, молодцы 👍🏻

1

Обещанные возможности и результаты впечатляют, особенно учитывая экономию времени и ресурсов для писателей и компаний. Однако, хотелось бы узнать больше о полноценности автоматически сгенерированных текстов и их качестве. Более подробное описание работы и примеры использования также были бы полезны. Супер, ребята!)