{"id":14287,"url":"\/distributions\/14287\/click?bit=1&hash=1d1b6427c21936742162fc18778388fc58ebf8e17517414e1bfb1d3edd9b94c0","hash":"1d1b6427c21936742162fc18778388fc58ebf8e17517414e1bfb1d3edd9b94c0","title":"\u0412\u044b\u0440\u0430\u0441\u0442\u0438 \u0438\u0437 \u0440\u0430\u0437\u0440\u0430\u0431\u043e\u0442\u0447\u0438\u043a\u0430 \u0434\u043e \u0440\u0443\u043a\u043e\u0432\u043e\u0434\u0438\u0442\u0435\u043b\u044f \u0437\u0430 \u0433\u043e\u0434","buttonText":"","imageUuid":""}

«Мы экономим компаниям 150 000 рублей»: как ReText.AI создал текстовую нейросеть для профессионалов

Всего за год сервис ReText.AI вырос из экспериментального синонимайзера в платформу, которую Tele2 назвала самой востребованной нейросетью. Как это удалось и какую роль в этом сыграло облако, рассказывают соосновательницы сервиса Ольга Шкряба и Елена Райтс.

Сооснователи ReText.AI: СМО Елена Райтс, Head of Data Science Богдан Салып, CEO Ольга Шкряба, CTO Алексей Набережный

ReText.AI — сервис перефразирования на основе нескольких нейросетей с умным синонимайзером. С его помощью за несколько секунд можно разнообразить, сжать или увеличить текст без потери смысла, а также проверить уникальность и проанализировать. Платформой пользуются копирайтеры, редакторы, блогеры и предприниматели.

С чего всё началось

Ольга Шкряба
CEO ReText.AI

Пока пользователей было мало — работал собственный сервер, и это было ненапряжно.

Наша компания специализировалась на SDK (software development kit — набор средств разработки), нейросетях и создавала сложные библиотеки под разные решения для заказчиков. Например, мы делали SDK для фото- и видеоредактора, который позволяет разработчикам встраивать готовые инструменты для редактирования медиаконтента — от простых операций вроде обрезки и цветокоррекции до сложных эффектов. Ещё мы делали аналог TikTok для создания коротких видеороликов. Наше решение объединяло инструменты для съёмки, редактирования и публикации видео.

Год назад мы исследовали несколько текстовых нейросетей для нашей студии разработки. Получили достаточно данных для машинного обучения и начали работать над синонимайзером для автоматизации собственных задач. В итоге он не пригодился. Но поскольку мы потратили много времени и сил, решили сделать его продуктом.

Мы попросили нашего дизайнера создать сайт под этот проект. Результат получился забавным — как будто страницу делал школьник, который только научился программировать. Тем не менее платформу зарелизили на своих серверах. Анонсировали выход сервиса в паре Telegram-каналов и стали ждать.

Где-то неделю была тишина. Потом начали приходить пользователи — всё больше и больше. Видимо, запустилось сарафанное радио, и бесплатный текстовый сервис внезапно стал популярным. Наши серверы уже тогда перестали вывозить такую нагрузку.

За 3–4 месяца мы разработали новую платформу. Это было непросто: раньше у нас была другая специализация — мы решали сложные математические задачи. Сейчас же нужно было создать с нуля целый сервис и нанять для этого новых специалистов.

Елена Райтс
CMO ReText.AI

Для продвижения сервиса мы подготовили PR-кампанию на основе SEO-ключей. Количество брендовых запросов за месяц выросло в 12 раз, а через три месяца — в 40 раз. Но проблема оставалась: мощностей своих серверов не хватало, нужно было умещаться в рамках небольшой инфраструктуры. Наши разработчики пытались ужимать модели, но скоро стало ясно, что для масштабирования необходимо переходить в облако. И мы начали подбирать подходящие варианты. Одной из сложностей было найти и распланировать бюджет.

Как искали бюджет и почему пришли в Yandex Cloud

Без поддержки стартапу развиваться трудно. Поэтому мы выбирали те облачные платформы, которые выдают гранты.

Мы рассматривали несколько предложений от крупных компаний, но ни одно из них не подошло: то условия были не те, то бюджет. Опасались, что в процессе миграции потребуется много доработок, на которые нужно будет потратить ещё больше денег, и суммы гранта не хватит.

В итоге пришли в Yandex Cloud. ReText.AI попал в программу Yandex Cloud Boost, и сейчас мы переносим решение в облако. Финансирование покрывает расходы и на маркетинг, и на исправление ошибок, и на самое болезненное — миграцию.

Сейчас на инфраструктуре Yandex Cloud работают кластеры систем управления базами данных РostgreSQL и Redis, а также виртуальные машины для Kubernetes. Мы используем Yandex Object Storage для внутренней инфраструктуры — в нём хранятся обученные модели, registry с образами, логи проекта и бэкапы баз данных. Уже начали миграцию в Yandex Managed Service for Kubernetes® — в итоге перенесём туда 80% сервиса. У нас есть и свои серверы — они выполняют статичные задачи для сервисов, требующих доступа к GPU круглые сутки, но они не могут масштабироваться.

Эффективность облака сейчас сложно оценить, но уже можно сравнить затраты, которые бы понадобились на переход к другому облачному провайдеру. Они оказались бы на 15–20% больше.

Как ReText помогает бизнесу

Один язык — одна нейронка. Это дорого, но качественно.

Когда сервис только запускался, им в основном пользовались студенты, которым нужно было повысить уникальность дипломных работ на 5–10%. Со временем проект стали тестировать и профессионалы: копирайтеры, редакторы, блогеры. Ещё год назад отзывы были не очень хорошими: говорили, что текст получается «картонным» и его нельзя использовать для подводок к статьям, постов и прочих форматов.

Тогда мы провели исследование и поняли, что именно не нравится авторам. Им было важно качество перефразирования. Наша первая нейросеть строилась на ограниченных данных — соответственно, получившийся результат приходилось глубоко редактировать.

Сейчас ReText.AI использует для разных задач разные нейросети — они сами понимают, какой из них какую задачу забрать, какая с чем лучше справится. Мы задействовали текстовые сети трёх основных типов: кодирующие, генеративные и «текст в текст». Модели работают в связке: например, кодирующая модель анализирует результаты генеративной. А ещё в сервисе используются отдельные нейронные сети для создания и аугментирования датасетов. Поэтому контент получается качественным.

Мы часто проводим A/B-тестирования и собираем статистику по вариантам, которые выбирают пользователи. Поэтому данные регулярно обновляются и уровень текстов растёт.

Наш сервис вошёл в топ нейросетей, по данным исследования Tele2. Сейчас продуктом гораздо охотнее пользуются профессионалы: их аудитория выросла до 35%.

Судя по трафику, на платформу нередко заходят малые, средние и крупные компании. Мы посчитали, что ReText.AI экономит бизнесу 100 000–150 000 рублей на этапе развития. Для сайтов нужно много контента, и писать его с нуля дорого. Наш расширитель текстов помогает делать материалы стилистически разнообразнее, быстрее выполнять заказы и генерить новые идеи.

Результат работы модели при выборе сильного уровня перефразирования

Что в планах

Переезжать на новую инфраструктуру сложно и долго, так как нужно переписывать весь код. Но мы планируем расширять платформу с упором на работу в облаке. Один из таких проектов почти готов — в ближайшее время запустим Telegram-бота для анализа доступных источников и суммирования результатов по ним.

Мы будем двигаться в сторону профессиональной платформы, чтобы люди могли оптимизировать время, получать качественные тексты для своих задач и анализировать результаты.

Подписывайтесь на Telegram-канал Yandex Cloud, чтобы узнавать еще больше новостей и историй об IT и бизнесе.

Другие истории наших партнеров и клиентов, которые активно читают наши подписчики:

0
16 комментариев
Написать комментарий...

Комментарий удален модератором

Развернуть ветку
Liza Shatova

Действительно удивительно, как человек, даже на минуту, может представить, что международная корпорация с выручкой в 200 млрд рублей, которая завоевала доверие миллионов клиентов по всему миру, будет заниматься 'продажей' публикаций. Пожалуйста, прежде чем делать такие беспочвенные обвинения, удостоверьтесь в достоверности вашей информации. Ведь недобросовестные обвинения и распространение ложной информации могут подпадать под статью 128.2 УК РФ о клевете. Хотя, возможно, некоторым это и не страшно...

Ответить
Развернуть ветку
Дмитрий Беговатов

Так держать 👍

Ответить
Развернуть ветку
Светлана Смирнова

Мораль такова, что какие бы гениальные, талантливые и амбициозные ни были разрабочики, за результат отвечают финансы.

Ответить
Развернуть ветку
Анастасия Соболева

Ага, я так понимаю, такие проекты у нас никак не поддерживаются государством. Не удивительно, что многие из них переезжают за границу...

Ответить
Развернуть ветку
Виктор

А зачем такие проекты поддерживать государством?

Ответить
Развернуть ветку
Дмитрий П.

Чтобы копирайтеры бабосы нахаляву зарабатывали )))

Ответить
Развернуть ветку
Анастасия Соболева

Чтобы российские нейросети тоже могли развиваться, а не только лишь пользоваться чатом ГПТ и ругать рос нейросети, какие они гавно...

Ответить
Развернуть ветку
Вадим Д.

Один из первых моих обзоров был об этом сервисе, молодцы 👍🏻

Ответить
Развернуть ветку
Иван Липорев

Обещанные возможности и результаты впечатляют, особенно учитывая экономию времени и ресурсов для писателей и компаний. Однако, хотелось бы узнать больше о полноценности автоматически сгенерированных текстов и их качестве. Более подробное описание работы и примеры использования также были бы полезны. Супер, ребята!)

Ответить
Развернуть ветку
Лиза Лиман

Как говорится, пока сам не попробуешь, не поймешь😉

Ответить
Развернуть ветку
Арина Антоненко

Вдохновляют такие истории! Желаю дальнейшего развития и жду новые фичи для сервиса от создателей )

Ответить
Развернуть ветку
Marat Minkin TON

Молодцы, Леночка умница 👏🏽 Горжусь

Ответить
Развернуть ветку
Лиза Лиман

Что? Яндекс пишет про какую-то другую нейронку, не свою? Или я что-то не так понимаю

Ответить
Развернуть ветку
Мария Авдеева

Видимо, все обвинения в монополизации рынка относились к тому Яндексу, который делает ребрендинг сейчас

Ответить
Развернуть ветку
Лиза Лиман

Хммм

Ответить
Развернуть ветку
Юрий Косурин

Сервис рабочий, можно юзать, для SEOшки можно приспособить без проблем)

Ответить
Развернуть ветку
13 комментариев
Раскрывать всегда