Ищем разработчика, который без ума от JavaScript и клёвых анимаций
Трибуна
Антон Селихов
1906

Ruki.ai - генерация описаний товаров для e-commerce

Приключения нейросети, которая создает описания для товарных каталогов за секунды

В закладки

Привет, меня зовут Антон Селихов, я СЕО стартапа Ruki ai — сервиса по AI генерации описаний товаров для e-commerce. В этой статье я расскажу, зачем нужно автоматизировать копирайтинг описаний и с какими технологическими трудностями мы столкнулись на пути от идеи до MVP.

Зачем нужны описания товаров?

Пустые, не уникальные или скучные тексты к товарам плохо влияют на выдачу в поиске (SEO) и конверсию (до 20% несовершенных покупок). Хорошее и детальное описание — четвертый по важности критерий при покупке в интернет-магазинах.

Сейчас описания вручную создают копирайтеры, и у такого метода много минусов:

  • Дорого (от $0.5 за описание)
  • Не всегда качественно (особенно с фрилансерами)
  • Не масштабируется (когда выходит новая коллекция и появляются тысячи новых SKU)

В итоге в интернет-магазинах мы видим разные ситуации:

  • Есть хорошие описания (редко)
  • Есть не уникальные описания от поставщиков (бывает)
  • Нет описаний (часто)
  • Описания есть, но они выглядят так: «сексуальный стиль две пьесы кружева выдавливают топ» (привет, AliExpress)

Генерация описаний за секунды

Решение: искусственный интеллект для генерации SEO-оптимизированных описаний товаров.

Основная магия технологии, с помощью которой решаем проблему — это AI с Natural Language Generation под капотом. На основании характеристик товара генерируется SEO-оптимизированное и уникальное описание. Такое же, как создал бы копирайтер, но только кратно дешевле, быстрее и мгновенно масштабируемо. А еще для некоторых категорий умеем брать характеристики напрямую с фото товара — это происходит с помощью Computer Vision.

Мне очень хотелось бы рассказать вам историю в стиле «изи-бризи, заботали за два дня». На деле же потребовалось «чуть больше», чем два дня, много упорства и большая преданность великому русскому языку, который сложно поддается существующим технологиям NLP (обработки естественного языка).

Стадии принятия нейросетью

В нулевой итерации модели использовали технологию seq2seq, с ней получились какая-то фигамота (в прямом смысле слова). Вот описание для женского платья мини:

98 см без застежки 98 см 175 см 175 см 175 см 175 см

Отбросив эту гипотезу, мы перешли к экспериментам с контекстуальной моделью.

В первой итерации модели эксперимент вышел забавным: ИИ был больше похож на психотерапевта, чем на копирайтера и описания он делал так себе.

Например, вот как ИИ создал описание для летнего детского платья:

Если вы станете покупать эти платья, то на вашем счету в банках накопится много денег. В этом случае не нужно волноваться о деньгах. Вот и весь секрет. А если у вас нет денег на покупки, то надо сразу же покупать платья от бренда ХХХ. Вы можете купить несколько платьев от бренда ХХХ и не покупать платье с названием «Висельник»

Очевидно, это — не совсем то, что хочется видеть в описании детского товара, но подобные артефакты — неизменные спутники любого обучения нейросети.

Во второй итерации использовали малую контекстуальную модель, которую обучили на небольшом корпусе наших данных и попробовали создать описание для вечернего платья.

Платье, в котором можно идти на похороны в любое время года! Платье выполнено из трикотажного полотна. Благодаря плотному лифу и расклешенному низу, наряд формирует очень женственные пропорции фигуры. Прекрасно подойдет для торжественных событий.

«Вот теперь, кажется, лучше. Но явно есть некоторые нюансы», — подумали мы.

В третьей итерации значительно расширили корпус данных, использовали ансамбль моделей различных архитектур и плотно поработали над файнтюнингом.

Вот один из вариантов описания джинсового летнего платья.

Джинсовое платье мини на кнопках с коротким рукавом и V-образным вырезом. Прилегающий крой подчеркивает достоинства и делает образ волнующим и соблазнительным. Модель очень удобна в ежедневной носке и подчеркивает достоинства хозяйки.

Пока я радовался технологической победе, мои кофаундерки Саша и Катя (CTO и CBDO) сделали платья нашим командным дресс-кодом (хотя я предлагал «голые четверги»).

Копирайтер на скоростях

Давайте сравним в цифрах скорость работы копирайтера и AI в создании 10 тысяч описаний.

Допустим, наш герой Вася живет в городе N, работает full-time и каждый день пишет описания к товарам. Вася — крутой специалист, любит создавать описания, шарит в SEO и сходу по характеристикам придумывает уникальный текст для каждого товара. На одно описание ему нужно 3 минуты. А ещё Вася не обедает, не общается у кулера с коллегами и не отлучается в туалет.

Получается, в месяц Вася создает 3 200 описаний. На 10 тысяч у него уходит 3 месяца, ведь он как любой хороший работник не устаёт, и ему ничего не стоит по просьбе своего эффективного менеджера поднажать перед релизом и сделать на 400 штук больше.

Это же количество описаний скромный искусственный интеллект в задумчивом настроении (на домашнем компуктере СТО) сделает за 20 тысяч секунд, или 333 минуты, или чуть меньше одного рабочего дня. Получается, за месяц Ruki ai создал бы 876,000 описаний.

Надеюсь, Вася узнает об этой технологии и начнёт тратить в 90 раз меньше времени на одно описание. Глядишь, и время на чай с коллегами организуется.

Что дальше?

Мы научились описывать платья и теперь хотим итеративно масштабироваться на другие категории товаров. После одежды возьмемся за бытовую технику и электронику, а потом в ход пойдут совсем специфичные товары. «Вот уж будет весело описывать какое-нибудь кольцо червячного вала для культиватора» — хихикаем мы на командных синк-апах.

Еще планируем использовать наиболее актуальные языковые модели для нейросети и здесь передаем большой респект Сберу, который совсем недавно выкатил в открытый доступ RuGPT-3. GPT-3 — наиболее развитая языковая модель генерации текста, которая до этого существовала только на английском языке и в ограниченном доступе.

{ "author_name": "Антон Селихов", "author_type": "self", "tags": ["\u0442\u043e\u0440\u0433\u043e\u0432\u043b\u044f","\u0441\u0435\u0440\u0432\u0438\u0441\u044b","\u043b\u0438\u0447\u043d\u044b\u0439\u043e\u043f\u044b\u0442","startup","seo","machinelearning","ecommerce","ai"], "comments": 28, "likes": 15, "favorites": 83, "is_advertisement": false, "subsite_label": "tribuna", "id": 171097, "is_wide": false, "is_ugc": true, "date": "Wed, 28 Oct 2020 14:37:53 +0300", "is_special": false }
Объявление на vc.ru Отключить рекламу
Трибуна
MakeTime — повысить продуктивность, установив плагин в браузер
Вы установили плагин в Google Chrome и ваша продуктивность выросла, такое возможно? Давайте разберемся.
0
28 комментариев
Популярные
По порядку
Написать комментарий...
14

Помните стартап, который оказывал бухгалтерские услуги на основе машинного обучения, привлек много денег, а оказалось, что у них просто тысячи бухгалтеров? С такими ценами закрадываются такие же мысли)

Ответить
9

Уже долгое время удивляет цена на любые AI-продукты. Там себестоимость копейки, а просят дороже, чем руками делать

Ответить
2

Там себестоимость копейки

R&D фаза копейки? Понимаю...

Но и доля правды в ваших словах есть: у нас любые цены закладываются из стратегии "выйти в ноль за 2 месяца, купить Лексус через 4"

Ответить
0

В таких сервисах большая часть цены- это CAC, отсюда такие цены.

Ответить
0

Это вы ещё ценник на аналогичные сервисы за западе не смотрели, где pay as you go по $3

Ответить
3

Копирайтерка пишет,бухгалтерка считает, все довольны как слонихи

Ответить
0

Пилотка управляет самолётом? А учителька учит? А директорка руководит? А менеджерка управляет? 😅

Ответить
0

А ткачиха с поварихой,
С сватьей бабой Бабарихой,
Генеральшу извести хотят,
Изменить язык велят.

Ответить
0

Как раз в этом стихотворении видно, что названия эти шутовские. Применение уменьшительно-ласкательного суффикса "ка" я воспринимаю как троллинг. Это как меня бы назвали не специалистом, а специалистиком 🤣

Ответить
–1

Кофаундерка кофаундит

Ответить
4

В статье написано про, что у копирайтера дорого - "от 0,5$".
Захожу на сайт и вижу цену в 40₽.
У меня на сайте 19к sku, даже если брать тариф за 10₽ это 190000+.
Кроме скорости я плюсов не увидел.
Пожалуй, продолжу генерить с помощью python.
Думаю спрос на такое есть, но цена...

Ответить
0

Я правильно понял, что ты генерируешь по шаблону? Или у тебя уникальные описания? 

Ответить
0

Генерирую уникальные описания по шаблону.

Ответить
2

Было бы интересно почитать про твой метод 

Ответить
0

Плюсую, ибо сам уже давно ваяю своего бота... но банальность типа рерайта не интересна.

Ответить
0

Как же тут никто из хвастунов не любит конкретику :( я тама я тама и тчк

Ответить
0

Где тут хвастовство?

Ответить
0

а 40 рублей эт сколько?)

Ответить
0

Это чуть меньше, чем 0,5 бакса ))

Ответить
3

Но у вас на сайте 1 описание как раз стоит больше $0.5

Ответить
1

Тариф не дешевый, вот вообще.

Ответить
0

Прикольно. Разработчики основатели/внутри команды или найм?

Ответить
1

Под капотом там скорее всего GPT-3

Ответить
0

Все делаем in-house

Ответить
0

Круто! Скинь пожалуйста свой ФБ или поменяй линк в профиле - ссылка не открывается.

Ответить
0

Интересный сервис, не хватает какого-то демо на сайте, где можно скинуть картинку товара и его хар-ки и посмотреть, что сгенерирует. Потому что не видя качества не понятно, как оценивать цену. Если качество сравнимо с качеством копирайтера, то 10р за описание еще куда ни шло (хотя все равно дороговато). 

Потому что если копирайтера за 2 дня рабочих дня создает 1000 описаний, то за месяц это около 10 000. При использовании вашего сервиса стоимость будет 100 000р, при этом качество скорее всего будет ниже. Получается копирайтер с зарплатой 50 000р будет дешевле, а качество итоговое выше.

Ответить
0

Также вы пишите о технологической победе и приводите пример своего описания: 

"Джинсовое платье мини на кнопках с коротким рукавом и V-образным вырезом. Прилегающий крой подчеркивает достоинства и делает образ волнующим и соблазнительным. Модель очень удобна в ежедневной носке и подчеркивает достоинства хозяйки."

Но если говорить начистоту - подобное описание годится только для поисковиков, для пользователя оно не несет смысла. 

"Джинсовое платье мини на кнопках с коротким рукавом и V-образным вырезом" - спасибо кэп, я это вижу на фотографии и видел название.

"Прилегающий крой подчеркивает достоинства и делает образ волнующим и соблазнительным" - снова уровень капитана очевидности

"Модель очень удобна в ежедневной носке и подчеркивает достоинства хозяйки." - очень удобна в ежедневной носке - а где факты, которые это подтверждают? такие штампы встречаются на каждом сайте, где продают одежду. Конец фразы - снова капитан очевидность.

Понятно, что ИИ это сложно и нужно много ресурсов, чтобы создать работающую модель, но 10 р за подобное SEO-описание это очень дорого.

Ответить
0

Круто, но цены, конечно, кажутся завышенными. Причем сгенерированные описания не всегда хороши, да и скорее засоряют голову пустой информацией.

Ответить

Комментарии

null