Ruki.ai - генерация описаний товаров для e-commerce

Приключения нейросети, которая создает описания для товарных каталогов за секунды

Ruki.ai - генерация описаний товаров для e-commerce

Привет, меня зовут Антон Селихов, я СЕО стартапа Ruki ai — сервиса по AI генерации описаний товаров для e-commerce. В этой статье я расскажу, зачем нужно автоматизировать копирайтинг описаний и с какими технологическими трудностями мы столкнулись на пути от идеи до MVP.

Зачем нужны описания товаров?

Пустые, не уникальные или скучные тексты к товарам плохо влияют на выдачу в поиске (SEO) и конверсию (до 20% несовершенных покупок). Хорошее и детальное описание — четвертый по важности критерий при покупке в интернет-магазинах.

Сейчас описания вручную создают копирайтеры, и у такого метода много минусов:

  • Дорого (от $0.5 за описание)
  • Не всегда качественно (особенно с фрилансерами)
  • Не масштабируется (когда выходит новая коллекция и появляются тысячи новых SKU)

В итоге в интернет-магазинах мы видим разные ситуации:

  • Есть хорошие описания (редко)
  • Есть не уникальные описания от поставщиков (бывает)
  • Нет описаний (часто)
  • Описания есть, но они выглядят так: «сексуальный стиль две пьесы кружева выдавливают топ» (привет, AliExpress)

Генерация описаний за секунды

Решение: искусственный интеллект для генерации SEO-оптимизированных описаний товаров.

Основная магия технологии, с помощью которой решаем проблему — это AI с Natural Language Generation под капотом. На основании характеристик товара генерируется SEO-оптимизированное и уникальное описание. Такое же, как создал бы копирайтер, но только кратно дешевле, быстрее и мгновенно масштабируемо. А еще для некоторых категорий умеем брать характеристики напрямую с фото товара — это происходит с помощью Computer Vision.

Мне очень хотелось бы рассказать вам историю в стиле «изи-бризи, заботали за два дня». На деле же потребовалось «чуть больше», чем два дня, много упорства и большая преданность великому русскому языку, который сложно поддается существующим технологиям NLP (обработки естественного языка).

Стадии принятия нейросетью

В нулевой итерации модели использовали технологию seq2seq, с ней получились какая-то фигамота (в прямом смысле слова). Вот описание для женского платья мини:

98 см без застежки 98 см 175 см 175 см 175 см 175 см

Отбросив эту гипотезу, мы перешли к экспериментам с контекстуальной моделью.

В первой итерации модели эксперимент вышел забавным: ИИ был больше похож на психотерапевта, чем на копирайтера и описания он делал так себе.

Например, вот как ИИ создал описание для летнего детского платья:

Если вы станете покупать эти платья, то на вашем счету в банках накопится много денег. В этом случае не нужно волноваться о деньгах. Вот и весь секрет. А если у вас нет денег на покупки, то надо сразу же покупать платья от бренда ХХХ. Вы можете купить несколько платьев от бренда ХХХ и не покупать платье с названием «Висельник»

Очевидно, это — не совсем то, что хочется видеть в описании детского товара, но подобные артефакты — неизменные спутники любого обучения нейросети.

Во второй итерации использовали малую контекстуальную модель, которую обучили на небольшом корпусе наших данных и попробовали создать описание для вечернего платья.

Платье, в котором можно идти на похороны в любое время года! Платье выполнено из трикотажного полотна. Благодаря плотному лифу и расклешенному низу, наряд формирует очень женственные пропорции фигуры. Прекрасно подойдет для торжественных событий.

«Вот теперь, кажется, лучше. Но явно есть некоторые нюансы», — подумали мы.

В третьей итерации значительно расширили корпус данных, использовали ансамбль моделей различных архитектур и плотно поработали над файнтюнингом.

Вот один из вариантов описания джинсового летнего платья.

Джинсовое платье мини на кнопках с коротким рукавом и V-образным вырезом. Прилегающий крой подчеркивает достоинства и делает образ волнующим и соблазнительным. Модель очень удобна в ежедневной носке и подчеркивает достоинства хозяйки.

Пока я радовался технологической победе, мои кофаундерки Саша и Катя (CTO и CBDO) сделали платья нашим командным дресс-кодом (хотя я предлагал «голые четверги»).

Копирайтер на скоростях

Давайте сравним в цифрах скорость работы копирайтера и AI в создании 10 тысяч описаний.

Допустим, наш герой Вася живет в городе N, работает full-time и каждый день пишет описания к товарам. Вася — крутой специалист, любит создавать описания, шарит в SEO и сходу по характеристикам придумывает уникальный текст для каждого товара. На одно описание ему нужно 3 минуты. А ещё Вася не обедает, не общается у кулера с коллегами и не отлучается в туалет.

Получается, в месяц Вася создает 3 200 описаний. На 10 тысяч у него уходит 3 месяца, ведь он как любой хороший работник не устаёт, и ему ничего не стоит по просьбе своего эффективного менеджера поднажать перед релизом и сделать на 400 штук больше.

Это же количество описаний скромный искусственный интеллект в задумчивом настроении (на домашнем компуктере СТО) сделает за 20 тысяч секунд, или 333 минуты, или чуть меньше одного рабочего дня. Получается, за месяц Ruki ai создал бы 876,000 описаний.

Надеюсь, Вася узнает об этой технологии и начнёт тратить в 90 раз меньше времени на одно описание. Глядишь, и время на чай с коллегами организуется.

Что дальше?

Мы научились описывать платья и теперь хотим итеративно масштабироваться на другие категории товаров. После одежды возьмемся за бытовую технику и электронику, а потом в ход пойдут совсем специфичные товары. «Вот уж будет весело описывать какое-нибудь кольцо червячного вала для культиватора» — хихикаем мы на командных синк-апах.

Еще планируем использовать наиболее актуальные языковые модели для нейросети и здесь передаем большой респект Сберу, который совсем недавно выкатил в открытый доступ RuGPT-3. GPT-3 — наиболее развитая языковая модель генерации текста, которая до этого существовала только на английском языке и в ограниченном доступе.

1818
28 комментариев

Помните стартап, который оказывал бухгалтерские услуги на основе машинного обучения, привлек много денег, а оказалось, что у них просто тысячи бухгалтеров? С такими ценами закрадываются такие же мысли)

14

Уже долгое время удивляет цена на любые AI-продукты. Там себестоимость копейки, а просят дороже, чем руками делать

10

Там себестоимость копейкиR&D фаза копейки? Понимаю...

Но и доля правды в ваших словах есть: у нас любые цены закладываются из стратегии "выйти в ноль за 2 месяца, купить Лексус через 4"

2

В таких сервисах большая часть цены- это CAC, отсюда такие цены.

Это вы ещё ценник на аналогичные сервисы за западе не смотрели, где pay as you go по $3

Копирайтерка пишет,бухгалтерка считает, все довольны как слонихи

5

Пилотка управляет самолётом? А учителька учит? А директорка руководит? А менеджерка управляет? 😅