Ruki.ai - генерация описаний товаров для e-commerce
Приключения нейросети, которая создает описания для товарных каталогов за секунды
Привет, меня зовут Антон Селихов, я СЕО стартапа Ruki ai — сервиса по AI генерации описаний товаров для e-commerce. В этой статье я расскажу, зачем нужно автоматизировать копирайтинг описаний и с какими технологическими трудностями мы столкнулись на пути от идеи до MVP.
Зачем нужны описания товаров?
Пустые, не уникальные или скучные тексты к товарам плохо влияют на выдачу в поиске (SEO) и конверсию (до 20% несовершенных покупок). Хорошее и детальное описание — четвертый по важности критерий при покупке в интернет-магазинах.
Сейчас описания вручную создают копирайтеры, и у такого метода много минусов:
- Дорого (от $0.5 за описание)
- Не всегда качественно (особенно с фрилансерами)
- Не масштабируется (когда выходит новая коллекция и появляются тысячи новых SKU)
В итоге в интернет-магазинах мы видим разные ситуации:
- Есть хорошие описания (редко)
- Есть не уникальные описания от поставщиков (бывает)
- Нет описаний (часто)
- Описания есть, но они выглядят так: «сексуальный стиль две пьесы кружева выдавливают топ» (привет, AliExpress)
Генерация описаний за секунды
Решение: искусственный интеллект для генерации SEO-оптимизированных описаний товаров.
Основная магия технологии, с помощью которой решаем проблему — это AI с Natural Language Generation под капотом. На основании характеристик товара генерируется SEO-оптимизированное и уникальное описание. Такое же, как создал бы копирайтер, но только кратно дешевле, быстрее и мгновенно масштабируемо. А еще для некоторых категорий умеем брать характеристики напрямую с фото товара — это происходит с помощью Computer Vision.
Мне очень хотелось бы рассказать вам историю в стиле «изи-бризи, заботали за два дня». На деле же потребовалось «чуть больше», чем два дня, много упорства и большая преданность великому русскому языку, который сложно поддается существующим технологиям NLP (обработки естественного языка).
Стадии принятия нейросетью
В нулевой итерации модели использовали технологию seq2seq, с ней получились какая-то фигамота (в прямом смысле слова). Вот описание для женского платья мини:
Отбросив эту гипотезу, мы перешли к экспериментам с контекстуальной моделью.
В первой итерации модели эксперимент вышел забавным: ИИ был больше похож на психотерапевта, чем на копирайтера и описания он делал так себе.
Например, вот как ИИ создал описание для летнего детского платья:
Очевидно, это — не совсем то, что хочется видеть в описании детского товара, но подобные артефакты — неизменные спутники любого обучения нейросети.
Во второй итерации использовали малую контекстуальную модель, которую обучили на небольшом корпусе наших данных и попробовали создать описание для вечернего платья.
«Вот теперь, кажется, лучше. Но явно есть некоторые нюансы», — подумали мы.
В третьей итерации значительно расширили корпус данных, использовали ансамбль моделей различных архитектур и плотно поработали над файнтюнингом.
Вот один из вариантов описания джинсового летнего платья.
Пока я радовался технологической победе, мои кофаундерки Саша и Катя (CTO и CBDO) сделали платья нашим командным дресс-кодом (хотя я предлагал «голые четверги»).
Копирайтер на скоростях
Давайте сравним в цифрах скорость работы копирайтера и AI в создании 10 тысяч описаний.
Допустим, наш герой Вася живет в городе N, работает full-time и каждый день пишет описания к товарам. Вася — крутой специалист, любит создавать описания, шарит в SEO и сходу по характеристикам придумывает уникальный текст для каждого товара. На одно описание ему нужно 3 минуты. А ещё Вася не обедает, не общается у кулера с коллегами и не отлучается в туалет.
Получается, в месяц Вася создает 3 200 описаний. На 10 тысяч у него уходит 3 месяца, ведь он как любой хороший работник не устаёт, и ему ничего не стоит по просьбе своего эффективного менеджера поднажать перед релизом и сделать на 400 штук больше.
Это же количество описаний скромный искусственный интеллект в задумчивом настроении (на домашнем компуктере СТО) сделает за 20 тысяч секунд, или 333 минуты, или чуть меньше одного рабочего дня. Получается, за месяц Ruki ai создал бы 876,000 описаний.
Надеюсь, Вася узнает об этой технологии и начнёт тратить в 90 раз меньше времени на одно описание. Глядишь, и время на чай с коллегами организуется.
Что дальше?
Мы научились описывать платья и теперь хотим итеративно масштабироваться на другие категории товаров. После одежды возьмемся за бытовую технику и электронику, а потом в ход пойдут совсем специфичные товары. «Вот уж будет весело описывать какое-нибудь кольцо червячного вала для культиватора» — хихикаем мы на командных синк-апах.
Еще планируем использовать наиболее актуальные языковые модели для нейросети и здесь передаем большой респект Сберу, который совсем недавно выкатил в открытый доступ RuGPT-3. GPT-3 — наиболее развитая языковая модель генерации текста, которая до этого существовала только на английском языке и в ограниченном доступе.
Помните стартап, который оказывал бухгалтерские услуги на основе машинного обучения, привлек много денег, а оказалось, что у них просто тысячи бухгалтеров? С такими ценами закрадываются такие же мысли)
Уже долгое время удивляет цена на любые AI-продукты. Там себестоимость копейки, а просят дороже, чем руками делать
R&D фаза копейки? Понимаю...
Но и доля правды в ваших словах есть: у нас любые цены закладываются из стратегии "выйти в ноль за 2 месяца, купить Лексус через 4"
В таких сервисах большая часть цены- это CAC, отсюда такие цены.
Это вы ещё ценник на аналогичные сервисы за западе не смотрели, где pay as you go по $3
Копирайтерка пишет,бухгалтерка считает, все довольны как слонихи
Пилотка управляет самолётом? А учителька учит? А директорка руководит? А менеджерка управляет? 😅
А ткачиха с поварихой,
С сватьей бабой Бабарихой,
Генеральшу извести хотят,
Изменить язык велят.
Как раз в этом стихотворении видно, что названия эти шутовские. Применение уменьшительно-ласкательного суффикса "ка" я воспринимаю как троллинг. Это как меня бы назвали не специалистом, а специалистиком 🤣
Кофаундерка кофаундит
В статье написано про, что у копирайтера дорого - "от 0,5$".
Захожу на сайт и вижу цену в 40₽.
У меня на сайте 19к sku, даже если брать тариф за 10₽ это 190000+.
Кроме скорости я плюсов не увидел.
Пожалуй, продолжу генерить с помощью python.
Думаю спрос на такое есть, но цена...
Я правильно понял, что ты генерируешь по шаблону? Или у тебя уникальные описания?
Генерирую уникальные описания по шаблону.
Было бы интересно почитать про твой метод
Комментарий недоступен
Комментарий недоступен
Где тут хвастовство?
а 40 рублей эт сколько?)
Это чуть меньше, чем 0,5 бакса ))
Но у вас на сайте 1 описание как раз стоит больше $0.5
Тариф не дешевый, вот вообще.
Прикольно. Разработчики основатели/внутри команды или найм?
Под капотом там скорее всего GPT-3
Все делаем in-house
Круто! Скинь пожалуйста свой ФБ или поменяй линк в профиле - ссылка не открывается.
Интересный сервис, не хватает какого-то демо на сайте, где можно скинуть картинку товара и его хар-ки и посмотреть, что сгенерирует. Потому что не видя качества не понятно, как оценивать цену. Если качество сравнимо с качеством копирайтера, то 10р за описание еще куда ни шло (хотя все равно дороговато).
Потому что если копирайтера за 2 дня рабочих дня создает 1000 описаний, то за месяц это около 10 000. При использовании вашего сервиса стоимость будет 100 000р, при этом качество скорее всего будет ниже. Получается копирайтер с зарплатой 50 000р будет дешевле, а качество итоговое выше.
Также вы пишите о технологической победе и приводите пример своего описания:
"Джинсовое платье мини на кнопках с коротким рукавом и V-образным вырезом. Прилегающий крой подчеркивает достоинства и делает образ волнующим и соблазнительным. Модель очень удобна в ежедневной носке и подчеркивает достоинства хозяйки."
Но если говорить начистоту - подобное описание годится только для поисковиков, для пользователя оно не несет смысла.
"Джинсовое платье мини на кнопках с коротким рукавом и V-образным вырезом" - спасибо кэп, я это вижу на фотографии и видел название.
"Прилегающий крой подчеркивает достоинства и делает образ волнующим и соблазнительным" - снова уровень капитана очевидности
"Модель очень удобна в ежедневной носке и подчеркивает достоинства хозяйки." - очень удобна в ежедневной носке - а где факты, которые это подтверждают? такие штампы встречаются на каждом сайте, где продают одежду. Конец фразы - снова капитан очевидность.
Понятно, что ИИ это сложно и нужно много ресурсов, чтобы создать работающую модель, но 10 р за подобное SEO-описание это очень дорого.
Круто, но цены, конечно, кажутся завышенными. Причем сгенерированные описания не всегда хороши, да и скорее засоряют голову пустой информацией.
Комментарий удален модератором