{"id":14268,"url":"\/distributions\/14268\/click?bit=1&hash=1e3309842e8b07895e75261917827295839cd5d4d57d48f0ca524f3f535a7946","title":"\u0420\u0430\u0437\u0440\u0435\u0448\u0430\u0442\u044c \u0441\u043e\u0442\u0440\u0443\u0434\u043d\u0438\u043a\u0430\u043c \u0438\u0433\u0440\u0430\u0442\u044c \u043d\u0430 \u0440\u0430\u0431\u043e\u0447\u0435\u043c \u043c\u0435\u0441\u0442\u0435 \u044d\u0444\u0444\u0435\u043a\u0442\u0438\u0432\u043d\u043e?","buttonText":"\u0423\u0437\u043d\u0430\u0442\u044c","imageUuid":"f71e1caf-7964-5525-98be-104bb436cb54"}

Ruki.ai - генерация описаний товаров для e-commerce

Приключения нейросети, которая создает описания для товарных каталогов за секунды

Привет, меня зовут Антон Селихов, я СЕО стартапа Ruki ai — сервиса по AI генерации описаний товаров для e-commerce. В этой статье я расскажу, зачем нужно автоматизировать копирайтинг описаний и с какими технологическими трудностями мы столкнулись на пути от идеи до MVP.

Зачем нужны описания товаров?

Пустые, не уникальные или скучные тексты к товарам плохо влияют на выдачу в поиске (SEO) и конверсию (до 20% несовершенных покупок). Хорошее и детальное описание — четвертый по важности критерий при покупке в интернет-магазинах.

Сейчас описания вручную создают копирайтеры, и у такого метода много минусов:

  • Дорого (от $0.5 за описание)
  • Не всегда качественно (особенно с фрилансерами)
  • Не масштабируется (когда выходит новая коллекция и появляются тысячи новых SKU)

В итоге в интернет-магазинах мы видим разные ситуации:

  • Есть хорошие описания (редко)
  • Есть не уникальные описания от поставщиков (бывает)
  • Нет описаний (часто)
  • Описания есть, но они выглядят так: «сексуальный стиль две пьесы кружева выдавливают топ» (привет, AliExpress)

Генерация описаний за секунды

Решение: искусственный интеллект для генерации SEO-оптимизированных описаний товаров.

Основная магия технологии, с помощью которой решаем проблему — это AI с Natural Language Generation под капотом. На основании характеристик товара генерируется SEO-оптимизированное и уникальное описание. Такое же, как создал бы копирайтер, но только кратно дешевле, быстрее и мгновенно масштабируемо. А еще для некоторых категорий умеем брать характеристики напрямую с фото товара — это происходит с помощью Computer Vision.

Мне очень хотелось бы рассказать вам историю в стиле «изи-бризи, заботали за два дня». На деле же потребовалось «чуть больше», чем два дня, много упорства и большая преданность великому русскому языку, который сложно поддается существующим технологиям NLP (обработки естественного языка).

Стадии принятия нейросетью

В нулевой итерации модели использовали технологию seq2seq, с ней получились какая-то фигамота (в прямом смысле слова). Вот описание для женского платья мини:

98 см без застежки 98 см 175 см 175 см 175 см 175 см

Отбросив эту гипотезу, мы перешли к экспериментам с контекстуальной моделью.

В первой итерации модели эксперимент вышел забавным: ИИ был больше похож на психотерапевта, чем на копирайтера и описания он делал так себе.

Например, вот как ИИ создал описание для летнего детского платья:

Если вы станете покупать эти платья, то на вашем счету в банках накопится много денег. В этом случае не нужно волноваться о деньгах. Вот и весь секрет. А если у вас нет денег на покупки, то надо сразу же покупать платья от бренда ХХХ. Вы можете купить несколько платьев от бренда ХХХ и не покупать платье с названием «Висельник»

Очевидно, это — не совсем то, что хочется видеть в описании детского товара, но подобные артефакты — неизменные спутники любого обучения нейросети.

Во второй итерации использовали малую контекстуальную модель, которую обучили на небольшом корпусе наших данных и попробовали создать описание для вечернего платья.

Платье, в котором можно идти на похороны в любое время года! Платье выполнено из трикотажного полотна. Благодаря плотному лифу и расклешенному низу, наряд формирует очень женственные пропорции фигуры. Прекрасно подойдет для торжественных событий.

«Вот теперь, кажется, лучше. Но явно есть некоторые нюансы», — подумали мы.

В третьей итерации значительно расширили корпус данных, использовали ансамбль моделей различных архитектур и плотно поработали над файнтюнингом.

Вот один из вариантов описания джинсового летнего платья.

Джинсовое платье мини на кнопках с коротким рукавом и V-образным вырезом. Прилегающий крой подчеркивает достоинства и делает образ волнующим и соблазнительным. Модель очень удобна в ежедневной носке и подчеркивает достоинства хозяйки.

Пока я радовался технологической победе, мои кофаундерки Саша и Катя (CTO и CBDO) сделали платья нашим командным дресс-кодом (хотя я предлагал «голые четверги»).

Копирайтер на скоростях

Давайте сравним в цифрах скорость работы копирайтера и AI в создании 10 тысяч описаний.

Допустим, наш герой Вася живет в городе N, работает full-time и каждый день пишет описания к товарам. Вася — крутой специалист, любит создавать описания, шарит в SEO и сходу по характеристикам придумывает уникальный текст для каждого товара. На одно описание ему нужно 3 минуты. А ещё Вася не обедает, не общается у кулера с коллегами и не отлучается в туалет.

Получается, в месяц Вася создает 3 200 описаний. На 10 тысяч у него уходит 3 месяца, ведь он как любой хороший работник не устаёт, и ему ничего не стоит по просьбе своего эффективного менеджера поднажать перед релизом и сделать на 400 штук больше.

Это же количество описаний скромный искусственный интеллект в задумчивом настроении (на домашнем компуктере СТО) сделает за 20 тысяч секунд, или 333 минуты, или чуть меньше одного рабочего дня. Получается, за месяц Ruki ai создал бы 876,000 описаний.

Надеюсь, Вася узнает об этой технологии и начнёт тратить в 90 раз меньше времени на одно описание. Глядишь, и время на чай с коллегами организуется.

Что дальше?

Мы научились описывать платья и теперь хотим итеративно масштабироваться на другие категории товаров. После одежды возьмемся за бытовую технику и электронику, а потом в ход пойдут совсем специфичные товары. «Вот уж будет весело описывать какое-нибудь кольцо червячного вала для культиватора» — хихикаем мы на командных синк-апах.

Еще планируем использовать наиболее актуальные языковые модели для нейросети и здесь передаем большой респект Сберу, который совсем недавно выкатил в открытый доступ RuGPT-3. GPT-3 — наиболее развитая языковая модель генерации текста, которая до этого существовала только на английском языке и в ограниченном доступе.

0
28 комментариев
Написать комментарий...
Max Bantsevich

Помните стартап, который оказывал бухгалтерские услуги на основе машинного обучения, привлек много денег, а оказалось, что у них просто тысячи бухгалтеров? С такими ценами закрадываются такие же мысли)

Ответить
Развернуть ветку
Алексей Петрик

Уже долгое время удивляет цена на любые AI-продукты. Там себестоимость копейки, а просят дороже, чем руками делать

Ответить
Развернуть ветку
Alexey Praskovin
Там себестоимость копейки

R&D фаза копейки? Понимаю...

Но и доля правды в ваших словах есть: у нас любые цены закладываются из стратегии "выйти в ноль за 2 месяца, купить Лексус через 4"

Ответить
Развернуть ветку
Alexander Belousov

В таких сервисах большая часть цены- это CAC, отсюда такие цены.

Ответить
Развернуть ветку
Gierano

Это вы ещё ценник на аналогичные сервисы за западе не смотрели, где pay as you go по $3

Ответить
Развернуть ветку
Евгений Ларин

Копирайтерка пишет,бухгалтерка считает, все довольны как слонихи

Ответить
Развернуть ветку
Макс Мухарёв

Пилотка управляет самолётом? А учителька учит? А директорка руководит? А менеджерка управляет? 😅

Ответить
Развернуть ветку
Dear Moscow,

А ткачиха с поварихой,
С сватьей бабой Бабарихой,
Генеральшу извести хотят,
Изменить язык велят.

Ответить
Развернуть ветку
Макс Мухарёв

Как раз в этом стихотворении видно, что названия эти шутовские. Применение уменьшительно-ласкательного суффикса "ка" я воспринимаю как троллинг. Это как меня бы назвали не специалистом, а специалистиком 🤣

Ответить
Развернуть ветку
Евгений Ларин

Кофаундерка кофаундит

Ответить
Развернуть ветку
Топал Богдан

В статье написано про, что у копирайтера дорого - "от 0,5$".
Захожу на сайт и вижу цену в 40₽.
У меня на сайте 19к sku, даже если брать тариф за 10₽ это 190000+.
Кроме скорости я плюсов не увидел.
Пожалуй, продолжу генерить с помощью python.
Думаю спрос на такое есть, но цена...

Ответить
Развернуть ветку
Антон Селихов
Автор

Я правильно понял, что ты генерируешь по шаблону? Или у тебя уникальные описания? 

Ответить
Развернуть ветку
Топал Богдан

Генерирую уникальные описания по шаблону.

Ответить
Развернуть ветку
Dmitry Kryuchkow

Было бы интересно почитать про твой метод 

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Топал Богдан

Где тут хвастовство?

Ответить
Развернуть ветку
Fedor Smirnov

а 40 рублей эт сколько?)

Ответить
Развернуть ветку
Топал Богдан

Это чуть меньше, чем 0,5 бакса ))

Ответить
Развернуть ветку
Roman

Но у вас на сайте 1 описание как раз стоит больше $0.5

Ответить
Развернуть ветку
Gleb Baranyuk

Тариф не дешевый, вот вообще.

Ответить
Развернуть ветку
Иван Глухов

Прикольно. Разработчики основатели/внутри команды или найм?

Ответить
Развернуть ветку
Alexey Andreev

Под капотом там скорее всего GPT-3

Ответить
Развернуть ветку
Антон Селихов
Автор

Все делаем in-house

Ответить
Развернуть ветку
Иван Глухов

Круто! Скинь пожалуйста свой ФБ или поменяй линк в профиле - ссылка не открывается.

Ответить
Развернуть ветку
Alexander Belousov

Интересный сервис, не хватает какого-то демо на сайте, где можно скинуть картинку товара и его хар-ки и посмотреть, что сгенерирует. Потому что не видя качества не понятно, как оценивать цену. Если качество сравнимо с качеством копирайтера, то 10р за описание еще куда ни шло (хотя все равно дороговато). 

Потому что если копирайтера за 2 дня рабочих дня создает 1000 описаний, то за месяц это около 10 000. При использовании вашего сервиса стоимость будет 100 000р, при этом качество скорее всего будет ниже. Получается копирайтер с зарплатой 50 000р будет дешевле, а качество итоговое выше.

Ответить
Развернуть ветку
Alexander Belousov

Также вы пишите о технологической победе и приводите пример своего описания: 

"Джинсовое платье мини на кнопках с коротким рукавом и V-образным вырезом. Прилегающий крой подчеркивает достоинства и делает образ волнующим и соблазнительным. Модель очень удобна в ежедневной носке и подчеркивает достоинства хозяйки."

Но если говорить начистоту - подобное описание годится только для поисковиков, для пользователя оно не несет смысла. 

"Джинсовое платье мини на кнопках с коротким рукавом и V-образным вырезом" - спасибо кэп, я это вижу на фотографии и видел название.

"Прилегающий крой подчеркивает достоинства и делает образ волнующим и соблазнительным" - снова уровень капитана очевидности

"Модель очень удобна в ежедневной носке и подчеркивает достоинства хозяйки." - очень удобна в ежедневной носке - а где факты, которые это подтверждают? такие штампы встречаются на каждом сайте, где продают одежду. Конец фразы - снова капитан очевидность.

Понятно, что ИИ это сложно и нужно много ресурсов, чтобы создать работающую модель, но 10 р за подобное SEO-описание это очень дорого.

Ответить
Развернуть ветку
Danil Sayranov

Круто, но цены, конечно, кажутся завышенными. Причем сгенерированные описания не всегда хороши, да и скорее засоряют голову пустой информацией.

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
25 комментариев
Раскрывать всегда