Унификация данных для e-commerce: как AI упрощает работу с характеристиками товаров

Привет, я Михаил Шрайбман, основатель веб-интегратора «Осьминожка». Мы занимаемся разработкой для среднего и крупного бизнеса, а также одними из первых начали внедрять ИИ в бизнес-процессы наших клиентов.

В последние два года всё больше компаний из сферы e-commerce обращаются к внедрению AI-решений для разных задач. Например, для обработки большого объёма данных. Я попросил своего коллегу — Дениса Нагаева, сооснователя и технического директора «Осьминожки» рассказать об этом подробнее.

Проблема. Часто продавцу данные о товарах поступают в разрозненном виде — в одном большом текстовом блоке, откуда сложно вычленить нужную информацию, в разных единицах измерения или в разном виде. И эти данные нужно разделить и привести к единому формату. Обычно такие данные обрабатывают вручную и это очень долго.

Решение. Задачу можно значительно упростить с помощью ИИ — с применением больших генеративных моделей.

Такие модели способны:

  • Выделять характеристики из неструктурированного текста. Например,длина, ширина и вес извлекаются из него и распределяются по соответствующим блокам.
  • Создавать JSON-файлы с упорядоченной информацией.

Для этого используется специальный фреймворк- Мы, например, используем LangChain. Он позволяет настраивать подсистему на базе ИИ, задавая ей правила обработки данных. Результат — автоматизированный процесс, где из неструктурированного текста генерируется структурированный документ.

Как это работает?

Алгоритм работы следующий:

Скрипт на сайте берёт информацию о товарах из стороннего источника, например, из Excel-таблицы → Эти данные отправляются по API в подсистему искусственного интеллекта → Модель анализирует текст, выделяет характеристики и возвращает результат в формате JSON, где каждая характеристика привязана к своему уникальному ID → Сайт получает готовый JSON-файл и загружает товар с уже структурированными данными.

Пример использования:

Рассмотрим какой-нибудь аграрный или промышленный маркетплейс. Например, по продаже зерна. Продавцы часто самостоятельно описывают продукцию: «Продаю 10 тонн пшеницы, урожай 2023 года, в мешках». Такое описание не подходит для фильтрации: данные не структурированы, объём указан в разных единицах.

С помощью подсистемы AI текст обрабатывается, и из него выделяются ключевые характеристики:

  • Продукт: пшеница.
  • Вес: 10 тонн.
  • Год урожая: 2023.
  • Упаковка: мешки.

Эти данные формируются в JSON-файл, который затем передаются на сайт. В итоге пользователь получает возможность отфильтровать объявления, ориентируясь на важные для него параметры товара. А продавец, не нагружая себя, сохраняет привычный для себя формат ввода.

Ещё раз о главном: преимущества подхода

  • Автоматизация процессов. Уменьшается объём ручной работы, экономятся ресурсы продавцов, менеджеров и других сотрудников, задействованных в цепочке.
  • Улучшение поиска. Фильтры на сайте работают корректнее благодаря унификации данных.
  • Гибкость. AI можно настроить для обработки данных в любых форматах.
  • Экономия времени. Импорт товара ускоряется за счёт автоматизированной обработки.

Такой подход открывает новые возможности для e-commerce.

1 комментарий

👌 Джейсон 🙈