RAG для SEO: работаем с нейросетями без дураков

Если вас уже тошнит от сгенерированных chatGPT текстов про то, как генерировать тексты в chatGPT для никого – это не повод отказываться от использования нейросетей для SEO. В этой статье разберем более здравый подход к работе с контентом с помощью LLM (больших языковых моделей): RAG, генерацию с расширенным поиском.

Добавляем правильный контекст языковой модели просто и доходчиво
8K8K показов
868868 открытий

Здравствуйте, пока в ИИ разбираюсь слабо, однако очень хочется протестировать его на своем сайте юридической тематики для написания статьей. GPT действительно выдает портянку текста, где написано очень много и ни о чем.

Правильно ли я понимаю, что в RAG мы можем загрузить различную литературу (например, с юридическими нормативами) и генерировать из этой информации нужные нам статьи?

Алгоритм: Загружаем в RAG кучу PDF (разрезанных на главы - чанки) > запрашиваем статьи и получаем статьи сгенерированные из наших pdf источников?

Не будет ли такого, что информация будет очень сухая т.к. в качестве источников только наша литература?

Ответить

Да, это так и работает. Вообще говоря, в юридической тематике даже общие модели уровня Claude отдают очные данные. Claude я сам для сайта адвоката тестировал. Если брать знание кодексов - он ни разу не срезался, всё было точно. А ведь это просто LLM.
RAG - это просто добавленная база знаний к модели, которой не хватает знаний в конкретной предметной области, на которой модель в принципе не могла обучаться. Скажем, данные о вашей компании, её особенностях, истории и т.п.
Всё упирается в основном в подготовку данных на вход. PDF, к слову, стоит использовать с осторожностью - там как минимум распознанный текст должен быть. А ещё лучше средствами Python текст оттуда вытащить, и на вход отдавать txt, а не pdf.
Стиль и тон определяются промптом. Я для адвокатского сайта запрашивал напрямую: "Подготовь текст для сайта адвоката, специализирующегося на разделе имущества, ..." - в таком ключе. Claude справлялся наотлично. Но это было до его продажи, говорят, сейчас он здорово поплохел - я не проверял.

Ответить