Какая нейросеть лучше для SEO? Chat GPT, GigaChat или может Google Gemini?

Какая нейросеть лучше для SEO? Chat GPT, GigaChat или может Google Gemini?

Казалось бы простой вопрос, взять тексты, которые нагенерят известные нейронки пробежаться по ним и сделать вывод, но не всё так просто!

Часть 1 – Предельно просто на пальцах и примерах.

Под капотом у ChatGPT и всех известных моделей находится нейросеть трансформер в тех или иных вариациях. А в архитектуру этих сетей заложен крайне важный механизм Attention (механизм внимания), который сопоставляет каждое слово в предложении с каждым другим словом и делает вывод о смысле данного предложения, смотрите!

Два очень похожих предложения с совершенно разным смыслом (интентом):

Макс Ферстаппен в машине быстро едет по дороге.

Эммануэль Макрон в машине быстро едет по дороге.

В первом случае речь идет об автоспорте, во втором, видимо о политике.

Первый вывод – все слова в вашем тексте важны! Иначе механизм Attention неправильно поймет смысл вашего текста, присвоит ему другой интент и не видать вам топов.

Второй вывод – нужно найти такие слова, которые бы с особым внимание относились друг к другу, например, футбол и Месси, окно и стеклопакет, Ферстаппен – Формула 1 и так далее.

Как найти такие фразы и слова? Велкам в мой бот

Часть 2 – Почему GPT-4 такая умная и как происходит обучение модели?

Нейросеть – это программа, как правило, написанная на языке python с помощью ряда фреймворков, которая принимает входные данные, обрабатывает их, и, что-то выдает на выходе.

В процессе обучения на вход нейросети по очереди подаются тексты с масками, например:

(Маска) дядя самых честных правил

Мой (маска) самых честных правил

Мой дядя (маска) честных правил

Нейросеть пытается угадать какое слово должно быть вместо маски, результат оценивается с помощью метода back propagation (говоря простым языком - поощряется или штрафуется) В итоге получаются устойчивые связки фраз, которые и обеспечивает гладкий слог. Но нужно понимать, что появление того или иного слова не данность, а вероятность. Именно за этот фактор и отвечает параметр temperature в моделях Open AI.

Стоп! А причем тут SEO?

А при том, что мы не знаем на каком языковом корпусе обучалась та или иная нейросеть. На чём обучался, к примеру, Gigachat? На книгах Толстого и Достоевского? На Википедии? На школьных чатах или может быть на всем сразу? Какой корпус русского языка использовали разработчики той или иной нейросети? И использовали ли они вообще корпус русского языка, или как все модели Chat GPT сначала думают на английском а потом переводят на все остальные языки мира?

Если заглянуть в репозиторий на huggingface.co то по фильтру "NLP text classification" выйдет порядка 66 000 моделей трансформеров так или иначе пригодных для текстового анализа.

Так какую модель в итоге выбрать и какая модель найдет мне самые близкие по смыслу фразы?

Часть 3 – Внимание, эксперимент!

Дано: 4 всем известных нейросети.

Подаём на вход ключевое слово и с помощью механизма описанного у меня в телеграм канале, ищем наиболее близкие по ключу фразы в базе слов всех 4-х нейросетей.

На выходе Excel таблички в которых отобраны лучшие 100 слов для каждой из моделей.

Что получилось?

А получилось весьма интересно!

Какая нейросеть лучше для SEO? Chat GPT, GigaChat или может Google Gemini?

Предварительная оценка показала, что, если взять выборку из 100 наиболее важных слов (вряд ли SEOшник внедрит больше), пересечение фраз со всеми 4-мя моделями колеблется в районе 15%. А максимальная схожесть по близким фразам которую я увидел между 2-мя моделями в районе 60%

Какая нейросеть лучше для SEO? Chat GPT, GigaChat или может Google Gemini?

Внимание! Сразу оговорюсь для любителей поковыряться в чистоте проведения эксперимента. Это только начало большого эксперимента и лишь первые пробные результаты и мои предварительные сугубо оценочные выводы 😊. Но даже на начальном этапе легко видеть, что языковые модели довольно сильно отличаются друг от друга.

Часть 4 – SEOшник? Мне нужна твоя помощь!

Обращаюсь напрямую к тебе, прости за фамильярный тон, но без тебя действительно никак. Диаграммы и распределения это хорошо, но только SEOшник своим опытным взглядом лучше любого математического метода определит какую модель он считает лучшей.

Прими участие в эксперименте, проголосуй за лучшую модель, вот ссылка!

Это ВАЖНО, не только для меня, но и для тебя. Потому, что в зависимости от полученных результатов, я приму решение, какую нейросеть я оставлю под капотом нашего чудо бота.

PS для тех кто не в курсе!

Вот ссылка на бот, который буквально в 2 клика и за одну минуту «вытаскивает» из нейросети тематически близкие фразы!

Ну и даю ссылку на мой канал, где я рассказываю простым языком про нейросети, python и про то, как это применять в SEO.

33
14 комментариев

спасибо, статью конечно в закладки, надеюсь доберусь

1
Ответить

Думаю статья должна называться «Какая нейросеть лучше для написания SEO текстов?»
Если для вас SEO - это тексты и ключи, то у меня для вас есть плохие новости!

1
Ответить

Проголосовал. Во всех случаях - один выбор, хотя и тот неидеальный.
Корпуса вообще неизвестны, и речь только о запросе на вход?

Ответить

Корпуса есть на все 4 модели, но есть один нюанс, если юзать в чистую лезет мусор, например по фразе "окно" он может найти "автостекло", поэтому ориентируемся на фразы из ТОПа всё таки. Я готовлю небольшоее исследование как раз по корпусам и там всё это отражу. Спасибо, что проголосовали!

Ответить

Тоже проголосовал.

Ответить

Спасибо!

Ответить

Новая секта (сеошники-нейросетевики) :)
*шутка

Ответить