Какая нейросеть лучше для SEO? Chat GPT, GigaChat или может Google Gemini?
Казалось бы простой вопрос, взять тексты, которые нагенерят известные нейронки пробежаться по ним и сделать вывод, но не всё так просто!
Часть 1 – Предельно просто на пальцах и примерах.
Под капотом у ChatGPT и всех известных моделей находится нейросеть трансформер в тех или иных вариациях. А в архитектуру этих сетей заложен крайне важный механизм Attention (механизм внимания), который сопоставляет каждое слово в предложении с каждым другим словом и делает вывод о смысле данного предложения, смотрите!
Два очень похожих предложения с совершенно разным смыслом (интентом):
Макс Ферстаппен в машине быстро едет по дороге.
Эммануэль Макрон в машине быстро едет по дороге.
В первом случае речь идет об автоспорте, во втором, видимо о политике.
Первый вывод – все слова в вашем тексте важны! Иначе механизм Attention неправильно поймет смысл вашего текста, присвоит ему другой интент и не видать вам топов.
Второй вывод – нужно найти такие слова, которые бы с особым внимание относились друг к другу, например, футбол и Месси, окно и стеклопакет, Ферстаппен – Формула 1 и так далее.
Как найти такие фразы и слова? Велкам в мой бот
Часть 2 – Почему GPT-4 такая умная и как происходит обучение модели?
Нейросеть – это программа, как правило, написанная на языке python с помощью ряда фреймворков, которая принимает входные данные, обрабатывает их, и, что-то выдает на выходе.
В процессе обучения на вход нейросети по очереди подаются тексты с масками, например:
(Маска) дядя самых честных правил
Мой (маска) самых честных правил
Мой дядя (маска) честных правил
Нейросеть пытается угадать какое слово должно быть вместо маски, результат оценивается с помощью метода back propagation (говоря простым языком - поощряется или штрафуется) В итоге получаются устойчивые связки фраз, которые и обеспечивает гладкий слог. Но нужно понимать, что появление того или иного слова не данность, а вероятность. Именно за этот фактор и отвечает параметр temperature в моделях Open AI.
Стоп! А причем тут SEO?
А при том, что мы не знаем на каком языковом корпусе обучалась та или иная нейросеть. На чём обучался, к примеру, Gigachat? На книгах Толстого и Достоевского? На Википедии? На школьных чатах или может быть на всем сразу? Какой корпус русского языка использовали разработчики той или иной нейросети? И использовали ли они вообще корпус русского языка, или как все модели Chat GPT сначала думают на английском а потом переводят на все остальные языки мира?
Если заглянуть в репозиторий на huggingface.co то по фильтру "NLP text classification" выйдет порядка 66 000 моделей трансформеров так или иначе пригодных для текстового анализа.
Так какую модель в итоге выбрать и какая модель найдет мне самые близкие по смыслу фразы?
Часть 3 – Внимание, эксперимент!
Дано: 4 всем известных нейросети.
Подаём на вход ключевое слово и с помощью механизма описанного у меня в телеграм канале, ищем наиболее близкие по ключу фразы в базе слов всех 4-х нейросетей.
На выходе Excel таблички в которых отобраны лучшие 100 слов для каждой из моделей.
Что получилось?
А получилось весьма интересно!
Предварительная оценка показала, что, если взять выборку из 100 наиболее важных слов (вряд ли SEOшник внедрит больше), пересечение фраз со всеми 4-мя моделями колеблется в районе 15%. А максимальная схожесть по близким фразам которую я увидел между 2-мя моделями в районе 60%
Внимание! Сразу оговорюсь для любителей поковыряться в чистоте проведения эксперимента. Это только начало большого эксперимента и лишь первые пробные результаты и мои предварительные сугубо оценочные выводы 😊. Но даже на начальном этапе легко видеть, что языковые модели довольно сильно отличаются друг от друга.
Часть 4 – SEOшник? Мне нужна твоя помощь!
Обращаюсь напрямую к тебе, прости за фамильярный тон, но без тебя действительно никак. Диаграммы и распределения это хорошо, но только SEOшник своим опытным взглядом лучше любого математического метода определит какую модель он считает лучшей.
Прими участие в эксперименте, проголосуй за лучшую модель, вот ссылка!
Это ВАЖНО, не только для меня, но и для тебя. Потому, что в зависимости от полученных результатов, я приму решение, какую нейросеть я оставлю под капотом нашего чудо бота.
PS для тех кто не в курсе!
Вот ссылка на бот, который буквально в 2 клика и за одну минуту «вытаскивает» из нейросети тематически близкие фразы!
Ну и даю ссылку на мой канал, где я рассказываю простым языком про нейросети, python и про то, как это применять в SEO.
спасибо, статью конечно в закладки, надеюсь доберусь
Думаю статья должна называться «Какая нейросеть лучше для написания SEO текстов?»
Если для вас SEO - это тексты и ключи, то у меня для вас есть плохие новости!
Проголосовал. Во всех случаях - один выбор, хотя и тот неидеальный.
Корпуса вообще неизвестны, и речь только о запросе на вход?
Корпуса есть на все 4 модели, но есть один нюанс, если юзать в чистую лезет мусор, например по фразе "окно" он может найти "автостекло", поэтому ориентируемся на фразы из ТОПа всё таки. Я готовлю небольшоее исследование как раз по корпусам и там всё это отражу. Спасибо, что проголосовали!
Тоже проголосовал.
Спасибо!
Новая секта (сеошники-нейросетевики) :)
*шутка