Второй пункт: Наконец-то порежут паразитное SEO. Это когда на новостной сайт заливают статью про микрокредиты и собирают сливки в ТОПе за счёт траста этого сайта. Этим говном недавно делились в нашем клубе, офигевая от наглости. Правда там был Яндекс, надеюсь и до него дойдет, иначе останется только Google.
Объективно - реальные дропы перехваченные, а не мусор брошенный это редкость. Фантики и раньше толку не давали.
Второй пункт - сомнительно, но окэй. Как они это сделают - по тематичности? Технически возможно, на практике - ниче не треснет у Гоши?
В отлов генеративок я верю ещё меньше, но это было бы совсем хорошо.
Фактически тупая генерации контента через AI должна умереть.Наконец-то порежут паразитное SEO. Это реальная борьба со сменой тематики перехваченных доменов.АХАХАХА
А вы что думаетеЧто вы оптимист.
Так и есть!
Сомневаюсь, что они раскатят его на Google.Ru. если и дойдёт то не скоро.
Ну гугл всегда был есть и будет впереди
По первому пункту, думаю, будет опять замах на рубль, а удар на копейку.
Грозные утверждения по поводу того, что будет наказываться даже сочетание генережки и ручного труда, на мой взгляд, является вообще сомнительным утверждением со стороны Гугла. Что считать такой комбинацией? Если AI набросал структуру контента, а человек написал, то это тоже попадает под их критерии спама? Думаю нет. Если был сгенерирован текст и основательно дописан/переработан – скорее всего тоже нет.
Вообще интересует алгоритмическая реализация такого процесса, поскольку он должен быть не только эффективным, но и не сильно ресурсозатратным. Вероятно будет что-то типа дообученного BERT на генеренных текстах. Если так, то с точки зрения ресурсов будет иметь смысл использовать его, условно, в рамках топ 10–30 как надстройку для уточнения весов уже первично отранжированных результатах. Опять же, слабо представляется датасет, который мог использоваться для обучения модели с целью детектирования текстов, созданных по гибридному методу (человек+AI) с существенной переработкой текста.
Что-то я сомневаюсь, что у Гугл в полной мере получиться у задуманного всё реализовать. К примеру, на спортивном сайте пишут про медицинские технологии в спорте. Статья не совсем спорт, но она относится к нему, так как используется в нем. Если капнуть еще глубже, то есть темы которые относятся и к спорту и медицине только по названию. Пример, координация движений. И таких терминов и понятий тысячи. На том же спортивном сайте может быть описана конструкция спорткара, которое относится к машиностроению. Как оцифровать спорт? Тут вообще в сети люди запускают сериал про IT-технологии в спорте. Тот же киберспорт. Опять не писать? Мне кажется, что будет какая-то процентная градация, как это было раньше, не больше 30% смежной тематики, потом понижение позиций.
Может Гугл и запустит алгоритм похожий на Главред (https://glvrd.ru/), то стилистика вычисления ИИ на этом и закончиться.