Yuliya Timonkina

+15
с 2021
7 подписчиков
30 подписок

GPT является серией языковых моделей, разработанных компанией OpenAI. Главной целью является генерация естественного человеческого текста на основе заданного контекста или входных данных.

Модели предварительно обучены на огромных наборах текстовых данных. Благодаря этому GPT может генерировать текст, который имеет смысл, использует правильную…

7

Код ошибки 404 обозначает, что запрашиваемая страница не существует. Это стандартный HTTP код ответа, который свидетельствует, что связь с сервером установлена, но информации по заданному запросу нет. Они могут привести к плохому пользовательскому опыту, что в свою очередь может негативно сказаться на репутации сайта. Чаще всего появление страниц с…

2

Тема, которая на протяжении всего времени была актуальна. Достоверной информации мало, мифы и домыслы набирают обороты, а некоторые клиенты задают вопросы по накрутке.

В 1998 году была основана поисковая система DirectHit, алгоритм которой основан на учете количества нажатий на ссылку ресурса с его описанием. То есть это первая поисковая сист…

3

Одной из значимых задач в области компьютерных алгоритмов является задача извлечения смысла из текста на естественном языке и представление его в понятном для компьютера виде.

Для примера возьмем запросы пользователей из Яндекса,

3
\n","lang":""}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"ChatGPT 4","image":{"type":"image","data":{"uuid":"85d76962-ac42-55b2-af8f-367adedbd8a1","width":800,"height":712,"size":16908,"type":"png","color":"f2f3fa","hash":"","external_service":[]}}}]}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

где

"}},{"type":"code","cover":false,"hidden":false,"anchor":"","data":{"text":"","lang":""}},{"type":"list","cover":false,"hidden":false,"anchor":"","data":{"items":["Напиши отзыв о товаре «Точилка для ножей Raygood» в разговорном стиле"],"type":"UL"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"ChatGPT 3.5","image":{"type":"image","data":{"uuid":"d8d559af-9ed3-5fc8-80fa-d813ec792c46","width":808,"height":441,"size":31359,"type":"png","color":"f3f3fb","hash":"","external_service":[]}}}]}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"ChatGPT 4","image":{"type":"image","data":{"uuid":"6c66fb1a-f9e2-5411-be8a-1fbc1c2e0637","width":801,"height":534,"size":20435,"type":"png","color":"f2f3fb","hash":"","external_service":[]}}}]}},{"type":"list","cover":false,"hidden":false,"anchor":"","data":{"items":["Напиши структуру для статьи «Как выбрать телефон»"],"type":"UL"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"","image":{"type":"image","data":{"uuid":"409750ea-7f6b-5762-9334-bacf3a72d4f4","width":782,"height":717,"size":18662,"type":"png","color":"f3f3fb","hash":"","external_service":[]}}},{"title":"","image":{"type":"image","data":{"uuid":"dea3fca7-2b03-5f08-9ff6-01f3407eab7f","width":748,"height":560,"size":22759,"type":"png","color":"f3f3fb","hash":"","external_service":[]}}}]}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

ChatGPT 3.5

"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"","image":{"type":"image","data":{"uuid":"5b5df0e9-879d-5074-866a-cd8cc161ea98","width":792,"height":627,"size":19247,"type":"png","color":"f3f3fb","hash":"","external_service":[]}}},{"title":"","image":{"type":"image","data":{"uuid":"292c4613-3c75-5124-9905-ce56c773c6ff","width":789,"height":441,"size":23980,"type":"png","color":"f3f3fb","hash":"","external_service":[]}}}]}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

ChatGPT 4

"}},{"type":"list","cover":false,"hidden":false,"anchor":"","data":{"items":["Внедри микроразметку Shema.org для хлебных крошек «Главная - Каталог - Системы очистки воды - Системы очистки воды для дома»"],"type":"UL"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"","image":{"type":"image","data":{"uuid":"c1833069-15e3-5270-8571-5f5b892478c1","width":778,"height":764,"size":46979,"type":"png","color":"060708","hash":"","external_service":[]}}},{"title":"","image":{"type":"image","data":{"uuid":"6947b3e4-e9a5-5348-9c81-9214ac4dc432","width":776,"height":240,"size":10113,"type":"png","color":"f3f3fb","hash":"","external_service":[]}}}]}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

ChatGPT 3.5

"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"","image":{"type":"image","data":{"uuid":"44e5a615-071c-515e-b068-63a6c424361c","width":801,"height":674,"size":20372,"type":"png","color":"070708","hash":"","external_service":[]}}},{"title":"","image":{"type":"image","data":{"uuid":"4d2c3025-923e-5e70-a8dc-b6f9391f4b25","width":751,"height":634,"size":35654,"type":"png","color":"f0f0f7","hash":"","external_service":[]}}}]}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

ChatGPT 4

"}},{"type":"list","cover":false,"hidden":false,"anchor":"","data":{"items":["Напиши продающий текст об услуге seo продвижения сайтов"],"type":"UL"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"ChatGPT 3.5","image":{"type":"image","data":{"uuid":"9c409eb7-bcb2-5dda-9179-91e2689075b9","width":798,"height":715,"size":29657,"type":"png","color":"f3f3fb","hash":"","external_service":[]}}}]}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"ChatGPT 4","image":{"type":"image","data":{"uuid":"dcdc5f33-dee0-522d-83e1-a8927aa7aa6b","width":661,"height":839,"size":188986,"type":"png","color":"f2f2f1","hash":"","external_service":[]}}}]}}],"summaryContent":null,"isExistSummaryContent":false,"warningFromEditor":null,"warningFromEditorTitle":null,"counters":{"comments":1,"favorites":4,"reposts":0,"views":310,"hits":12955,"reads":null,"online":0},"dateFavorite":0,"hitsCount":12955,"isCommentsEnabled":true,"isLikesEnabled":true,"isRemovedByUserRequest":false,"isFavorited":false,"isPinned":false,"repostId":null,"repostData":null,"subscribedToTreads":false,"isEditorial":false,"isAudioAvailable":false,"audioUrl":null,"isAudioAvailableToGenerate":false,"commentEditor":{"enabled":true,"who":null,"text":"","until":null,"reason":null,"type":"everybody"},"isBlur":false,"isPublished":true,"isDisabledAd":false,"withheld":[],"ogTitle":null,"ogDescription":null,"url":"https://vc.ru/id824164/643358-chto-takoe-gpt-sravnenie-versii-chatgpt-35-i-4","author":{"id":824164,"name":"Yuliya Timonkina","nickname":null,"description":null,"uri":"","avatar":{"type":"image","data":{"uuid":"21e28338-a4cc-50c0-9ccb-b52332158abc","width":960,"height":1280,"size":233542,"type":"jpg","color":"122d32","hash":"","external_service":[]}},"cover":null,"achievements":[{"title":"Год на vc.ru","code":"registration_1_year","description":"Первый год с vc.ru. Получена 24 июля 2025.","previewUuid":"0d11c244-49de-50e7-894e-b9b27945d42b","formats":{"glb":"https://static.vc.ru/achievements/fish.glb","usdz":"https://static.vc.ru/achievements/fish.usdz"},"viewData":{"contentColor":"#C67AA3","textMaxWidth":0.634765625,"textX":0.5888671875,"textY":0.54296875,"logoX":0.5859375,"logoY":0.6669921875,"logoXNoText":0.6044921875,"logoYNoText":0.5439453125},"id":4613737,"userId":824164,"count":0,"shareImage":"https://api.vc.ru/achievements/share/4613737"},{"title":"3 года на vc.ru","code":"registration_3_years","description":"Провёл 3 года вместе с vc.ru. Получена 23 июля 2025.","previewUuid":"d9d72ac5-bcb5-55e0-8c72-b99251e5cdd9","formats":{"glb":"https://static.vc.ru/achievements/shark.glb","usdz":"https://static.vc.ru/achievements/shark.usdz"},"viewData":{"contentColor":"#8E6F09","textMaxWidth":0.66796875,"textX":0.5205078125,"textY":0.341796875,"logoX":0.5205078125,"logoY":0.4609375,"logoXNoText":0.5,"logoYNoText":0.3662109375},"id":989650,"userId":824164,"count":0,"shareImage":"https://api.vc.ru/achievements/share/989650"}],"lastModificationDate":1765137179,"isSubscribed":false,"isSubscribedToNewPosts":false,"isMuted":false,"isAvailableForMessenger":true,"badgeId":null,"isDonationsEnabled":false,"isPlusGiftEnabled":true,"isUnverifiedBlogForCompanyWithoutPro":false,"isRemovedByUserRequest":false,"isFrozen":false,"isDisabledAd":false,"isPlus":false,"isVerified":false,"isPro":false,"yandexMetricaId":null,"badge":null,"isOnline":false,"tgChannelShortname":null,"isUnsubscribable":true,"type":1,"subtype":"personal_blog"},"subsite":{"id":824164,"name":"Yuliya Timonkina","nickname":null,"description":null,"uri":"","avatar":{"type":"image","data":{"uuid":"21e28338-a4cc-50c0-9ccb-b52332158abc","width":960,"height":1280,"size":233542,"type":"jpg","color":"122d32","hash":"","external_service":[]}},"cover":null,"achievements":[{"title":"Год на vc.ru","code":"registration_1_year","description":"Первый год с vc.ru. Получена 24 июля 2025.","previewUuid":"0d11c244-49de-50e7-894e-b9b27945d42b","formats":{"glb":"https://static.vc.ru/achievements/fish.glb","usdz":"https://static.vc.ru/achievements/fish.usdz"},"viewData":{"contentColor":"#C67AA3","textMaxWidth":0.634765625,"textX":0.5888671875,"textY":0.54296875,"logoX":0.5859375,"logoY":0.6669921875,"logoXNoText":0.6044921875,"logoYNoText":0.5439453125},"id":4613737,"userId":824164,"count":0,"shareImage":"https://api.vc.ru/achievements/share/4613737"},{"title":"3 года на vc.ru","code":"registration_3_years","description":"Провёл 3 года вместе с vc.ru. Получена 23 июля 2025.","previewUuid":"d9d72ac5-bcb5-55e0-8c72-b99251e5cdd9","formats":{"glb":"https://static.vc.ru/achievements/shark.glb","usdz":"https://static.vc.ru/achievements/shark.usdz"},"viewData":{"contentColor":"#8E6F09","textMaxWidth":0.66796875,"textX":0.5205078125,"textY":0.341796875,"logoX":0.5205078125,"logoY":0.4609375,"logoXNoText":0.5,"logoYNoText":0.3662109375},"id":989650,"userId":824164,"count":0,"shareImage":"https://api.vc.ru/achievements/share/989650"}],"lastModificationDate":1765137179,"isSubscribed":false,"isSubscribedToNewPosts":false,"isMuted":false,"isAvailableForMessenger":true,"badgeId":null,"isDonationsEnabled":false,"isPlusGiftEnabled":true,"isUnverifiedBlogForCompanyWithoutPro":false,"isRemovedByUserRequest":false,"isFrozen":false,"isDisabledAd":false,"isPlus":false,"isVerified":false,"isPro":false,"yandexMetricaId":null,"badge":null,"isOnline":false,"tgChannelShortname":null,"isUnsubscribable":true,"type":1,"subtype":"personal_blog"},"reactions":{"counters":[{"id":1,"count":7}],"reactionId":0},"isNews":false,"source":null,"clusters":[],"donations":{"amount":0,"isDonated":false},"commentsSeenCount":null}},{"type":"entry","data":{"id":621383,"customUri":null,"subsiteId":824164,"title":"Почему битые ссылки вредят вашему сайту, как найти и исправить","date":1677608338,"dateModified":1677608338,"blocks":[{"type":"text","cover":true,"hidden":false,"anchor":"","data":{"text":"

Код ошибки 404 обозначает, что запрашиваемая страница не существует. Это стандартный HTTP код ответа, который свидетельствует, что связь с сервером установлена, но информации по заданному запросу нет. Они могут привести к плохому пользовательскому опыту, что в свою очередь может негативно сказаться на репутации сайта. Чаще всего появление страниц с этим кодом на вашем сайте вызвано:

"}},{"type":"list","cover":false,"hidden":false,"anchor":"","data":{"items":["Страницу убрали с сайта, а ссылки на других страницах на нее остались;","

Неверно указали URL, при указании ссылки на странице была допущена ошибка/опечатка;

","У страницы изменился URL."],"type":"UL"}},{"type":"header","cover":false,"hidden":false,"anchor":"","data":{"style":"h2","text":"Чем плохо наличие 404 ссылок на сайте?"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Для посетителей

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Для посетителей переход на 404 страницу повод покинуть сайт. Они могут решить, что сайт не работает или не разберутся, куда кликнуть, чтобы вернуться на существующую страницу. Это может привести к тому, что пользователь покинет сайт и больше не вернется к нему в будущем. Пример такой страницы,

"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"

Неоформленная страница 404 Not Found

","image":{"type":"image","data":{"uuid":"f6263afb-1e57-5c38-8ae2-154325b48d5f","width":1024,"height":465,"size":17396,"type":"png","color":"161b26","hash":"","external_service":[]}}}]}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Чтобы этого не произошло важно настроить отображение страницы, которое позволит вернуться на предыдущую страницу или перейти на другие важные страницы:

"}},{"type":"list","cover":false,"hidden":false,"anchor":"","data":{"items":["

Описание должно быть четким и понятным;

","Должна присутствовать ссылка на главную страницу;","Также не лишним будет добавить блок перелинковки на популярные товары/услуги/категории.
"],"type":"UL"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Пример хорошо оформленной страницы,

"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"

Хорошо оформленная страница 404 ошибки

","image":{"type":"image","data":{"uuid":"aeb79f3f-a04b-5b6a-a0bf-ba0c01b870d5","width":1900,"height":877,"size":80743,"type":"png","color":"e5e3e3","hash":"","external_service":[]}}}]}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Для поисковых систем

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Такие ссылки учувствуют во внутренней перелинковке и мешают корректному распределению ссылочного веса.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Google отмечает, что наличие 404 не влияет на рейтинг сайта, тем ни менее говорит, что ошибки лучше исправить.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

При наличии 404 поисковые системы могут тратить свои ресурсы сканирования на них, а не на приоритетные для вас страницы. Если поисковая система обнаруживает много битых ссылок на сайте, она может считать, что сайт устарел или неактуален, и снизить его рейтинг. Для большого сайта это может стать проблемой. Как распределяются запросы на сканирование можно посмотреть в Google Search Console,

"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"

Распределение запросов на сканирование в GSC

","image":{"type":"image","data":{"uuid":"28885f9a-9382-5926-b958-76d211d72135","width":456,"height":348,"size":12880,"type":"png","color":"eff0f4","hash":"","external_service":[]}}}]}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Распространенной ошибкой является отдавать страницу-заглушку с кодом 200 вместо не существующей страницы. В этом случае поисковая система считает, что эта страница существует и не удаляет ее из своей базы. Страница об ошибке всегда должна иметь статус код 404.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

При наличии на сайте большого количества 404 страниц в панели Яндекс Вебмастера может появиться ошибка,

"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"

Ошибка в Вебмастере: Некоторые страницы сайта отвечают HTTP-кодом 4xx

","image":{"type":"image","data":{"uuid":"c3c2d76c-82cd-5d3d-b00b-09ec366cf234","width":1289,"height":184,"size":14781,"type":"png","color":"042d60","hash":"","external_service":[]}}}]}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Сотрудники Яндекса сообщают, что это никак не сказывается на ранжировании сайта,

"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"","image":{"type":"image","data":{"uuid":"a25fdd75-6d2c-583b-8b20-10088eb854cc","width":950,"height":548,"size":43741,"type":"png","color":"d6dace","hash":"","external_service":[]}}}]}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Тем ни менее ошибка отображается в разделе «Критичные». Проблемы этой группы могут вести к исключению отдельных страниц или всего сайта из результатов поиска.

"}},{"type":"header","cover":false,"hidden":false,"anchor":"","data":{"style":"h2","text":"Как найти битые ссылки?"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Страницы с 404 кодом можно найти, воспользовавшись программой для сканирования сайта.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Например, в программе Screaming Frog SEO Spider,

"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"

Поиск 404 с помощью Screaming Frog SEO Spider

","image":{"type":"image","data":{"uuid":"438f933a-785f-5df1-9799-f620b94d97dc","width":1047,"height":493,"size":37027,"type":"png","color":"434859","hash":"","external_service":[]}}}]}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Код страницы отображается в колонке «Status Code». Посмотреть, где находится страница можно следующим образом,

"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"

Где находится URL на сайте

","image":{"type":"image","data":{"uuid":"f7383b83-fa0c-5745-be60-997e66d74400","width":1118,"height":1022,"size":66454,"type":"png","color":"e7e7e6","hash":"","external_service":[]}}}]}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Для просмотра необходимо перейти во вкладку Inlinks на нижней панели. В столбце From указывается на какой странице находится выбранный URL. Программа является условно бесплатной.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Также можно воспользоваться бесплатной программой SiteAnalyzer. Аналогичным образом сканируем сайт,

"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"

Битые ссылки в SiteAnalyzer

","image":{"type":"image","data":{"uuid":"add7d3df-ee40-52af-ae87-54b0d50e731e","width":1047,"height":292,"size":40848,"type":"png","color":"ecd1d1","hash":"","external_service":[]}}}]}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

На нижней панели в колонке «Источник» указаны страницы, на которых расположены битые ссылки,

"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"

Где находится URL на сайте

","image":{"type":"image","data":{"uuid":"3a9af3e5-35d5-57a7-9e37-93f2092347a2","width":1047,"height":164,"size":125324,"type":"png","color":"dddddd","hash":"","external_service":[]}}}]}},{"type":"header","cover":false,"hidden":false,"anchor":"","data":{"style":"h2","text":"Как исправить?"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

В большинстве случаев исправить некорректные URL быстро и не требует сложных доработок. Необходимо либо заменить ссылку на актуальную, либо удалить ее. Если страница, на которую ссылается битая ссылка, имела трафик, то можно настроить 301 редирект на аналогичную страницу.

"}}],"summaryContent":null,"isExistSummaryContent":false,"warningFromEditor":null,"warningFromEditorTitle":null,"counters":{"comments":0,"favorites":0,"reposts":0,"views":356,"hits":710,"reads":null,"online":0},"dateFavorite":0,"hitsCount":710,"isCommentsEnabled":true,"isLikesEnabled":true,"isRemovedByUserRequest":false,"isFavorited":false,"isPinned":false,"repostId":null,"repostData":null,"subscribedToTreads":false,"isEditorial":false,"isAudioAvailable":false,"audioUrl":null,"isAudioAvailableToGenerate":false,"commentEditor":{"enabled":true,"who":null,"text":"","until":null,"reason":null,"type":"everybody"},"isBlur":false,"isPublished":true,"isDisabledAd":false,"withheld":[],"ogTitle":null,"ogDescription":null,"url":"https://vc.ru/id824164/621383-pochemu-bitye-ssylki-vredyat-vashemu-saitu-kak-naiti-i-ispravit","author":{"id":824164,"name":"Yuliya Timonkina","nickname":null,"description":null,"uri":"","avatar":{"type":"image","data":{"uuid":"21e28338-a4cc-50c0-9ccb-b52332158abc","width":960,"height":1280,"size":233542,"type":"jpg","color":"122d32","hash":"","external_service":[]}},"cover":null,"achievements":[{"title":"Год на vc.ru","code":"registration_1_year","description":"Первый год с vc.ru. Получена 24 июля 2025.","previewUuid":"0d11c244-49de-50e7-894e-b9b27945d42b","formats":{"glb":"https://static.vc.ru/achievements/fish.glb","usdz":"https://static.vc.ru/achievements/fish.usdz"},"viewData":{"contentColor":"#C67AA3","textMaxWidth":0.634765625,"textX":0.5888671875,"textY":0.54296875,"logoX":0.5859375,"logoY":0.6669921875,"logoXNoText":0.6044921875,"logoYNoText":0.5439453125},"id":4613737,"userId":824164,"count":0,"shareImage":"https://api.vc.ru/achievements/share/4613737"},{"title":"3 года на vc.ru","code":"registration_3_years","description":"Провёл 3 года вместе с vc.ru. Получена 23 июля 2025.","previewUuid":"d9d72ac5-bcb5-55e0-8c72-b99251e5cdd9","formats":{"glb":"https://static.vc.ru/achievements/shark.glb","usdz":"https://static.vc.ru/achievements/shark.usdz"},"viewData":{"contentColor":"#8E6F09","textMaxWidth":0.66796875,"textX":0.5205078125,"textY":0.341796875,"logoX":0.5205078125,"logoY":0.4609375,"logoXNoText":0.5,"logoYNoText":0.3662109375},"id":989650,"userId":824164,"count":0,"shareImage":"https://api.vc.ru/achievements/share/989650"}],"lastModificationDate":1765137179,"isSubscribed":false,"isSubscribedToNewPosts":false,"isMuted":false,"isAvailableForMessenger":true,"badgeId":null,"isDonationsEnabled":false,"isPlusGiftEnabled":true,"isUnverifiedBlogForCompanyWithoutPro":false,"isRemovedByUserRequest":false,"isFrozen":false,"isDisabledAd":false,"isPlus":false,"isVerified":false,"isPro":false,"yandexMetricaId":null,"badge":null,"isOnline":false,"tgChannelShortname":null,"isUnsubscribable":true,"type":1,"subtype":"personal_blog"},"subsite":{"id":824164,"name":"Yuliya Timonkina","nickname":null,"description":null,"uri":"","avatar":{"type":"image","data":{"uuid":"21e28338-a4cc-50c0-9ccb-b52332158abc","width":960,"height":1280,"size":233542,"type":"jpg","color":"122d32","hash":"","external_service":[]}},"cover":null,"achievements":[{"title":"Год на vc.ru","code":"registration_1_year","description":"Первый год с vc.ru. Получена 24 июля 2025.","previewUuid":"0d11c244-49de-50e7-894e-b9b27945d42b","formats":{"glb":"https://static.vc.ru/achievements/fish.glb","usdz":"https://static.vc.ru/achievements/fish.usdz"},"viewData":{"contentColor":"#C67AA3","textMaxWidth":0.634765625,"textX":0.5888671875,"textY":0.54296875,"logoX":0.5859375,"logoY":0.6669921875,"logoXNoText":0.6044921875,"logoYNoText":0.5439453125},"id":4613737,"userId":824164,"count":0,"shareImage":"https://api.vc.ru/achievements/share/4613737"},{"title":"3 года на vc.ru","code":"registration_3_years","description":"Провёл 3 года вместе с vc.ru. Получена 23 июля 2025.","previewUuid":"d9d72ac5-bcb5-55e0-8c72-b99251e5cdd9","formats":{"glb":"https://static.vc.ru/achievements/shark.glb","usdz":"https://static.vc.ru/achievements/shark.usdz"},"viewData":{"contentColor":"#8E6F09","textMaxWidth":0.66796875,"textX":0.5205078125,"textY":0.341796875,"logoX":0.5205078125,"logoY":0.4609375,"logoXNoText":0.5,"logoYNoText":0.3662109375},"id":989650,"userId":824164,"count":0,"shareImage":"https://api.vc.ru/achievements/share/989650"}],"lastModificationDate":1765137179,"isSubscribed":false,"isSubscribedToNewPosts":false,"isMuted":false,"isAvailableForMessenger":true,"badgeId":null,"isDonationsEnabled":false,"isPlusGiftEnabled":true,"isUnverifiedBlogForCompanyWithoutPro":false,"isRemovedByUserRequest":false,"isFrozen":false,"isDisabledAd":false,"isPlus":false,"isVerified":false,"isPro":false,"yandexMetricaId":null,"badge":null,"isOnline":false,"tgChannelShortname":null,"isUnsubscribable":true,"type":1,"subtype":"personal_blog"},"reactions":{"counters":[{"id":1,"count":2}],"reactionId":0},"isNews":false,"source":null,"clusters":[],"donations":{"amount":0,"isDonated":false},"commentsSeenCount":null}},{"type":"entry","data":{"id":521760,"customUri":null,"subsiteId":824164,"title":"Поведенческие факторы – от появления до сегодняшнего дня","date":1666088665,"dateModified":1666088665,"blocks":[{"type":"text","cover":true,"hidden":false,"anchor":"","data":{"text":"

Тема, которая на протяжении всего времени была актуальна. Достоверной информации мало, мифы и домыслы набирают обороты, а некоторые клиенты задают вопросы по накрутке.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

В 1998 году была основана поисковая система DirectHit, алгоритм которой основан на учете количества нажатий на ссылку ресурса с его описанием. То есть это первая поисковая система, которая начала учитывать при ранжировании такие факторы, как кликабельность документа в результатах поиска и поведение пользователей на странице выдачи поисковых результатов. Это и можно считать началом появления поведенческих факторов.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

В 2007 году Яндекс начал внедрять машинное обучение, что позволило значительно увеличить количество учитываемых факторов ранжирования, а Google сообщила о том, что для улучшения ранжирования, возможно, будет использовать информацию о поведении пользователей на странице выдачи. Это можно считать следующим этапом развития поведенческих факторов.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Но в полной мере возможность учитывать поведенческие факторы появилась предположительно в 2009 году, с добавлением в Яндексе алгоритма машинного обучения MatrixNet. Используемые характеристики описывались в докладе «Through-the-Looking Glass: Utilizing Rich Post-Search Trail Statistics for Web Search».

"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"MatrixNet","image":{"type":"image","data":{"uuid":"bbc9943d-83e8-5028-901f-5aa31febe399","width":600,"height":319,"size":59188,"type":"png","color":"ccc9ca","hash":"","external_service":[]}}}]}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

На основе этого доклада Яндекса у специалистов по продвижению сайтов сформировалось базовое представление о том, на что обращает внимание поисковик: кликабельность страницы в выдаче, среднее время, проведённое на странице (и на сайте в целом), количество просмотренных страниц на визит.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Начали создаваться сервисы для накрутки, которые работали, но не смогли достигнуть желаемых масштабов. Мешала высокая цена и санкции, которые значительно замедляли процесс. Несмотря на достаточно примитивную антифрод-защиту, ситуация контролировалась с помощью ручного бана.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

В 2010 году было популярно воздействовать на поисковую выдачу ботами, которые просто скролили страницу и делали клик. Но тогда же Яндекс применил жесткие санкции к ним, и Userator подтвердили, что «Яндекс» «пессимизировал» положение их клиентов в результатах поиска и положил им всю базу.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Первые реальные сведения о том, что Яндекс использует поведенческие факторы, появились после 1 июня 2011 года. Тогда в выдаче резко взлетели позиции сайтов некоторых SEO-компаний, которые использовали программы по накрутке поведенческих факторов («прокликивали» результаты поисковой выдачи, чтобы повысить вес нужных веб-страниц).

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Тогда же в 2011 Яндекс ввел первые фильтры, наказывающие за накрутку поведенческих факторов почти сразу. Но все равно до конца 2013 года накрутка ПФ давала отличные результаты. Это особенно хорошо видно было по поисковым подсказкам.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Наконец, в декабре 2014 года Яндексом был введён самый серьёзный фильтр, который с тех пор так и называется — фильтр за накрутку поведенческих факторов. Фильтр накладывается на весь сайт на срок от 8 месяцев до двух лет. При этом сайт теряет видимость по всем запросам, за исключением собственного бренда и названия компании. После введения этого фильтра часть оптимизаторских компаний разорилась, а количество желающих накручивать поведенческие факторы резко сократилось.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

В течение следующих четырёх лет с помощью фильтров практика накрутки ПФ была практически полностью ликвидирована. Яндекс смог поднять значимость ПФ для метрики, однако оптимизаторы продолжали искать пробелы в системе. Разумеется, им это удалось, и уязвимость была быстро обнаружена.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Пробить алгоритмы Яндекса удалось с помощью режима «инкогнито» на смартфоне и смене IP-адреса. В ТОП взлетали любые сайты, если, конечно, URL был виден поисковику.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Так в 2019 году появилось множество компаний, занимающихся накруткой ПФ. Последовал ответ от Яндекса, и уже через несколько месяцев Яндекс Вебмастер стал выдавать фатальную ошибку для сайтов, использующих этот метод продвижения.

"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"Оповещение о нарушении в Вебмастере ","image":{"type":"image","data":{"uuid":"24636bf6-f15e-5204-b830-c5f161155e1d","width":550,"height":413,"size":40021,"type":"jpg","color":"f0eeed","hash":"","external_service":[]}}}]}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Так началась очередная волна банов за накрутку.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Что же происходило в Google?

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Официальные представители Google неоднократно называли поведенческие факторы слишком «шумными». Они имели в виду, что факторы ранжирования, связанные с поведением пользователей, нестабильны, в них много помех, поэтому поисковые алгоритмы Google не используют их.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

При этом регулярно обновляли и публиковали патенты, которые описывали поведенческие факторы. Среди них можно найти патент Google 2019 года про «Изменение ранжирования результатов поиска на основе косвенных отзывов пользователей». В нём описывается технология корректировки ранжирования на основе поведения пользователей. Описаны клики на сайт из поисковой выдачи и их влияние. Исходя из этих фактов, можно сделать вывод, что Google в некоторой мере использует поведенческие факторы.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

В Google также есть накрутка ПФ, но ее используют намного меньше. В Google влияние поведенческих факторов по формуле значительно меньше, а также пересчет факторов у него медленнее и плавнее. Если в Яндексе можно изменить ситуацию в выдаче на несколько часов, то в Google счет на недели, ведь чтобы собрать, проанализировать и пересчитать данные по всему свету, нужны мощности и время.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Что происходит сейчас

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Время, когда накрутка была простым и доступным инструментом, прошло. Сейчас это сложный и дорогой процесс. Кто-то до сих пор пользуется услугами известных сервисов, а кто-то пытается делать сам. Но теперь к задаче накрутки ПФ надо подходить с умом, для этого покупают прокси, оборудование, учитывают аффинити индекс, нагуливают профили. Создание ботов в настоящее время – это трудоёмкий процесс, занимающий несколько дней, а то и недель, а история их действий сохраняется в cookies.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Никто не будет отрицать, что сейчас поведенческие факторы учитываются. До тех пор, пока поведенческие факторы являются одним из ключевых моментов при ранжировании, на них будут пытаться искусственно влиять. А в ответ ПС будут принимать свои меры.

"}}],"summaryContent":null,"isExistSummaryContent":false,"warningFromEditor":null,"warningFromEditorTitle":null,"counters":{"comments":0,"favorites":3,"reposts":0,"views":43,"hits":174,"reads":null,"online":0},"dateFavorite":0,"hitsCount":174,"isCommentsEnabled":true,"isLikesEnabled":true,"isRemovedByUserRequest":false,"isFavorited":false,"isPinned":false,"repostId":null,"repostData":null,"subscribedToTreads":false,"isEditorial":false,"isAudioAvailable":false,"audioUrl":null,"isAudioAvailableToGenerate":false,"commentEditor":{"enabled":true,"who":null,"text":"","until":null,"reason":null,"type":"everybody"},"isBlur":false,"isPublished":true,"isDisabledAd":false,"withheld":[],"ogTitle":null,"ogDescription":null,"url":"https://vc.ru/id824164/521760-povedencheskie-faktory-ot-poyavleniya-do-segodnyashnego-dnya","author":{"id":824164,"name":"Yuliya Timonkina","nickname":null,"description":null,"uri":"","avatar":{"type":"image","data":{"uuid":"21e28338-a4cc-50c0-9ccb-b52332158abc","width":960,"height":1280,"size":233542,"type":"jpg","color":"122d32","hash":"","external_service":[]}},"cover":null,"achievements":[{"title":"Год на vc.ru","code":"registration_1_year","description":"Первый год с vc.ru. Получена 24 июля 2025.","previewUuid":"0d11c244-49de-50e7-894e-b9b27945d42b","formats":{"glb":"https://static.vc.ru/achievements/fish.glb","usdz":"https://static.vc.ru/achievements/fish.usdz"},"viewData":{"contentColor":"#C67AA3","textMaxWidth":0.634765625,"textX":0.5888671875,"textY":0.54296875,"logoX":0.5859375,"logoY":0.6669921875,"logoXNoText":0.6044921875,"logoYNoText":0.5439453125},"id":4613737,"userId":824164,"count":0,"shareImage":"https://api.vc.ru/achievements/share/4613737"},{"title":"3 года на vc.ru","code":"registration_3_years","description":"Провёл 3 года вместе с vc.ru. Получена 23 июля 2025.","previewUuid":"d9d72ac5-bcb5-55e0-8c72-b99251e5cdd9","formats":{"glb":"https://static.vc.ru/achievements/shark.glb","usdz":"https://static.vc.ru/achievements/shark.usdz"},"viewData":{"contentColor":"#8E6F09","textMaxWidth":0.66796875,"textX":0.5205078125,"textY":0.341796875,"logoX":0.5205078125,"logoY":0.4609375,"logoXNoText":0.5,"logoYNoText":0.3662109375},"id":989650,"userId":824164,"count":0,"shareImage":"https://api.vc.ru/achievements/share/989650"}],"lastModificationDate":1765137179,"isSubscribed":false,"isSubscribedToNewPosts":false,"isMuted":false,"isAvailableForMessenger":true,"badgeId":null,"isDonationsEnabled":false,"isPlusGiftEnabled":true,"isUnverifiedBlogForCompanyWithoutPro":false,"isRemovedByUserRequest":false,"isFrozen":false,"isDisabledAd":false,"isPlus":false,"isVerified":false,"isPro":false,"yandexMetricaId":null,"badge":null,"isOnline":false,"tgChannelShortname":null,"isUnsubscribable":true,"type":1,"subtype":"personal_blog"},"subsite":{"id":824164,"name":"Yuliya Timonkina","nickname":null,"description":null,"uri":"","avatar":{"type":"image","data":{"uuid":"21e28338-a4cc-50c0-9ccb-b52332158abc","width":960,"height":1280,"size":233542,"type":"jpg","color":"122d32","hash":"","external_service":[]}},"cover":null,"achievements":[{"title":"Год на vc.ru","code":"registration_1_year","description":"Первый год с vc.ru. Получена 24 июля 2025.","previewUuid":"0d11c244-49de-50e7-894e-b9b27945d42b","formats":{"glb":"https://static.vc.ru/achievements/fish.glb","usdz":"https://static.vc.ru/achievements/fish.usdz"},"viewData":{"contentColor":"#C67AA3","textMaxWidth":0.634765625,"textX":0.5888671875,"textY":0.54296875,"logoX":0.5859375,"logoY":0.6669921875,"logoXNoText":0.6044921875,"logoYNoText":0.5439453125},"id":4613737,"userId":824164,"count":0,"shareImage":"https://api.vc.ru/achievements/share/4613737"},{"title":"3 года на vc.ru","code":"registration_3_years","description":"Провёл 3 года вместе с vc.ru. Получена 23 июля 2025.","previewUuid":"d9d72ac5-bcb5-55e0-8c72-b99251e5cdd9","formats":{"glb":"https://static.vc.ru/achievements/shark.glb","usdz":"https://static.vc.ru/achievements/shark.usdz"},"viewData":{"contentColor":"#8E6F09","textMaxWidth":0.66796875,"textX":0.5205078125,"textY":0.341796875,"logoX":0.5205078125,"logoY":0.4609375,"logoXNoText":0.5,"logoYNoText":0.3662109375},"id":989650,"userId":824164,"count":0,"shareImage":"https://api.vc.ru/achievements/share/989650"}],"lastModificationDate":1765137179,"isSubscribed":false,"isSubscribedToNewPosts":false,"isMuted":false,"isAvailableForMessenger":true,"badgeId":null,"isDonationsEnabled":false,"isPlusGiftEnabled":true,"isUnverifiedBlogForCompanyWithoutPro":false,"isRemovedByUserRequest":false,"isFrozen":false,"isDisabledAd":false,"isPlus":false,"isVerified":false,"isPro":false,"yandexMetricaId":null,"badge":null,"isOnline":false,"tgChannelShortname":null,"isUnsubscribable":true,"type":1,"subtype":"personal_blog"},"reactions":{"counters":[{"id":1,"count":3}],"reactionId":0},"isNews":false,"source":null,"clusters":[],"donations":{"amount":0,"isDonated":false},"commentsSeenCount":null}},{"type":"entry","data":{"id":503780,"customUri":null,"subsiteId":824164,"title":"Представление текстовых данных в векторном пространстве","date":1663430749,"dateModified":1663430749,"blocks":[{"type":"text","cover":true,"hidden":false,"anchor":"","data":{"text":"

Одной из значимых задач в области компьютерных алгоритмов является задача извлечения смысла из текста на естественном языке и представление его в понятном для компьютера виде.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Для примера возьмем запросы пользователей из Яндекса,

"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"Текстовые данные - запросы","image":{"type":"image","data":{"uuid":"c07550c0-e734-596c-9940-1a1d305d16c8","width":565,"height":289,"size":30122,"type":"jpg","color":"4774c1","hash":"","external_service":[]}}}]}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Не все алгоритмы могут оперировать запросами в таком виде. Ставится задача обработки входных данных и определения способа, с помощью которого можно будет передать входные данные в понятном для компьютера виде.

"}},{"type":"header","cover":false,"hidden":false,"anchor":"","data":{"style":"h2","text":"Метод TF-IDF"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

TF-IDF – это «частотность терминов-обратная частотность документов». В этом методе получаем математическую матрицу, описывающую частоту встречающихся терминов. В матрице столбцы соответствуют запросам, а строки терминам.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Показатель TF рассчитывается, как отношение количества вхождений слова из запроса к количеству все слов в запросе по формуле:

"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"Формула TF","image":{"type":"image","data":{"uuid":"7b6de69d-9476-5254-b0da-a22b7eabc9bb","width":404,"height":147,"size":6929,"type":"jpg","color":"ebebeb","hash":"","external_service":[]}}}]}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

где n_k – число вхождений слова t в запрос.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Показатель IDF равен логарифму отношения количества запросов к количеству запросов, в которых встречается заданное слово и вычисляется по формуле:

"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"Формула IDF","image":{"type":"image","data":{"uuid":"ccab21d3-97d8-556f-bbd7-389202d36a12","width":600,"height":139,"size":9329,"type":"jpg","color":"e0e0e0","hash":"","external_service":[]}}}]}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

где в числителе – число запросов, а в знаменателе – число запросов, в которых встречается слово t.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Общий же показатель TF-IDF является произведением формул:

"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"Формула TF-IDF","image":{"type":"image","data":{"uuid":"e4ec75a5-672b-525b-ace8-aa553c7ee377","width":662,"height":70,"size":7320,"type":"jpg","color":"e8e8e8","hash":"","external_service":[]}}}]}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Рассчитаем множители TF и IDF для каждого составляющего запросов. Результат представлен в таблице:

"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"Значение TF и IDF","image":{"type":"image","data":{"uuid":"36e4f47d-32f0-5576-93f1-52f2db87ea56","width":650,"height":274,"size":76504,"type":"jpg","color":"c7c7c7","hash":"","external_service":[]}}}]}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Получим значения TF-IDF:

"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"TF-IDF для слов из запросов","image":{"type":"image","data":{"uuid":"509a5707-369a-551f-8334-7efc06f4a0ce","width":650,"height":299,"size":73696,"type":"jpg","color":"cacaca","hash":"","external_service":[]}}}]}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Ключевым моментом здесь является представление каждого запроса в одном векторном пространстве. В составленном векторе каждое слово будет представлено в виде значения, вычисленного по TF-IDF.

"}},{"type":"header","cover":false,"hidden":false,"anchor":"","data":{"style":"h2","text":"Прямое кодирование"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

В данном методе составляется словарь и каждое слово представляется в виде вектора, где одна координата равна 1, а остальные нулям:

"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"Прямое кодирование слов из словаря","image":{"type":"image","data":{"uuid":"0e59d83c-8ee7-5b82-9f7f-515839a9885a","width":796,"height":179,"size":19472,"type":"jpg","color":"0f0f0f","hash":"","external_service":[]}}}]}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

А запрос «купить люстру» примет вид — ((100), (010), (000)) .
Такое векторное представление слов имеет очень большую размерность и неэффективно расходует память.

"}},{"type":"header","cover":false,"hidden":false,"anchor":"","data":{"style":"h2","text":"Метод BAG OF WORDS"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Метод аналогичный прямому кодированию, но в виде вектора представляется весь запрос, а не каждое конкретное слово. В этой модели текст представляется в виде «мешка» слов без учета грамматики, контекста и порядка слов.

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Первым шагом требуется составить словарь. Если взять в качестве словаря все слова русского языка, то размер будет настолько велик, что для обработки потребуется огромное количество ресурсов, явно превышающего возможности обычного компьютера. Да и запросы, которые необходимо представить в виде вектора содержат в среднем по три слова, а значит, что вектор будет содержать огромное количество нулей и только несколько единиц. Напрашивается вывод, что словарь должен состоять из слов, встречающихся в запросах, список которых в свою очередь должен быть достаточно велик. Но в общем списке будут встречаться символы, числа, которые не несут смысловой нагрузки поэтому они не должны попасть в словарь. Также стоит объединить одни и те же слова с разными окончаниями, сделать это можно применив к входным данным алгоритм стемминга. Суть этого метода заключается в определении основ словоформ. Этот алгоритм позволяет отсечь суффиксы и окончания, учитывая специфику языка.
Словарь для рассматриваемых запросов будет иметь вид:

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Словарь = (купит, люстр, светодиод, светильник, настольн, ламп, бра, москв, потолочн)

"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Тогда вектора запросов будут иметь вид,

"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"Представление запросов методом bag of words","image":{"type":"image","data":{"uuid":"57d8e161-bd1e-5f0e-8ef5-59963704104f","width":650,"height":242,"size":85042,"type":"jpg","color":"363636","hash":"","external_service":[]}}}]}},{"type":"header","cover":false,"hidden":false,"anchor":"","data":{"style":"h2","text":"Метод Word2Vec"}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

Word2Vec – это технология Google для анализа семантики естественных языков, которая обрабатывает массивы текстовой информации. Технология включает в себя набор алгоритмов для расчета векторных представлений слов. В начале также создается словарь, а затем слова на основе семантической близости представляет в векторном виде. Слова, встречающиеся в тексте рядом, имеют наибольшее сходство. Таким образом, слова-векторы — это численные представления слов, сохраняющие семантическую связь между ними. Технология работает на базе искусственных нейронных сетей.
На вход Word2Vec поступает текст и некоторые параметры.
Алгоритм для каждого слова ставит в соответствие вектор, отсюда вытекает, что близкие по смыслу слова будут иметь схожие векторы. Мера близости для слов в данном случае – это контекстная близость, то есть близкие слова встречаются в тексте рядом с одинаковыми словами. Расстояние между векторами изменяется при помощи косинусного сходства, по следующей формуле:

"}},{"type":"media","cover":false,"hidden":false,"anchor":"","data":{"items":[{"title":"Формула Word2Vec","image":{"type":"image","data":{"uuid":"60bd1e21-b8fe-534a-9eca-04f763f46c6f","width":689,"height":196,"size":15236,"type":"jpg","color":"0e0e0e","hash":"","external_service":[]}}}]}},{"type":"text","cover":false,"hidden":false,"anchor":"","data":{"text":"

По итогу, Word2Vec максимизирует связь между векторами слов, которые встречаются в похожих контекстах и минимизирует связь для слов, которые не встречаются. На выходе получаем координаты векторов, соответствующих текстовых данных.
Помимо Word2Vec есть и другие более усовершенствованные методы, например, ELMO или BERT и все они также представляют собой нейронную сеть.

"}}],"summaryContent":null,"isExistSummaryContent":false,"warningFromEditor":null,"warningFromEditorTitle":null,"counters":{"comments":0,"favorites":2,"reposts":0,"views":22,"hits":5379,"reads":null,"online":0},"dateFavorite":0,"hitsCount":5379,"isCommentsEnabled":true,"isLikesEnabled":true,"isRemovedByUserRequest":false,"isFavorited":false,"isPinned":false,"repostId":null,"repostData":null,"subscribedToTreads":false,"isEditorial":false,"isAudioAvailable":false,"audioUrl":null,"isAudioAvailableToGenerate":false,"commentEditor":{"enabled":true,"who":null,"text":"","until":null,"reason":null,"type":"everybody"},"isBlur":false,"isPublished":true,"isDisabledAd":false,"withheld":[],"ogTitle":null,"ogDescription":null,"url":"https://vc.ru/id824164/503780-predstavlenie-tekstovyh-dannyh-v-vektornom-prostranstve","author":{"id":824164,"name":"Yuliya Timonkina","nickname":null,"description":null,"uri":"","avatar":{"type":"image","data":{"uuid":"21e28338-a4cc-50c0-9ccb-b52332158abc","width":960,"height":1280,"size":233542,"type":"jpg","color":"122d32","hash":"","external_service":[]}},"cover":null,"achievements":[{"title":"Год на vc.ru","code":"registration_1_year","description":"Первый год с vc.ru. Получена 24 июля 2025.","previewUuid":"0d11c244-49de-50e7-894e-b9b27945d42b","formats":{"glb":"https://static.vc.ru/achievements/fish.glb","usdz":"https://static.vc.ru/achievements/fish.usdz"},"viewData":{"contentColor":"#C67AA3","textMaxWidth":0.634765625,"textX":0.5888671875,"textY":0.54296875,"logoX":0.5859375,"logoY":0.6669921875,"logoXNoText":0.6044921875,"logoYNoText":0.5439453125},"id":4613737,"userId":824164,"count":0,"shareImage":"https://api.vc.ru/achievements/share/4613737"},{"title":"3 года на vc.ru","code":"registration_3_years","description":"Провёл 3 года вместе с vc.ru. Получена 23 июля 2025.","previewUuid":"d9d72ac5-bcb5-55e0-8c72-b99251e5cdd9","formats":{"glb":"https://static.vc.ru/achievements/shark.glb","usdz":"https://static.vc.ru/achievements/shark.usdz"},"viewData":{"contentColor":"#8E6F09","textMaxWidth":0.66796875,"textX":0.5205078125,"textY":0.341796875,"logoX":0.5205078125,"logoY":0.4609375,"logoXNoText":0.5,"logoYNoText":0.3662109375},"id":989650,"userId":824164,"count":0,"shareImage":"https://api.vc.ru/achievements/share/989650"}],"lastModificationDate":1765137179,"isSubscribed":false,"isSubscribedToNewPosts":false,"isMuted":false,"isAvailableForMessenger":true,"badgeId":null,"isDonationsEnabled":false,"isPlusGiftEnabled":true,"isUnverifiedBlogForCompanyWithoutPro":false,"isRemovedByUserRequest":false,"isFrozen":false,"isDisabledAd":false,"isPlus":false,"isVerified":false,"isPro":false,"yandexMetricaId":null,"badge":null,"isOnline":false,"tgChannelShortname":null,"isUnsubscribable":true,"type":1,"subtype":"personal_blog"},"subsite":{"id":824164,"name":"Yuliya Timonkina","nickname":null,"description":null,"uri":"","avatar":{"type":"image","data":{"uuid":"21e28338-a4cc-50c0-9ccb-b52332158abc","width":960,"height":1280,"size":233542,"type":"jpg","color":"122d32","hash":"","external_service":[]}},"cover":null,"achievements":[{"title":"Год на vc.ru","code":"registration_1_year","description":"Первый год с vc.ru. Получена 24 июля 2025.","previewUuid":"0d11c244-49de-50e7-894e-b9b27945d42b","formats":{"glb":"https://static.vc.ru/achievements/fish.glb","usdz":"https://static.vc.ru/achievements/fish.usdz"},"viewData":{"contentColor":"#C67AA3","textMaxWidth":0.634765625,"textX":0.5888671875,"textY":0.54296875,"logoX":0.5859375,"logoY":0.6669921875,"logoXNoText":0.6044921875,"logoYNoText":0.5439453125},"id":4613737,"userId":824164,"count":0,"shareImage":"https://api.vc.ru/achievements/share/4613737"},{"title":"3 года на vc.ru","code":"registration_3_years","description":"Провёл 3 года вместе с vc.ru. Получена 23 июля 2025.","previewUuid":"d9d72ac5-bcb5-55e0-8c72-b99251e5cdd9","formats":{"glb":"https://static.vc.ru/achievements/shark.glb","usdz":"https://static.vc.ru/achievements/shark.usdz"},"viewData":{"contentColor":"#8E6F09","textMaxWidth":0.66796875,"textX":0.5205078125,"textY":0.341796875,"logoX":0.5205078125,"logoY":0.4609375,"logoXNoText":0.5,"logoYNoText":0.3662109375},"id":989650,"userId":824164,"count":0,"shareImage":"https://api.vc.ru/achievements/share/989650"}],"lastModificationDate":1765137179,"isSubscribed":false,"isSubscribedToNewPosts":false,"isMuted":false,"isAvailableForMessenger":true,"badgeId":null,"isDonationsEnabled":false,"isPlusGiftEnabled":true,"isUnverifiedBlogForCompanyWithoutPro":false,"isRemovedByUserRequest":false,"isFrozen":false,"isDisabledAd":false,"isPlus":false,"isVerified":false,"isPro":false,"yandexMetricaId":null,"badge":null,"isOnline":false,"tgChannelShortname":null,"isUnsubscribable":true,"type":1,"subtype":"personal_blog"},"reactions":{"counters":[{"id":1,"count":3}],"reactionId":0},"isNews":false,"source":null,"clusters":[],"donations":{"amount":0,"isDonated":false},"commentsSeenCount":null}}],"cursor":"PuR2GsZKFTvhhG9RBonq6NrVS6IzQAa09I6wtbz/zlbeaPDONLWoxElY4m1AnG4=","isAnonymized":true}};