Google официально внедрил функции AI Mode и AI Overviews. Теперь в краткие обзоры поиска система включает цитаты, мнения и советы из социальных сетей и веб-форумов, в частности с Reddit.
В чем суть обновления:
Google официально внедрил функции AI Mode и AI Overviews. Теперь в краткие обзоры поиска система включает цитаты, мнения и советы из социальных сетей и веб-форумов, в частности с Reddit.
В чем суть обновления:
Интуитивно кажется, что да: мы тренируем ИИ не отвечать на нехорошие запросы нехороших людей – ИИ становится безопаснее. Но на деле всё несколько более сложно и запутанно. Давайте об этом поговорим.
Если конкретнее, мы будем говорить не об ИИ вообще, а о больших языковых моделях. Ещё конкретнее, мы разберём статью «LLMs Encode Harmfulness and…
Это вывод из нового исследования OpenAI (методика тут). Модели могут уклоняться от ответов, сознательно ухудшать ответы. Рассажу об этом подробнее и том, как можно защититься от этого.