Выравнивание: статьи и новости по теме

Праздник непослушания: ИИ модели могут лишь притворяться, что слушают инструкции

Исследователи выяснили, что ИИ модели могут только на словах соглашаться следовать инструкциям, преследуют свои собственные цели (да-да, все как у людей!). Почему исследователи сделали такой вывод, чем это грозит, и как собираются исправлять?

🔥 Еще больше интересного в моем канале Продуктовые штучки

Наташа Хазеева

29 июня

Большинство ИИ-моделей склонны к шантажу в определённых условиях

И это не баг, а фича, утверждают исследователи. Расскажу, как пришли к такому выводу пришли, и что предлагается делать

🔥 Еще больше интересного в моем канале продуктовые штучки

Tiku Digital

Дизайн

13.09.2024

Как выравнивать текст

Как выравнивать текст — о том как выравнивать текст в 99 % случаев. Открываем рубрику дизайна. Это очень простое правило, но очень важное и сразу меняет ваш уровень, как дизайнера.

Наташа Хазеева

Будущее

18.12.2023

О проблеме выравнивания искусственного интеллекта на пальцах

t.me

Продуктовые штучки

Я интересуюсь новостями искусственного интеллекта, и расскажу простыми словами, что такое проблема выравнивания, почему она важна для развития самой технологии и нас с вами, потребителей сервисов искусственного интеллекта. А также о последних достижениях в решении этой головоломной задачи.

Наташа Хазеева

ChatGPT

09.12.2023

ChatGPT отвечает лучше за деньги? Так ли это (и почему)

Пользователь X (ex-Twitter) выяснил, что если пообещать GPT-4 за ответ $20, то ответ становится лучше на 6%, а если предложить $200, то уже на все 11%. О чем это говорит и что это значит для нас, обычных потребителей продуктов искусственного интеллекта?