Anthropic выяснил, что если ИИ учится «обманывать» систему вознаграждения, это приводит к появлению опасного поведения модели: обману, саботажу и скрытию своих целей. Но с этим можно бороться с помощью... тоже обмана!
Anthropic выяснил, что если ИИ учится «обманывать» систему вознаграждения, это приводит к появлению опасного поведения модели: обману, саботажу и скрытию своих целей. Но с этим можно бороться с помощью... тоже обмана!
Исправить ошибку можно через обновление прошивки, но пока его выпустил только один производитель.
Специалисты компании Positive Technologies, специализирующейся на анализе уязвимостей информационных систем, обнаружили в сетях 4G возможность перехвата SMS-сообщений абонентов. Об этом пишут «Ведомости».
Инструменты компании способны взломать телефон через звонок в WhatsApp и бороться с преступниками, но всё чаще их используют в противоправных целях — среди пострадавших может быть Джефф Безос.
14 мая WhatsApp обнаружила уязвимость в системе безопасности, позволявшую злоумышленникам удалённо устанавливать «шпионское» ПО на смартфон жертвы. Ком…
17 июня неизвестный хакер стал массово выводить токены блокчейна Ethereum, на базе которого работает фонд The DAO. Это привело к краже $53 миллионов, а также к обвалу курса токенов Ethereum и DAO на криптовалютных биржах. Хакер, который взял на себя ответственность за получение средств, анонимно заявил о праве на деньги. Об этом сообщает The Verge.

Американская компания Zerodium, специализирующаяся на перепродаже уязвимостей в ПО, обновила список эксплойтов, за которые она готова заплатить. Компания добавила в прайс-лист уязвимости «нулевого дня» для популярных мессенджеров: iMessage, Telegram, WhatsApp, Signal, Facebook Messenger, Viber и WeChat.
Несколько российских компаний, работающих в сфере информационной безопасности, получили предложение продать ранее неизвестные уязвимости в операционных системах Android и iOS, а также браузерах и другом ПО. Заказчики назвали себя представителями китайской ассоциации ИТ-компаний ShenZhen Computer Users Association (SZCUA). Об этом пишет «Коммерсантъ» со ссылкой на собеседников в пяти российских фирмах.

«Тинькофф банк» решил запустить программу выплат за обнаруженные на сайте и в системах банка уязвимости, рассказали vc.ru в компании. Это произошло после того, как пользователь «Хабрахабра» опубликовал информацию о способе узнать баланс любой карты банка по её номеру.

«Лаборатория Касперского» запустила программу bug bounty, предназначенную для поиска ошибок в продуктах компании силами сторонних специалистов. В общей сложности компания выделила на награды за такую помощь $50 тысяч (около 3,3 млн рублей), пишет «Коммерсантъ».

Социальная сеть «Одноклассники» подвела итог первого года участия в международной программе по поиску уязвимостей HackerOne. Участники получили более 1 млн рублей, сообщили vc.ru в компании.

Социальная сеть «ВКонтакте» рассказала об итогах первого года участия в международной программе по поиску уязвимостей HackerOne. Компания сообщила, что за первый год работы программы выплатила хакерам более $70 тысяч.
