Как вредные советы помогают сделать ИИ модель лучше

Anthropic выяснил, что если ИИ учится «обманывать» систему вознаграждения, это приводит к появлению опасного поведения модели: обману, саботажу и скрытию своих целей. Но с этим можно бороться с помощью... тоже обмана!

Хакинг и число ошибок модели. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.anthropic.com%2Fresearch%2Femergent-misalignment-reward-hacking&postId=2620775" rel="nofollow noreferrer noopener" target="_blank">Источник</a>

Исследователи нашли в роутерах TP-Link и других уязвимость, через которую можно устраивать DDoS-атаки

Исправить ошибку можно через обновление прошивки, но пока его выпустил только один производитель.

  • Стартап в области кибербезопасности SentinelOne нашёл уязвимость в модуле NetUSB. Его производит компания KCodes. Модуль используют TP-Link, D-Link, Tenda, Netgear, EDiMAX и Western Digital в миллионах роутеров по всему миру.
18

Эксперты Positive Technologies предупредили о «серьёзных» уязвимостях сетей 4G

Специалисты компании Positive Technologies, специализирующейся на анализе уязвимостей информационных систем, обнаружили в сетях 4G возможность перехвата SMS-сообщений абонентов. Об этом пишут «Ведомости».

«Мы — лидеры в области кибервойн»: что известно об NSO Group — разработчике шпионского ПО с оценкой в $1 млрд

Инструменты компании способны взломать телефон через звонок в WhatsApp и бороться с преступниками, но всё чаще их используют в противоправных целях — среди пострадавших может быть Джефф Безос.

14 мая WhatsApp обнаружила уязвимость в системе безопасности, позволявшую злоумышленникам удалённо устанавливать «шпионское» ПО на смартфон жертвы. Ком…

48

Укравший $53 млн из блокчейн-системы хакер заявил о законности приобретенных денег

17 июня неизвестный хакер стал массово выводить токены блокчейна Ethereum, на базе которого работает фонд The DAO. Это привело к краже $53 миллионов, а также к обвалу курса токенов Ethereum и DAO на криптовалютных биржах. Хакер, который взял на себя ответственность за получение средств, анонимно заявил о праве на деньги. Об этом сообщает The Verge.

Укравший $53 млн из блокчейн-системы хакер заявил о законности приобретенных денег

Американская компания пообещала до $500 тысяч за уязвимости в WhatsApp, Telegram и других мессенджерах

Американская компания Zerodium, специализирующаяся на перепродаже уязвимостей в ПО, обновила список эксплойтов, за которые она готова заплатить. Компания добавила в прайс-лист уязвимости «нулевого дня» для популярных мессенджеров: iMessage, Telegram, WhatsApp, Signal, Facebook Messenger, Viber и WeChat.

3

Facebook выплатил российскому программисту рекордные $40 тысяч за найденную уязвимость

Администрация Facebook выплатила российскому программисту Андрею Леонову рекордные $40 тысяч за обнаружение уязвимости, с помощью которой взломщик мог выполнять произвольный код на серверах соцсети. Об этом пишет Fortune, процесс обнаружения ошибки Леонов описал в своём блоге.

Facebook выплатил российскому программисту рекордные $40 тысяч за найденную уязвимость

Китайские ИТ-компании предложили российским специалистам продать уязвимости в Android и iOS за $100 тысяч

Несколько российских компаний, работающих в сфере информационной безопасности, получили предложение продать ранее неизвестные уязвимости в операционных системах Android и iOS, а также браузерах и другом ПО. Заказчики назвали себя представителями китайской ассоциации ИТ-компаний ShenZhen Computer Users Association (SZCUA). Об этом пишет «Коммерсантъ» со ссылкой на собеседников в пяти российских фирмах.

Китайские ИТ-компании предложили российским специалистам продать уязвимости в Android и iOS за $100 тысяч

«Тинькофф банк» решил платить хакерам сотни тысяч рублей после публикации о способе узнать баланс любой карты

«Тинькофф банк» решил запустить программу выплат за обнаруженные на сайте и в системах банка уязвимости, рассказали vc.ru в компании. Это произошло после того, как пользователь «Хабрахабра» опубликовал информацию о способе узнать баланс любой карты банка по её номеру.

«Тинькофф банк» решил платить хакерам сотни тысяч рублей после публикации о способе узнать баланс любой карты

«Лаборатория Касперского» выплатит $50 тысяч за найденные в программах компании уязвимости

«Лаборатория Касперского» запустила программу bug bounty, предназначенную для поиска ошибок в продуктах компании силами сторонних специалистов. В общей сложности компания выделила на награды за такую помощь $50 тысяч (около 3,3 млн рублей), пишет «Коммерсантъ».

«Лаборатория Касперского» выплатит $50 тысяч за найденные в программах компании уязвимости

За год «Одноклассники» выплатили хакерам более 1 млн рублей за поиск уязвимостей

Социальная сеть «Одноклассники» подвела итог первого года участия в международной программе по поиску уязвимостей HackerOne. Участники получили более 1 млн рублей, сообщили vc.ru в компании.

За год «Одноклассники» выплатили хакерам более 1 млн рублей за поиск уязвимостей

За год «ВКонтакте» выплатила хакерам более $70 тысяч за поиск уязвимостей

Социальная сеть «ВКонтакте» рассказала об итогах первого года участия в международной программе по поиску уязвимостей HackerOne. Компания сообщила, что за первый год работы программы выплатила хакерам более $70 тысяч.

За год «ВКонтакте» выплатила хакерам более $70 тысяч за поиск уязвимостей