Ученые из сингапурского университета научили чат-ботов взламывать друг друга. Об этом рассказывает официальный сайт учреждения.
Подписаться на iGuides в Telegram, чтобы узнать обо всем первым.
Свой метод исследователи NTU назвали Masterkey. Сначала они провели обратное исследование процесса обнаружения «вредных» запросов чат-ботами и методов защиты от них. Потом они обучили ИИ этой информации и заложили подсказки, как обойти защиту других ИИ.
Исследование проводилось с целью показать создателям чат-ботов слабые места их продуктов, чтобы они могли что-то предпринять для их защиты. Ученые осознали, что нашли по-настоящему опасный метод взлома нейросети, и направили разработчикам результаты своих трудов в срочном порядке.