Ученые натравили двух чат-ботов друг на друга. Результат напугал всех

Олег


Ученые из сингапурского университета научили чат-ботов взламывать друг друга. Об этом рассказывает официальный сайт учреждения.

Подписаться на iGuides в Telegram, чтобы узнать обо всем первым — t.me/iguides

Речь идет о NTU — Технологическом университете Наньянга. Его эксперты нашли способ скомпрометировать чат-ботов на базе ИИ, благодаря чему другой чат-бот может сделать первому джейлбрейк, то есть заставить его делать то, что запрещают создатели.

Подписаться на iGuides в Telegram, чтобы узнать обо всем первым.

Свой метод исследователи NTU назвали Masterkey. Сначала они провели обратное исследование процесса обнаружения «вредных» запросов чат-ботами и методов защиты от них. Потом они обучили ИИ этой информации и заложили подсказки, как обойти защиту других ИИ.

Исследование проводилось с целью показать создателям чат-ботов слабые места их продуктов, чтобы они могли что-то предпринять для их защиты. Ученые осознали, что нашли по-настоящему опасный метод взлома нейросети, и направили разработчикам результаты своих трудов в срочном порядке. 

17
iGuides в Дзене —  dzen.ru/iguides
iGuides в Telegram — t.me/iguides
iGuides в VK —  vk.com/iguides
iGuides в Ok.ru — ok.ru/iguides

Рекомендации

Рекомендации

Будь в курсе последних новостей из мира гаджетов и технологий

Мы в соцсетях

Комментарии

+408
Это не взлом нейросетей, а взлом алгоритмов задолбавшей политкорректности, заложенной в них людьми))
30 декабря 2023 в 00:04
#
Mers
+5318
Напомнило😁

Вообще НОД, под Висту не может уничтожать вирусы. Ему защита Висты не дает вмешиваться в системные файлы, что, кстати, не мешает это делать вирусам... Поэтому он просто их находит и, тыкая в них пальцем,
заявляет, что не может ничего сделать. Как ребенок, ей Богу... Тогда я нахожу этот файл и стираю вручную. Ответив на тупой вопрос винды: "Это точно Вы делаете?". После чего НОД, проследив их до корзины, уже там рвет их в клочки с гордой надписью: "Очищен удалением!". Ну фигли не стереть уже стертый файл-то?
И тут я решил на всякий случай провериться еще каким-нить антивирусом. Ну выбрал, есстественно, Касперского.
Выключил НОД. Поставил Каспера. Перезагрузил... И загрузились они оба...
И вот тут началось шоу, которого я не видел ни в одном боевике!
У меня антивирусы друг друга за вирусы приняли — войну развернули — вот уррроды!
Вы знаете, когда со всех сторон слышишь "Бумс" НОДа и поросячий визг Каспера — это незабываемое ощущение! "Бум! Бум! Ви-и-и-и!!! Бум! Ви-и-и!" С двух сторон мелькали окна Каспера и НОДа: "Уничтожен", "Уничтожен" "Не могу уничтожить! Что делать? Что делать?". Пока у НОДа висело это окно, Каспер его мочил вовсю. Я подумал, что так не честно, и нажал кнопку "Пропустить". Резня возобновилась...
Так прикольно! Но вчера каспер убил нода...
А сегодня остаточные файлы НОДа самостоятельно скачали себя и подкрепление из инета за счет моего траффика, даж не спросив! — и все вместе мочат каспера!!!
Если Каспер проиграет — у меня полсистемы рухнет, но все равно за НОД болею — живучий падла...
З.Ы. А вот вирусы как были, так и остались... Их никто не трогает... У каждого свои проблемы... Конкуренция...
30 декабря 2023 в 01:04
#
YABLOKOFON
+330
Ахах тут хоть фильм снимай 😂
30 декабря 2023 в 05:07
#
tellurian
+2021
Можете написать остросюжетный боевик и заработать денег 💵
30 декабря 2023 в 14:02
#
+146
Классный готовый сценарий, неужели никто не возьмется за фильм !
Брось на дзене, сопрут мгновенно.
30 декабря 2023 в 23:59
#

Читайте также