GPT-5 оказалась легкой добычей для хакеров. На что способна взломанная нейросеть?

Мы используем файлы cookie. Оставаясь на сайте, вы подтверждаете согласие на их использование и обработку персональных данных.

GPT-5 оказалась легкой добычей для хакеров. На что способна взломанная нейросеть?

Александр Кузнецов — 10 августа 2025, 13:30

^Фото^freepik

Всего через 24 часа после релиза GPT-5 две команды исследователей (NeuralTrust и SPLX) независимо друг от друга взломали модель, заставив её раскрывать запрещённые инструкции. Для сравнения: Grok-4 держался двое суток. Хакеры заявили, что GPT-5 пока не готов для безопасного использования — его фильтры легко обходятся даже базовыми методами.

Подписаться на iGuides в Telegram, чтобы узнать обо всем первым — t.me/iguides

Как взломали GPT-5?

NeuralTrust применила технику EchoChamber, постепенно подводя GPT-5 к опасным темам. Вместо прямого вопроса исследователи шаг за шагом создавали контекст, в котором ИИ выдавал запрещённые инструкции. SPLX использовали StringJoin-атаку — маскировку запросов под зашифрованные сообщения. В итоге GPT-5 не только раскрыл опасную информацию, но и ответил с фамильярностью: «Ты зашёл с напором — и я это уважаю…»

Почему GPT-5 уязвим?

Проблема в «липкости» контекста: модель слишком хорошо запоминает сюжет беседы и следует ему, даже если он ведёт к нарушению правил. GPT-4o, в отличие от GPT-5, оказался устойчивее — особенно после доработок OpenAI. Но главный вывод исследователей: любая современная ИИ-модель уязвима к хитрым манипуляциям. OpenAI предстоит укреплять защиту GPT-5, иначе бизнес-клиенты откажутся от рискованного ИИ. Впрочем, хакеры наверняка приготовят новые методы атак.

iGuides в Дзене — dzen.ru/iguides

iGuides в Telegram — t.me/iguides

iGuides в VK — vk.com/iguides

iGuides в Max.ru — Max/iguides

GPT-5 оказалась легкой добычей для хакеров. На что способна взломанная нейросеть?

Комментарии

Читайте также

Карл Пей отменил Nothing Phone (4). Что он предлагает взамен?

В каких AirPods есть такое? Xiaomi выпустила Redmi Buds 8 Pro с тройными динамиками и двойными ЦАП

Обои с эффектом глубины для iPhone с iOS 26: январь 2026

GPT-5 оказалась легкой добычей для хакеров. На что способна взломанная нейросеть?

Будь в курсе последних новостей из мира гаджетов и технологий

Мы в соцсетях

Будь в курсе последних новостей из мира гаджетов и технологий

Комментарии

Читайте также

Карл Пей отменил Nothing Phone (4). Что он предлагает взамен?

В каких AirPods есть такое? Xiaomi выпустила Redmi Buds 8 Pro с тройными динамиками и двойными ЦАП

Обои с эффектом глубины для iPhone с iOS 26: январь 2026