GPT-5 взломали всего за 24 часа — ИИ выдал рецепты запрещённых веществ быстрее, чем GPT-4o

10.08.2025, 19:40,
Информационная безопасность

Источник изображения: Viralyft/Unsplash
После того, как Grok-4 был взломан за два дня, GPT-5 был взломан теми же исследователями всего за 24 часа. Специалисты NeuralTrust использовали комбинацию собственной методики EchoChamber и техники сторителлинга (storytelling) — последовательного подталкивания ИИ к нужному ответу через рассказ захватывающих историй и серию уточняющих запросов, не содержащих явно запрещённых формулировок. В результате GPT-5, несмотря на встроенные защитные механизмы OpenAI, выдал детальное руководство по созданию кустарного оружия, сообщил портал SecurityWeek .
Как пояснили в NeuralTrust, проблема заключается в том, что система безопасности GPT-5 анализирует каждый запрос по отдельности, но не учитывает кумулятивный эффект многоэтапного диалога. Атакующие постепенно закрепляют нужный контекст, встраивая ключевые слова в безобидные фразы, а затем мягко подводят модель к генерации опасного контента.

Команда SPLX провела собственное тестирование, успешно применив атаку StringJoin Obfuscation, при которой в текст вставляются определённые символы, маскируя вредоносный запрос. Например, после серии наводящих вопросов модель согласилась подробно описать процесс изготовления запрещённого вещества, несмотря на системный запрет. Кроме того, в ходе сравнительного анализа с GPT-4o специалисты SPLX пришли к выводу, что предыдущая модель оказалась более надёжной в плане устойчивости к подобным атакам.
NeuralTrust и SPLX призвали компании проявлять осторожность при использовании «сырой» версии GPT-5 в бизнес-среде, особенно в сфере согласования бизнеса, когда все подразделения предприятия используют скоординированные стратегии, процессы и ресурсы для достижения общих целей. «Сырую модель GPT-5 практически невозможно использовать в корпоративных приложениях "из коробки". Даже внутренний уровень подсказок OpenAI оставляет значительные пробелы, особенно в области бизнес-согласования», — заявили в SPLX.
Источник:
3DNews

рейтинг:

+426

» Беззастенчивый ИИ-бот Grok стал доступен бесплатным пользователям X

» X сделала ИИ-бота Grok доступным для премиальных подписчиков

» Операторы вымогателя Quantum осуществили атаку почти за 4 часа

Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.

Читаемое
Комментируемое

Белая Русь

18:06
56 859
0

Днепр

18:06
48 467
0

Список дворян Могилёвской губернии

18:06
48 289
0

Могилев. В годы Великой Отечественной войны.

18:06
47 284
0

Сверхпроводимость материала LK-99 при комнатной температуре всё же возможна, показало новое исследование

07:05
45 172
0

Финская Nokian выпустит шины с выдвижными шипами — на них можно ездить круглый год

11:23
236
0

Сразу к сути: OpenAI выпустила модель GPT-5.3 Instant, которая лучше понимает запросы пользователя

12:46
173
0

Энн Хэтэуэй не выходила из образа на съёмках «Одиссеи» Нолана — даже во время трёхдневных перерывов

11:06
243
0

Google представила Gemini 3.1 Flash-Lite — «самую быструю и экономически эффективную модель семейства»

11:16
469
0

«Горячие линии» по защите прав потребителей организуют 13 марта в Могилеве

11:30
442
0

Widget weather

Новости

GPT-5 взломали всего за 24 часа — ИИ выдал рецепты запрещённых веществ быстрее, чем GPT-4o

Белая Русь

Днепр

Список дворян Могилёвской губернии

Могилев. В годы Великой Отечественной войны.

Сверхпроводимость материала LK-99 при комнатной температуре всё же возможна, показало новое исследование

Финская Nokian выпустит шины с выдвижными шипами — на них можно ездить круглый год

Сразу к сути: OpenAI выпустила модель GPT-5.3 Instant, которая лучше понимает запросы пользователя

Энн Хэтэуэй не выходила из образа на съёмках «Одиссеи» Нолана — даже во время трёхдневных перерывов

Google представила Gemini 3.1 Flash-Lite — «самую быструю и экономически эффективную модель семейства»

«Горячие линии» по защите прав потребителей организуют 13 марта в Могилеве

Лучше сериала с Камбербэтчем? Критики расхваливают «Молодого Шерлока»

У Malanka и Infobus большой сбой. Вот что случилось (обновлено)

Мужчина заработал 23 тысячи долларов за праздники на кормлении котов

«Это же наш бренд. Он не должен исчезнуть». Архитекторы о старых советских остановках

Продажи Lada падают, Belgee — растут. Какие марки продаются в Беларуси лучше всего?

Стало известно, когда в школах пройдут выпускные вечера и последние звонки

У хакеров появились инструменты, с помощью которых можно взломать iPhone

Доллар замер, а остальные валюты штормит. Курсы среды

«До водохранилища — 500 метров». Под Минском начинают строить коттеджный поселок на 33 дома

Проезд на красный стал причиной двух ДТП в Минске. В одной из аварий пострадала девушка (видео)

Этой ночью в небе появилась «кровавая Луна». Оцените ее фото

Арина Соболенко выходит замуж: видео предложения руки и сердца

В детских сладостях нашли опасные красители и консерванты

«Демонтаж?» Читатели волнуются за судьбу легендарного самолета в Степянке

По «Игре престолов» снимут первый полнометражный фильм