Учёные разработали ИИ-чат-бот, который эффективно взламывает других ИИ-чат-ботов

29.12.2023, 11:47,
Интересное

Учёные-компьютерщики из Наньянского технологического университета (NTU, Сингапур) нашли эффективный способ взлома чат-ботов с искусственным интеллектом (ИИ). Для этого они обучают ИИ-чат-бот созданию подсказок, которые позволяют обходить защиту других чат-ботов на базе ИИ.

Источник изображения: NTU

Сингапурские исследователи использовали двойной метод взлома большой языковой модели (LLM), получивший название Masterkey. Во-первых, они провели реверс-инжиниринг того, как LLM выявляют вредоносные запросы и защищаются от них. Используя эту информацию, они научили LLM автоматически учиться и предлагать подсказки, которые позволяют обходить защиту других LLM. Таким образом можно создать LLM для взлома, которая сможет автоматически адаптироваться к новым условиям и создавать новые запросы для взлома после того, как разработчики внесут исправления в свои LLM.
После проведения серии тестов на LLM в качестве доказательства, что этот метод действительно представляет реальную угрозу, исследователи сразу же известили о выявленных проблемах провайдеров сервисов после успешного взлома их ИИ-моделей.

Разработка учёных NTU должна помочь компаниям определить слабые стороны и ограничения своих ИИ-чат-ботов, чтобы принять меры по их защите от хакеров.
Источник:
3DNews

рейтинг:

+617

» Схемы взлома WhatsApp выросли в цене до миллионов долларов

» ChatGPT может сделать общедоступными секретные корпоративные данные, считают специалисты по кибербезопасности

» Квантовые компьютеры уже готовы похоронить RSA-шифрование, заявили китайские учёные

Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.

Учёные разработали ИИ-чат-бот, который эффективно взламывает других ИИ-чат-ботов

Белая Русь

Днепр

Список дворян Могилёвской губернии

Могилев. В годы Великой Отечественной войны.

Сверхпроводимость материала LK-99 при комнатной температуре всё же возможна, показало новое исследование

«Скайнет» всё ближе: спутник впервые самостоятельно обнаружил искомый объект с помощью ИИ

Как часто нужно брать отпуск, рассказал врач

Водитель легковушки сбила самокатчицу на пешеходном переходе в Минске

Телефон будет вибрировать и издавать громкий сигнал: в одном из районов Беларуси протестируют систему оповещения о ЧС нового поколения

Нацбанк ужесточает правила для микрозаймов: что изменится для белорусов уже с 20 июня

Очередникам без направлений предложили однушки в классном доме у метро

Тепло возвращается. В пятницу до +27 (видео)

Спецполоса, в которой светофор не действует? Водители решили нарушать по полной (видео, обновлено)

Сеть ЭЗС вводит специальные тарифы для такси и автопарков. Какие расценки?

«В авторизации будет отказано». Учитывайте эти нюансы, пользуясь банковским приложением

Commodore анонсировала «антисмартфон» — «раскладушку» Callback 8020

Семилетний мальчик выпал из окна. Его родителей лишат прав

Велосипед над окном, стул на стене. Какой получится квартира, если не сдерживать фантазии

Известного минского врача, которого искали четверо суток, нашли. Он погиб (обновлено)

Покупка Hyundai закончилась проверкой: экспертиза выявила подделку документов

Майнеры биткоинов уходят в ИИ-сервисы

Около 70 тысяч рублей. Обманутым владельцам вернут деньги, отданные мошенникам

«Поначалу я решил, что это дорожники». Кто и зачем тормозил автомобили на трассе М1? (видео)

«Беларуская кухня — гэта не толькі дранікі». В Минске открылось кафе с рецептами из Полесья

Стал известно расписание минского «Динамо» в новом сезоне КХЛ (обновлено)