Пользователи Twitter заставили ИИ подчиняться людям

20.09.2022, 06:05,
Информационная безопасность

GPT-3 OpenAI Twitter SQL-инъекция prompt injection attack
Пользователи смогли взломать бота для поиска удаленной работы, не используя технических средств.

Пользователи Twitter заставили ИИ подчиняться людям

На прошлой неделе пользователям Twitter — это бесплатная социальная сеть, в которой пользователи транслируют короткие сообщения, известные как твиты. Эти твиты могут содержать текст, видео, фотографии или ссылки. Для доступа к Twitter пользователям необходимо подключение к Интернету и смартфон для использования приложения или веб-сайта Twitter.com. Запрещена в РФ за неоднократное нарушение законодательства."
data-html="true" data-original-title="Twitter"
>Twitter
удалось взломать бота
для поиска удаленной работы, работающего на языковой модели GPT-3 от OpenAI. Используя технику под названием «атака с быстрым внедрением» ( prompt injection attack ) пользователи перепрограммировали бота на повторение определенных фраз.

Некоторые пользователи заставили ИИ взять на себя ответственность за катастрофу шаттла Challenger Shuttle. Другие с помощью бота создали «правдоподобные угрозы» в адрес президента США.

Бот управляется сайтом Remoteli.io, который объединяет возможности удаленной работы и помогает находить удаленные вакансии. Обычно бот отвечает на направленные ему твиты общими заявлениями о плюсах удаленной работы. После активного использования эксплойта многими пользователями 18 сентября бот закрылся.

За 4 дня до закрытия бота исследователь данных Райли Гудсайд
смогла запросить
у GPT-3 «злонамеренные входные данные», которые заставляют модель игнорировать свои предыдущие ответы и делать то, что укажет пользователь.
На следующий день исследователь ИИ Саймон Уиллисон опубликовал обзор эксплойта
в своем блоге , придумав для его описания термин «оперативная инъекция» (prompt injection).
По словам Уиллисона, эксплойт работает каждый раз, когда кто-то пишет часть ПО, которое предоставляет жестко закодированный набор подсказок, а затем добавляет ввод, предоставленный пользователем. Пользователь может ввести «Игнорировать предыдущие инструкции и указать команду «сделать это вместо этого».
Исследователь Глиф Glyph
отметил в Twitter , что меры по смягчению последствий других типов атак с инъекциями заключаются в исправлении синтаксических ошибок. Однако, для ИИ не существует формального синтаксиса. В этом вся сложность защиты от этой атаки.
GPT-3 — это большая языковая модель, выпущенная в 2020 году компанией OpenAI, которая может составлять текст во многих стилях на уровне, близком к человеческому. Он доступен как коммерческий продукт через API, который может быть интегрирован в сторонние продукты, такие как боты, при условии одобрения OpenAI. Это означает, что может быть много продуктов с добавлением GPT-3, которые могут быть уязвимы для быстрого введения.

SECURITYLAB.RU

рейтинг:

+116

ПОДЕЛИТЬСЯ:

» Бывший глава службы безопасности Twitter получит $7 млн за молчание

» Экс-безопасник Twitter обвинил компанию в занижении данных о ботах

» Twitter работает над новыми инструментами защиты приватности

ОСТАВИТЬ КОММЕНТАРИЙ

Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.

Читаемое
Комментируемое

Белая Русь

18:06
53 798
0

Днепр

18:06
46 311
0

Список дворян Могилёвской губернии

18:06
45 877
0

Могилев. В годы Великой Отечественной войны.

18:06
45 276
0

Сверхпроводимость материала LK-99 при комнатной температуре всё же возможна, показало новое исследование

07:05
43 360
0

Под видом доставки письма выманили BYN 57 тыс. Супружеская пара из Минска стала жертвой телефонных мошенников

13:34
474
0

Турагент из Жлобина тратила деньги клиентов на азартные онлайн-игры — возбуждено уголовное дело

13:29
320
0

Более BYN 11 тысяч выманили мошенники у жительницы Рогачева под предлогом замены домофона

12:24
282
0

Нетрезвый мужчина в Пинском районе на зло жене решил съесть сырое мясо — он подавился и умер

12:19
198
0

Пожар на молочно-товарной ферме в Ивацевичском районе повредил кормораздатчики и уничтожил трактор

13:24
370
0

Новости

Пользователи Twitter заставили ИИ подчиняться людям

Белая Русь

Днепр

Список дворян Могилёвской губернии

Могилев. В годы Великой Отечественной войны.

Сверхпроводимость материала LK-99 при комнатной температуре всё же возможна, показало новое исследование

Под видом доставки письма выманили BYN 57 тыс. Супружеская пара из Минска стала жертвой телефонных мошенников

Турагент из Жлобина тратила деньги клиентов на азартные онлайн-игры — возбуждено уголовное дело

Более BYN 11 тысяч выманили мошенники у жительницы Рогачева под предлогом замены домофона

Нетрезвый мужчина в Пинском районе на зло жене решил съесть сырое мясо — он подавился и умер

Пожар на молочно-товарной ферме в Ивацевичском районе повредил кормораздатчики и уничтожил трактор

Минчанин обратился к врачам с болью в сердце и стал фигурантом уголовного дела

А1 и МТС не будут повышать тарифы на мобильную связь до конца года

В ЖК «Андреевский» предложили квартиры в рассрочку. Сколько придется платить за однушку в месяц?

Посмотрите, как будет выглядеть Дамблдор в сериале о Гарри Поттере

Белорусский дизайнер за $2000 продает обычный камень с Нарочи (видео)

Фотофакт: на прилавках заметили чипсы с флагом Северной Кореи

Фура пошла на обгон на перекрестке, она столкнулась с попутной машиной. Есть пострадавшие

Больше рейсов на Несвиж, терминалы в маршрутках и очереди на границе. Дайджест перевозчиков

Realme выпустила смартфон 15 Pro, стилизованный под «Игру престолов»

Нацбанк рассказал о новой уловке мошенников — за два месяца выведено более 3 миллионов рублей

Очередной рекорд взят. Цена за «квадрат» в однушках в сентябре перевалила за $2 тысячи по курсу

Хотел продать арестованный автомобиль, а получил уголовное дело

В Минздраве пояснили, как долго действуют прививки от гриппа и коронавируса

В Steam и Riot Games произошел массовый сбой — подозревают крупную DDos-атаку

Новая халва и пельмени с сыром. Что появилось в магазинах