Неконтролируемое обучение поможет обнаружить состязательные атаки

31.08.2021, 17:29,
Информационная безопасность

Университет Карнеги-Меллона KAIST нейронные сети машинное обучение состязательные атаки
Ученые разработали технику, использующую объяснительные методы для определения данных, подвергшихся состязательным атакам.

Неконтролируемое обучение поможет обнаружить состязательные атаки

По мере того, как модели машинного обучения все чаще становятся важным компонентом критических приложений, растет и риск появления новых угроз кибербезопасности, таких как состязательные атаки (adversarial attacks), подразумевающие обман нейросети с тем, чтобы она выдала неверный результат.
Команда специалистов из Университета Карнеги-Меллона и Корейского института передовых технологий (KAIST) разработала новую технику, предполагающую использование объяснительных методов для определения данных, подвергшихся состязательным атакам.
Подобные алгоритмы обычно имеют параметр, ограничивающий объем допустимых изменений для того, чтобы модификации остались незаметными. Существует немало различных способов защиты моделей машинного обучения от состязательных атак, но наиболее популярные методы требуют значительных вычислительных затрат и точности.
В ходе исследования ученые обнаружили связь между состязательными атаками и объяснительностью – еще одним камнем преткновения для моделей машинного обучения. Во многих моделях, особенно в глубоких нейронных сетях, решения сложно отследить из-за большого числа параметров, что усложняет реализацию алгоритмов в приложениях, где требуется объяснение алгоритмических решений.
Новый метод базируется на том, что при «прогонке» модифицированного изображения через объяснительные алгоритмы, будут выдаваться аномальные результаты. Техника позволяет выявлять состязательные атаки на основе их объяснительных карт.
По словам специалистов, защита строится в несколько этапов: на первом «сеть-инспектор» использует объяснительные техники для построения карты визуального внимания (карта салиентности) для образцов данных, используемых для тренировки модели машинного обучения. Далее эти карты применяются для обучения «реконструкторской сети» для воспроизведения каждого решения, принятого моделью. Поскольку конструкторские сети обучаются на безобидных образцах, при работе с вредоносными образцами они выдают необычные результаты, что позволяет «инспектору» обнаруживать и помечать модифицированные изображения.
Специалисты протестировали новый метод на MNIST – базе данных образцов рукописного написания цифр, часто используемой для тестирования различных техник машинного обучения. Согласно результатам, метод бесконтрольного обучения смог справиться с обнаружением состязательных атак наравне или лучше по сравнению с популярными техниками. В будущем исследователи планируют испытать новый метод на более сложных базах данных, таких как CIFAR10/100 и ImageNet .
Салиентность – термин обозначающий свойство объекта, человека, пикселя и т.д. выделяться на фоне группы других, соседних объектов того же типа. Карты салиентности – вероятность того, что при первом взгляде человек обратит внимание на конкретные пиксели.
Объяснительность (explainability) - концепция, предполагающая, что модель машинного обучения и ее результаты могут объясняться понятным человеку образом.

SECURITYLAB.RU

рейтинг:

[/related-news]

Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.

Читаемое
Комментируемое

Белая Русь

18:06
56 859
0

Днепр

18:06
48 467
0

Список дворян Могилёвской губернии

18:06
48 289
0

Могилев. В годы Великой Отечественной войны.

18:06
47 284
0

Сверхпроводимость материала LK-99 при комнатной температуре всё же возможна, показало новое исследование

07:05
45 172
0

Финская Nokian выпустит шины с выдвижными шипами — на них можно ездить круглый год

11:23
267
0

Сразу к сути: OpenAI выпустила модель GPT-5.3 Instant, которая лучше понимает запросы пользователя

12:46
226
0

Энн Хэтэуэй не выходила из образа на съёмках «Одиссеи» Нолана — даже во время трёхдневных перерывов

11:06
265
0

Google представила Gemini 3.1 Flash-Lite — «самую быструю и экономически эффективную модель семейства»

11:16
489
0

«Горячие линии» по защите прав потребителей организуют 13 марта в Могилеве

11:30
456
0

Widget weather

Новости

Неконтролируемое обучение поможет обнаружить состязательные атаки

Белая Русь

Днепр

Список дворян Могилёвской губернии

Могилев. В годы Великой Отечественной войны.

Сверхпроводимость материала LK-99 при комнатной температуре всё же возможна, показало новое исследование

Финская Nokian выпустит шины с выдвижными шипами — на них можно ездить круглый год

Сразу к сути: OpenAI выпустила модель GPT-5.3 Instant, которая лучше понимает запросы пользователя

Энн Хэтэуэй не выходила из образа на съёмках «Одиссеи» Нолана — даже во время трёхдневных перерывов

Google представила Gemini 3.1 Flash-Lite — «самую быструю и экономически эффективную модель семейства»

«Горячие линии» по защите прав потребителей организуют 13 марта в Могилеве

Изобретатель из Индии создал самый маленький игровой автомат в мире

У Malanka и Infobus большой сбой. Зато зарядить электромобиль прямо сейчас можно бесплатно (обновлено)

Необычное ДТП: катафалк перевернулся на дороге после столкновения с МАЗом и легковушкой (видео)

Бизнесмен платил взятки за приемку товара, но избежал наказания

Белстат подсчитал, сколько дней в году белорусы проводят за границей

На гольф-поле образовался провал. Внутри нашли неожиданное

Лучше сериала с Камбербэтчем? Критики расхваливают «Молодого Шерлока»

Мужчина заработал 23 тысячи долларов за праздники на кормлении котов

«Это же наш бренд. Он не должен исчезнуть». Архитекторы о старых советских остановках

Продажи Lada падают, Belgee — растут. Какие марки продаются в Беларуси лучше всего?

Стало известно, когда в школах пройдут выпускные вечера и последние звонки

У хакеров появились инструменты, с помощью которых можно взломать iPhone

Доллар замер, а остальные валюты штормит. Курсы среды (обновлено)

«До водохранилища — 500 метров». Под Минском начинают строить коттеджный поселок на 33 дома

Проезд на красный стал причиной двух ДТП в Минске. В одной из аварий пострадала девушка (видео)