Toward Effective Moving Target Defense Against Adversarial AI

MILCOM 2021 - 2021 IEEE Military Communications Conference (MILCOM) Pub Date : 2021-11-29 DOI:10.1109/MILCOM52596.2021.9652915

Peter Martin, Jian Fan, Taejin Kim, W. Vesey, Lloyd G. Greenwald

{"title":"Toward Effective Moving Target Defense Against Adversarial AI","authors":"Peter Martin, Jian Fan, Taejin Kim, W. Vesey, Lloyd G. Greenwald","doi":"10.1109/MILCOM52596.2021.9652915","DOIUrl":null,"url":null,"abstract":"Deep learning (DL) models have been shown to be vulnerable to adversarial attacks. DL model security against adversarial attacks is critical to using DL-trained models in forward deployed systems, e.g. facial recognition, document characterization, or object detection. We provide results and lessons learned applying a moving target defense (MTD) strategy against iterative, gradient-based adversarial attacks. Our strategy involves (1) training a diverse ensemble of DL models, (2) applying randomized affine input transformations to inputs, and (3) randomizing output decisions. We report a primary lesson that this strategy is ineffective against a white-box adversary, which could completely circumvent output randomization using a deterministic surrogate. We reveal how our ensemble models lacked the diversity necessary for effective MTD. We also evaluate our MTD strategy against a black-box adversary employing an ensemble surrogate model. We conclude that an MTD strategy against black-box adversarial attacks crucially depends on lack of transferability between models.","PeriodicalId":187645,"journal":{"name":"MILCOM 2021 - 2021 IEEE Military Communications Conference (MILCOM)","volume":"15 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2021-11-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"2","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"MILCOM 2021 - 2021 IEEE Military Communications Conference (MILCOM)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.1109/MILCOM52596.2021.9652915","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 2

Abstract

Deep learning (DL) models have been shown to be vulnerable to adversarial attacks. DL model security against adversarial attacks is critical to using DL-trained models in forward deployed systems, e.g. facial recognition, document characterization, or object detection. We provide results and lessons learned applying a moving target defense (MTD) strategy against iterative, gradient-based adversarial attacks. Our strategy involves (1) training a diverse ensemble of DL models, (2) applying randomized affine input transformations to inputs, and (3) randomizing output decisions. We report a primary lesson that this strategy is ineffective against a white-box adversary, which could completely circumvent output randomization using a deterministic surrogate. We reveal how our ensemble models lacked the diversity necessary for effective MTD. We also evaluate our MTD strategy against a black-box adversary employing an ensemble surrogate model. We conclude that an MTD strategy against black-box adversarial attacks crucially depends on lack of transferability between models.

查看原文本刊更多论文

针对敌对AI的有效移动目标防御

深度学习(DL)模型已被证明容易受到对抗性攻击。深度学习模型对抗对抗性攻击的安全性对于在前向部署系统中使用深度学习训练的模型至关重要，例如面部识别、文档表征或对象检测。我们提供了应用移动目标防御(MTD)策略对抗迭代的、基于梯度的对抗性攻击的结果和经验教训。我们的策略包括(1)训练不同的DL模型集合，(2)对输入应用随机仿射输入变换，以及(3)随机化输出决策。我们报告了一个主要教训，即该策略对白盒对手无效，白盒对手可以使用确定性代理完全规避输出随机化。我们揭示了我们的集成模型如何缺乏有效MTD所需的多样性。我们还针对使用集成代理模型的黑盒对手评估我们的MTD策略。我们得出结论，针对黑盒对抗性攻击的MTD策略关键取决于模型之间缺乏可转移性。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

MILCOM 2021 - 2021 IEEE Military Communications Conference (MILCOM)

自引率

0.00%

发文量