Feature Disruptive Attack [Kor]
Ganeshan et al. / Feature Disruptive Attack / ICCV 2019
Last updated
Ganeshan et al. / Feature Disruptive Attack / ICCV 2019
Last updated
Deep neural network (DNN)ė ģ“ėÆøģ§ ė¶ė„, ė¬¼ģ²“ ź²ģ¶ ė± ė¤ģķ ģ»“ķØķ° ė¹ģ ė¶ģ¼ģģ ķė„ķ ģ±ė„ģ ė³“ģ ėė¤. ķģ§ė§ DNNģ ģ“ėÆøģ§ģ ģøź°ģ ėģ ģ ģøģėģ§ ģė ģģ ė øģ“ģ¦ė„¼ ģ¶ź°ķģ¬ ė§ė ģ ėģ ģģ ģ ģ·Øģ½ķ©ėė¤. ģ“ė° ģ ėģ ģģ ė„¼ ė§ėė ė°©ė²ģ ģ ėģ ź³µź²©ģ“ė¼ ķ©ėė¤. ģ ėģ ź³µź²©ź³¼ ģ“ė„¼ ė§źø° ģķ ė°©ģ“ źø°ė²ė¤ģ“ ģ ģėė ź³¼ģ ģģ ė¤ķøģķ¬ģ ģ·Øģ½ģ±ģ ėķ ģ°źµ¬ź° ģ“ė£Øģ“ģ§ź³ ģ“ė ė¤ķøģķ¬ģ ģ±ė„ź³¼ robustnessė„¼ ķ„ģģķ¬ ģ ģģµėė¤. ė°ė¼ģ, ģ ėģ ģģ ė„¼ ė§ėė ė°©ė²ģ ģ°źµ¬ķė ź²ģ ė¤ķøģķ¬ģ ėķ ģ“ķ“ģ ģ±ė„ ķ„ģģ ėģģ ģ¤ėė¤. ģ“ėÆøģ§ ė¶ė„ģģģ ģ ėģ ź³µź²©ģ ė¤ķøģķ¬ź° ģė³ø ģ“ėÆøģ§ģ classė” ģøģķģ§ ėŖ»ķėė” ģ“ėÆøģ§ģ ė øģ“ģ¦ė„¼ ģ¶ź°ķ ģ ėģ ģģ ė„¼ ė§ėė ź²ģ ė§ķ©ėė¤. źø°ģ”“ģ ģ ėģ ź³µź²©ė¤ģ DNNģ ė§ģ§ė§ ė¶ė¶ģ ķ“ė¹ķė softmax ķ¹ģ pre-softmaxė„¼ ģ¬ģ©ķģ¬ ģ ėģ ģģ ė„¼ ģģ±ķ©ėė¤. ė³ø ė ¼ė¬øģģė ģ“ė ź² ģģ±ķ ģ ėģ ģģ ė ė ź°ģ§ ė¬øģ ģ ģ“ ģė¤ź³ ė§ķź³ ģģµėė¤. ģ²« ė²ģ§øė ģ ėģ ģģ ģ deep featureź° ģė³ø ģ“ėÆøģ§ģ ģ ė³“ė„¼ ģ¬ģ ķ ķ¬ķØķź³ ģė¤ė ģ ģ“ź³ ė ė²ģ§øė networkź° ģ ėģ ģģ ė„¼ ģė³ø ģ“ėÆøģ§ģ ģ ģ¬ķ classė” ģøģķź±°ė ģė³ø ģ“ėÆøģ§ė” ģģø”ķė ķė„ ģ“ ģ¬ģ ķ ėė¤ė ģ ģ ėė¤.
FGSM ģė³ø ģ“ėÆøģ§ė„¼ , ģė³ø ģ“ėÆøģ§ģ classė„¼ , ė¤ķøģķ¬ģ cross entropy loss function Jė¼ź³ ķģ ė ģ“ėÆøģ§ ģ ėķ loss functionģ gradient ė¶ķøė„¼ ģ“ģ©ķģ¬ ģ ėķ loss functionģ“ ģ¦ź°ķė ė°©ķ„ģ¼ė” ģ“ėÆøģ§ė„¼ ģ ė°ģ“ķøķ©ėė¤. ģ“ ź³¼ģ ģ ķµķ“ ė¤ķøģķ¬ź° ģė³ø ģ“ėÆøģ§ģ classė” ģøģķģ§ ėŖ»ķėė” ģ ėģ ģģ ė„¼ ģģ±ķė ė°©ė²ģ“ FGSM (Fast Gradient Sign Method)ģ“ė¼ź³ ķ©ėė¤.
PGD FGSM ź³¼ģ ģ ģ¬ė¬ ė² ė°ė³µķ ź³µź²© ė°©ė²ģ PGD ėė I-FGSM (Iterative-FGSM)ģ“ė¼ź³ ķ©ėė¤. ģ“ė ėģ ź°ģ„ ėģ ķė„ ė” ģģėė classģø ģ ģ¬ģ©ķė©“ most-likely attack, PGD-MLģ“ė¼ź³ ķ©ėė¤. ėģ ź°ģ„ ė®ģ ķė„ ė” ģģėė classģø ģ ģ¬ģ©ķź³ lossź° ź°ģķė ė°©ķ„ģ¼ė” ģ ėģ ģģ ė„¼ ģģ±ķė ź²ģ least likely attack, PGD-LLģ“ė¼ź³ ķ©ėė¤.
CW attack ģ¬źø°ģ ė logit (pre-softmax ź°)ģ ģėÆøķė©° ė ė²ģ§øė” ėģ ź°ģ ź°ģ§ė logitģģ ģ ģ¼ ėģ ź°ģ ź°ģ§ė logit ź°ģ ėŗ ź°ģ lossė” ģ¬ģ©ķź³ ģ“ģ ėė¶ģ“ ģė³ø ģ“ėÆøģ§ģ ģ ėģ ģģ ģ ź±°ė¦¬ė lossė” ķØź» ģ¬ģ©ķ©ėė¤. ź·øėģ lossź° ź°ģķė ė°©ķ„ģ¼ė” ģ ėģ ģģ ė„¼ ģģ±ķ©ėė¤. ģ“ ė°©ė²ģ ź³µź²© ģ±ź³µė„ ģ ģ”°ģ ķė ģ²« ė²ģ§ø lossģ ģė³ø ģ“ėÆøģ§ģģ ģ°Øģ“ė„¼ ģ”°ģ ķė ė ė²ģ§ø lossģ ź°ģ¤ģ¹ė„¼ ģ ė¹ķź² ģ”°ģ ķ ģ ģė¤ė ģ„ģ ģ“ ģģµėė¤. ģ“ė¬ķ ź³µź²© ė°©ė²ģ CW attack (Carlini Wargner attack)ė¼ź³ ķė©° ģ¬ė¬ ė² ė°ė³µķė©° ģ ėģ ģģ ė„¼ ģ ė°ģ“ķøķźø° ėė¬øģ PGD-CWģ“ė¼ź³ ė ķ©ėė¤.
MI-FGSM FGSMģ ģµģ ķ ź³¼ģ ģģ ėŖØė©ķ ģ ģ¬ģ©ķģ¬ local optimaė” ģė “ķė ź²ģ ė°©ģ§ķź³ ģµģ ķė„¼ ė ģģ ģ ģ¼ė” ģ§ķķ ģ ģėė” ķė ė°©ė²ģ MI-FGSM (Momentum Iterative FGSM)ģ“ė¼ź³ ķ©ėė¤.
ģģ ė°©ė²ė¤ģ²ė¼ źø°ģ”“ ģ ėģ ź³µź²© ė°©ė²ė¤ģ softmax ķ¹ģ pre-softmaxė„¼ ģ¬ģ©ķģ¬ ģ ėģ ģģ ė„¼ ģģ±ķė¤. ķģ§ė§ ģ“ ė°©ė²ģ¼ė” ģģ±ķ ģ ėģ ģģ ė ė¤ķøģķ¬ź° ģė³ø classė” ģ ėė” ė¶ė„ķģ§ ėŖ»ķė ź±“ ė§ģ§ė§ ģė³ø classģ ė¹ģ·ķ classė” ė¶ė„ķź±°ė ź° layerģ featureģ ģė³ø ģ“ėÆøģ§ģ ź³ ģ ķ ģ ė³“ź° ėØģģė¤ė ė¬øģ ģ ģ“ ģģ“ģ ė³ø ė ¼ė¬øģģė featureė„¼ ģ“ģ©ķģ¬ ģ ėģ ģģ ė„¼ ģģ±ķė ė°©ė²ģ ģ ģķģµėė¤. ź·øė¦¬ź³ ģ ėģ ģģ ģ ėķ ģė”ģ“ ķź° ģ§ķģø NLORź³¼ OLNRģ ģ ģķģµėė¤.
Proposed evaluation metrics PGD-MLģ ź³µź²© ģ ģ ź°ģ„ ėģ ķė„ ė” ģģø”ėģė classė” ģøģėģ§ ģģģ¼ ķėÆė” ģė³ø ģ“ėÆøģ§ģ ė¹ģ·ķ classė” ģøģėėė” ģ ėģ ģģ ź° ģģ±ė ģ ģģµėė¤. ė°ė©“ PGD-LLģ ź³µź²© ģ ģ ź°ģ„ ė®ģ ķė„ ė” ģģø”ėģė classė” ģøģėģ“ģ¼ ķėÆė” ģė³ø ģ“ėÆøģ§ģ ģģ ķ ė¤ė„ø classė” ģøģėėė” ģģ±ėė¤ź³ ė³¼ ģ ģģµėė¤. ė¤ķøģķ¬ź° ģ ėģ ģģ ė„¼ ģė³ø classė” ģģø”ķģ§ ģģėģ§ ėķė“ė Fooling rateė§ģ¼ė” ģ“ė° ź³µź²© ė°©ė²ė¤ģ ģ ģ²“ģ ģø ģ±ė„ģ ė¹źµķźø° ģ“ė µģµėė¤. ė°ė¼ģ ė³ø ė ¼ė¬øģģė New Label Old Rank (NLOR)ź³¼ Old Label New Rank (OLNR)ė„¼ ģ ģķģµėė¤. NLORģ ź³µź²© ķģ ģ ģ¼ ėģ ķė„ ė” ģģø”ėė class (new label)ź° ź³µź²© ģ ģ ėŖ ė²ģ§øė” ėģ ķė„ ė” ģģø”ėģėģ§ė„¼ ėķė“ė ź²ģ“ź³ OLNRģ ź³µź²© ģ ģ ģ ģ¼ ėģ ķė„ ė” ģģø”ėė class(old label)ź° ź³µź²© ķģ ėŖ ė²ģ§øė” ėģ ķė„ ė” ģģø”ėėģ§ė„¼ ėķė ź²ģ ėė¤.
Proposed attack
Dataset : NIPS 2017 adversarial competitionģģ ģ¬ģ©ėģė ImageNet-compatible dataset 1000ģ„ ģ¬ģ©
Baselines : PGD-ML, PGD-CW, PGD-LL
Evaluation metric : Fooling Rate, NLOR, ONLR
ģ ėģ ģģ ģ ėķ ģė”ģ“ ķź° ģ§ķģø OLNR, NLORģ ķµķ“ źø°ģ”“ ģ ėģ ź³µź²©ģ ķź³ė„¼ ķģøķģģµėė¤.
ė¤ķøģķ¬ģ softamx ėė pre-softmaxė„¼ ģ¬ģ©ķė źø°ģ”“ ģ ėģ ź³µź²© ė°©ė²ė¤ė³“ė¤ ė³ø ė ¼ė¬øģģ ģ ģķ featureė„¼ ģ“ģ©ķė ź³µź²© ė°©ė²ģø FDAģ ź³µź²© ģ±ė„ģ“ ģ°ģķė¤ė ź²ģ ģ¤ķģ ķµķ“ ģ ģ¦ķģģµėė¤.
ģ ėģ ģģ ė„¼ ģģ±ķė ź³¼ģ ģ fatureė„¼ ģ“ģ©ķģ¬ ģ ėģ ź³µź²©ģ ģ±ė„ģ ķ„ģģķµėė¤.
ź¹ģ¤ģ§ (Kim Yoonji)
KAIST EE
yoonjikim@kaist.ac.kr
https://github.com/yoonjii
Korean name (English name): Affiliation / Contact information
Korean name (English name): Affiliation / Contact information
ė³ø ė ¼ė¬øģģė Cross entropy lossė„¼ ģ¬ģ©ķģ¬ ėØģķ ė¤ķøģķ¬ź° ģģø”ķė labelė§ ė°ź¾øė ė°©ģģ ź³µź²©ģ“ ģė featureė„¼ ė³ź²½ķģ¬ ź³µź²©ķė Feature Disruptive Attack (FDA)ė„¼ ģ ģķģµėė¤. źµ¬ģ²“ģ ģ¼ė”ė ķź· ė³“ė¤ ėģ ź°ģ ź°ģ§ė featureė ķģ¬ģ ģģø”ģ ģ§ģ§ķė featureė¼ź³ ķėØķģ¬ ķ“ė¹ featureģ ź±°ė¦¬ė ź°ģģķ¤ź³ ķź· ė³“ė¤ ė®ģ ź°ģ ź°ģ§ė featureė ķģ¬ģ ģģø”ģ ģ§ģ§ķģ§ ģė featureė¼ź³ ķėØķģ¬ ķ“ė¹ featureģ ź±°ė¦¬ė ģ¦ź°ģķ¤ė ė°©ķ„ģ¼ė” ģ ėģ ģģ ė„¼ ģģ±ķ©ėė¤. ģ¬źø°ģ ź±°ė¦¬ ķØģė L2-normģ ģ¬ģ©ķģź³ ķź· ģ ķ¹ģ layerģģ ė½ģ featureģ ķ¬źø°ź° h x w x cė¼ė©“ channelģ ėķ“ ķź· ģ ź³ģ°ķ ź²ģ¼ė” h x wģ ķ¬źø°ė„¼ ź°ģ§ė©° ģ“ė„¼ ė” ķģķ©ėė¤. ģµģ ķ ź³¼ģ ģ ģģ½ķė©“ ģėģ ź°ģ¼ė©° ģ¬źø°ģ Īµė ģė³ø ģ“ėÆøģ§ģ ģģ±ķė ģ ėģ ģģ ģ ģ°Øģ“ė„¼ ģ ķķė parameterģ ėė¤.
Table 2ė ė¤ģķ ė¤ķøģķ¬ģ ėķ ģ¬ė¬ ź³µź²© ė°©ė²ė¤ģ ģ±ė„ģ ė¹źµķ ķģ ėė¤. ģ ėģ ģ“ėÆøģ§ė„¼ ģ ė „ķģ ė ė¤ķøģķ¬ź° ģė³ø ģ“ėÆøģ§ģ classė” ģøģķģ§ ėŖ»ķ ė¹ģØģø Fooling rateė ė ¼ė¬øģģ ģ ģķ ė°©ė²ģ“ ėė¶ė¶ģ ź²½ģ°ģ ģ ģ¼ ėģ ź°ģ ź°ģ§ėė¤. ėķ ė³ø ė ¼ė¬øģģ ģ ģķ ģė”ģ“ ķź° ģ§ķģø NLORģ ėķ“ģė ėė¶ė¶ ėģ ź°ģ ź°ģ§ė©° OLNRģ ģ ė¶ ģ ģ¼ ėģ ź°ģ ź°ģ§ėė¤. ģ“ė„¼ ķµķ“ ė ¼ė¬øģģ ģ ģķ ė°©ė²ģ ģ¬ģ©ķė©“ ź³µź²© ģ ģ ģ ģ¼ ėģ ķė„ ė” ģģø”ėė classź° ź³µź²© ķģė ķė„ ź°ģ“ ė§ģ“ ė®ģģ§ź³ ź·øģ ėģģ ź³µź²© ķģ ģ ģ¼ ėģ ķė„ ė” ģģø”ėė classź° ź³µź²© ģ ģė ė§ģ“ ė®ģ ķė„ ė” ģģø”ėė classģģģ ģ ģ ģģµėė¤. ģ“ė„¼ ķµķ“ źø°ģ”“ ź³µź²© ė°©ė²ė¤ģ ė¬øģ ģ ģ¼ė” ģ źø°ėģė ģ ėģ ģģ ź° ė¹ģ·ķ classė” ģģø”ėź±°ė źø°ģ”“ classė” ģģø”ķė ķė„ ź°ģ“ ģ¬ģ ķ ėė¤ė ģ ģ ķ“ź²°ķģģ ķģøķ ģ ģģµėė¤.
ģ¼ģŖ½ė¶ķ° ģė³ø ģ“ėÆøģ§, PGDė” ģģ±ķ ģ ėģ ģģ , FDAė” ģģ±ķ ģ ėģ ģģ ė„¼ ķė ź·øė¦¼ģ¼ė” style transfer ķ ź²°ź³¼ģ ėė¤. PGDė” ģģ±ķ ģ ėģ ģģ ģ style transfer ź²°ź³¼ė ģė³ø ģ“ėÆøģ§ģ ķķė„¼ ģģė³¼ ģ ģģ§ė§ FDAė” ģģ±ķ ģ ėģ ģģ ģ style transfer ź²°ź³¼ė ģė³ø ģ“ėÆøģ§ģ ķķė„¼ ģģė³“źø° ģ“ė µģµėė¤. cross entropy lossė„¼ ģ¬ģ©ķģ¬ ė¤ķøģķ¬ź° ģģø”ķė labelė§ ė¬ė¼ģ§ź² ģ ėģ ģģ ė„¼ ģģ±ķźø° ėė¬øģ ģė³ø ģ“ėÆøģ§ģ ź³ ģ ķ ģ ė³“ź° ėØģģė PGDģ ė¬ė¦¬ FDAė feature ź°ģ ė³ź²½ķģ¬ ģė³ø ģ“ėÆøģ§ģ ź³ ģ ķ ģ ė³“ė„¼ ģ ź±°ėģė¤ė ź²ģ ķģøķ ģ ģģµėė¤.