NeSyXIL [Kor]
Stammer et al. / Right for the Right Concept - Revising Neuro-Symbolic Concepts by Interacting with their Explanations / CVPR 2021
English version of this article is available.
1. Problem definition
ė„ė¬ė ė¶ģ¼ģ ģ¤ėŖ ė°©ė²ģ ėė¶ė¶ ģė ģ ė „ ź³µź°ģ ėķ ėŖØėøģ ģģø”ģ ėķ ģ¤ģėė„¼ ģ¶ģ ķė ė°©ģģ ėė¤.
ģ“ė¬ķ "ģź°ģ " ģ¤ėŖ ģ ėŖØėøģ“ ģ“ė»ź² ź²°ģ ķź³ ģėģ§ģ ėķ ģėÆøė” ģ ģø ģ¤ėŖ ģ ķģ§ ģź³ ģģµėė¤.
CLEVER-Hansģ ź°ģ“ ėŖØėøģ“ ģėŖ»ė ź²°ģ ģ ė°°ģø ė, ģėÆøė” ģ ģø ģ¤ėŖ ģ ķµķ“ ėŖØėøģ ķėģ ź°ģ ķė ź²ģ“ ģ“ė µģµėė¤.
Grad-CAMź³¼ ź°ģ "ģź°ģ " ģ¤ėŖ ģ ķģ©ķ“ ķ¼ėė°±ģ ģ£¼ė ė°©ģģ“ ģėė¼ "ģėÆøė” ģ ģø" ķ¼ėė°±ģ ķµķ“ ėŖØėøģ ź°ģ ģ ķ ģ ģė ė°©ė²ė” ģ“ ķģķ©ėė¤.
CLEVER-Hans
https://simple.wikipedia.org/wiki/Clever_Hans
ML ėŖØėøė¤ģ ķ¹ģ ķģ¤ķ¬ė„¼ ķźø° ģķ“ ģėŖ»ė featureė„¼ ķģµķģ§ė§ ģ±ė„ģ ģ¢ģ ź²½ģ°ź° ģģµėė¤. ģ“ź°ģ ģź°ė¤ģ Clever-Hans Momentė¼ź³ ģ ė ¼ė¬øģģė ģ§ģ¹ķź³ ģģµėė¤.
2. Motivation
Related work
ģ¤ėŖ ź°ė„ķ ģøź³µģ§ė„ (Explainable AI, XAI)
ģ¼ė°ģ ģ¼ė” ģ¤ėŖ ź°ė„ķ ģøź³µģ§ė„ (XAI) ė°©ė²ė” ģ ėŖØėøģ ģ¤ėŖ ģ ģ¬ėģ“ ģ“ķ“ķ ģ ģė ė°©ģģ¼ė” ėķė“ģ“, (ėøėė°ģ¤ ķķ) ėŖØėøģ ź²°ģ ģ ėķ ģ“ģ ė„¼ ź²ģ¦ķė ė° ģ¬ģ©ė©ėė¤.
ė¤ģķ XAI ė°©ė²ė” ģ“ ģģ§ė§, ėė¶ė¶ ģ¤ėŖ ķė ė°©ģģ“ ģ ė „ ź³µź° ė ė²Øģģ ģ“ė£Øģ“ģ§ė ģ¤ėŖ ģ ģź°ķķė ķķė” ģ“ė£Øģ“ģ§ėė¤.
[52, 2]: ģģ ķė„¼ ķģ©ķģ¬ ģ ė „ ź³µź°ģ ėķ“ ģź°ģ ģ¼ė” ķķķ©ėė¤.
[28]: ėŖØėøģ ź²°ģ ģ ėķ ģ¤ėŖ ģ prototype ķķė” ķķķ©ėė¤.
ź·øė¬ė ģź°ģ ģ¼ė” ģ¤ėŖ ķė ė°©ė²ė¤ź³¼ė ė¤ė„ø ė°©ė²ģ¼ė” ģ¤ėŖ ģ ė§ė¤ģ“ė“ė ģ°źµ¬ė¤ė ģģ§ė§, ģ“ė¤ ģ°źµ¬ė ėŖØėøģ ź°ģ ģ ģķ ģėØģ¼ė”ģØ ģ¤ėŖ ģ ķģ©ķė ģ°źµ¬ė ģģģµėė¤.
ģ¤ėŖ ģ ķµķ ėķķ ķģµ (Explanatory interactive learning, XIL)
XIL = XAI + Active Learning
ķģµ ź³¼ģ ģģ ėŖØėøģ“ ź²°ģ ķ ģ¤ėŖ ė¤ź³¼ źµė„ķė©“ģ ģ¬ģ©ģģ XAIź° ķė „ķė ķķė” ė³¼ ģ ģģµėė¤.
ģ¬ģ©ģė XILģ ķµķ“ ėŖØėøģ“ ź²°ģ ķ ģ“ģ ė„¼ ė¬¼ģ“ė³¼ ģ ģź³ , ķģķ ź²½ģ° ėŖØėøģ ģģ ķ ģė ģź³ , ģ¤ėŖ ģ ėķ“ ź°ģ ė ķ¼ėė°±ģ ģ ź³µķ ģ ģģµėė¤.
ė“ė”-ģ¬ė³¼ė¦ ģķ¤ķ ģ² (Neuro-Symbolic architectures)
ė“ė”-ģ¬ė³¼ė¦ ė¶ģ¼ė źø°ķøģ (symbolic) ėŖØėøź³¼ ė¹źø°ķøģ (sub-symbolic) ėŖØėøģ ģ„ģ ģ ź²°ķ©ķģ¬ ź°ė³ ķģ ģģ¤ķ ģ ė¬øģ ė„¼ ķ“ź²°ķė ė°©ė²ģ¼ė” ģµź·¼ ėŖ ė ėģ ģ ģ ė ź“ģ¬ģ ė°ź³ ģė ė¶ģ¼ģ ėė¤.
ė“ė”-ģ¬ė³¼ė¦ ģķ¤ķ ģ²ė ķ¬ź² ė¤ģź³¼ ź°ģ ķ¹ģ§ģ ź°ź³ ģģµėė¤.
ė°ģ“ķ° ģ¤ģ¬ (data-driven)
ė¹źø°ķøģ ģø ķķ (sub-symbolic representation)
źø°ķøģ ģ¶ė” ģģ¤ķ (symbolic based reasoning system)
Motivating Example: Color-MNIST
ģ“ ģ°źµ¬ģģ ė¤ė£Øź³ ģė ķµģ¬ģ ģ ė¬ķźø° ģķ“, ģ ģė¤ģ ģ ģė ¤ģ§ Color-MNIST ė°ģ“ķ°ģ ģ ķµķ“ ģ¤ėŖ ķ©ėė¤. ColorMNISTė źø°ģ”“ MNIST ė°ģ“ķ°ģ ģ ģģģ“ ģ¶ź°ė ķ ģ“ ė°ģ“ķ°ģ ģ ėė¤. ģ“ ė°ģ“ķ°ģ ė“ ķģµ ģ ģģ, ź° ģ«ģė ķ¹ģ ģģģ¼ė” ģ¹ ķ“ģ ø ģė ė°ė©“ģ, ķ ģ¤ķø ģ ģģė ģģģ“ė¼ė ģģ±ģ ģģ“ź±°ė ė°ģ ė©ėė¤.
ColorMNIST ė°ģ“ķ°ģ ģ ėķ“, ź°ėØķ CNN ėŖØėøģ ķė Ø ģ ģģė 100% ģ ķėģ ėė¬ķ ģ ģģ§ė§ ķ ģ¤ķø ģøķøģģė 23%ģ ė¶ź³¼ķ©ėė¤. ģ“ė ėŖØėøģ“ ģ«ģ ģģ²“ė³“ė¤ ģ ķķ ģģø”ģ ģķ“ ģģģ ķ¬ź² ģ§ģ¤ķė ė²ģ ė°°ģ ģģ ģ ģ ģģµėė¤.
Figure 2ė 9ė” ģģø”ėė 0ģ ėķ Grad-CAM ź²°ź³¼ė„¼ ģź°ķķ ź·øė¦¼ģ ėė¤. ģ¦, ėŖØėøģ ģ 0ģ“ė¼ė ģ«ģė„¼ 9ė” ģģø”ķėź°ģ "ģź°ģ ģ¤ėŖ "ģ ė³“ģ¬ģ£¼ź³ ģģµėė¤. ģ“ ė, 0ģ“ė¼ė ķķė„¼ ėŖØėøģ“ ģ§ģ¤ķ“ģ ė³“ź³ ģė ź²ģ ė³¼ ģ ģģ§ė§, ģ“ė¤ ģėÆøė” ģ ģø ź·¼ź±°ģ ģķ“ 9ė” ģģø”ķėģ§ ģ ģ ģģµėė¤.
ė°ė¼ģ, ģź°ģ ģ¤ėŖ ģ ķµķ“ ėŖØėøģ“ ģ¬ė°ė„ø ė¬¼ģ²“ģ ģ“ģ ģ ė§ģ¶ź³ ģė¤ė ź²ģ ė¶ėŖ ķģ§ė§, ėŖØėøģ“ ģėŖ»ė ģ«ģė„¼ ģģø”ķė ģ“ģ ė źø°ė³ø ķģµ ė°ģ“ķ° ė¶ķ¬ģ ėķ ģ“ķ“ ģģ“ė ėŖ ķķģ§ ģģ ź²ģ ėė¤.
ģ¤ģķ ź²ģ ėŖØėøģ“ ķė¦¬ėė¼ė, ģ“ė¬ķ ģź°ģ ģø ģ¤ėŖ ė§ģ ė°ķģ¼ė” XILģ ģ¬ģ©ķ“ ėŖØėøģ ź²°ģ ģ ģģ ķė ź²ģ ź½¤ ģ¬ź°ķ ė¬øģ ė” ė³¼ ģ ģģµėė¤.
Idea
Color-MNIST ģģģģ ė³¼ ģ ģėÆģ“, ģ ģė¤ģ źø°ģ”“ģ Grad-CAMź³¼ ź°ģ ģź°ģ ģø ģģ¤ģ ģ¤ėŖ ė§ģ¼ė” ėŖØėøģ ź²°ģ ģ ķ“ģķź³ ė ėģź° ź°ģ ķė ź²ģ ķė¤ė¤ź³ ģź°ķģµėė¤.
ė°ė¼ģ, ģėÆøė” ģ (semantic) ģģ¤ģģ ėŖØėøģ ģģ ķ ģ ģė ė“ė”-ģ¬ė³¼ė¦ (Neuro-Symbolic) ė°©ė²ė” ģ ģ ģķģµėė¤.
ģ“ ė°©ė²ģ ķµķ“ ėŖØėøģź² "ź²°ģ ģ ė“ė¦“ ėė ģģģ ģ ė ė³“ź³ ź²°ģ ķģ§ ė§ė¼."ė¼ė ė±ģ ź°ģ ģ“ ź°ė„ķ“ģ§ėė¤.
3. Method
Neuro-Symbolic Architecture (Figure 3ģ ģėØ ė¶ė¶)
ķ¬ź² concept embedding moduleź³¼ reasoning module 2ź°ģ§ ėŖØėė” źµ¬ģ±ėģ“ ģģµėė¤.
concept moduleģ ź²½ģ°, ģ¬ėģ“ ģ“ķ“ķ ģ ģė źø°ķøģ ģø ķķģ¼ė” ė§¤ķķė ģķ ģ ķź³ ģģµėė¤.
ģ“ė ź² ė§¤ķė źø°ķøģ ģø ķķģ źø°ė°ķģ¬ ėŖØėøģ ģģø”ķź² ķė ź²ģ“ reasoning moduleģ ģķ ģ ėė¤.
Retrieving Neuro-Symbolic Explanations (Figure 3ģ ķģ ķģ“ķ)
concept embedding moduleź³¼ reasoning moduleģ“ ģ£¼ģ“ģ”ģ ė, ź°ź°ģ ė§ė ģ¤ėŖ ė¤ģ ģ¶ģ¶ķ ģ ģģµėė¤.
Figure 3ģģ, Semantic Explanierė„¼ ķµķ“ ėģØ ķģ ź°ģ¼ė” ķ“ģķ ģ ģģµėė¤.
Figure 3ģģ, Visual Explanierė„¼ ķµķ“ ėģØ ķģ ź°ģ¼ė” ķ“ģķ ģ ģģµėė¤.
Neuro-Symbolic Concepts
explanatory loss term
Reasoning Module
ģ“ėÆøģ§ź° concep embedding moduleģ ģ§ėė©“, ėģ¤ė ģ¶ė „ź°ģ ģģź° ģė ģ§ķ©ģ ėė¤.
ė°ė¼ģ ģ“ģ ė§ė ģ ė „ģ ė¤ė£Øźø° ģķ“, Set Transformerė„¼ ķģ©ķģ¬ ź²°ź³¼ ź°ģ ģģø”ķ©ėė¤.
ė°ėė”, reasoning moduleģ ėķ ģ¤ėŖ ģ ģ¶ģ¶ķźø° ģķ“ģė ģ£¼ģ“ģ§ symoblic representationģ ėķ“ Set Transformerģ ģ¤ėŖ ģ ė§ė¤ģ“ģ¼ ķ©ėė¤.
ģ“ė„¼ ģķ“ gradient-based Integrated Gradients exaplanation ė°©ė²ģ ģ¬ģ©ķ©ėė¤.
(Slot) Attention is All You Need (for object-based explanations)
(Gradient-based Integrated Gradients explanation, Set Transformer, Slot Attentionģ ėķ“ ģģøķź² ė¤ė£Øģ§ė ģģģµėė¤.)
4. Dataset & Experiment & Result
Dataset: CLEVER-Hans
Dataset
CLEVER-Hans3
ģėģ ź°ģ 3ź°ģ ķ“ėģ¤ ź·ģ¹ģ ķ¬ķØķź³ ģź³ , ź·ø ģ¤ 2ź° ķ“ėģ¤ ź·ģ¹ģ confounderė” ģģ©ķ©ėė¤.
class rule 1: large (gray) cube and large cylinder (training/validation setģģė ź“ķøģ ģģ±(gray)ģ ķ“ė¹ķė ģ“ėÆøģ§ź° ķ¬ķØėģ“ ģģ§ė§, test setģģė ź“ķøģ ģģ±ģ“ ģė ģ“ėÆøģ§ė ķ¬ķØķź² ė©ėė¤.)
class rule 2: small metal cube and small (metal) sphere (training/validation setģģė ź“ķøģ ģģ±(metal)ģ ķ“ė¹ķė ģ“ėÆøģ§ź° ķ¬ķØėģ“ ģģ§ė§, test setģģė ź“ķøģ ģģ±ģ“ ģė ģ“ėÆøģ§ė ķ¬ķØķź² ė©ėė¤.)
class rule 3: large blue sphere and small yellow sphere (training/validation/test set ėŖØė ėģ¼ķ©ėė¤.)
CLEVER-Hans7
CLEVER-Hans3ź³¼ ė¹ģ·ķź² 7ź°ģ ķ“ėģ¤ ź·ģ¹ģ ķ¬ķØķź³ ģź³ , ź·ø ģ¤ 4ź° ķ“ėģ¤ ź·ģ¹ģ confounderė” ģģ©ķ©ėė¤.
Experimental setting
Dataset
CLEVER-Hans3
CLEVER-Hans7
Baselines
CNN (Default): ResNet-based CNN ģ¬ģ©
CNN (XIL): ResNet-based CNNģ XIL ģ ģ©
ģ“ ė ģ¬ģ©ė CNNģ ģ¤ėŖ ė°©ė²ė” ģ (ė ¼ė¬øģģ ė§ķė ģź°ģ ģ¤ėŖ ģ ģģė”) Grad-CAMģ ģ¬ģ©ķģģµėė¤.
NeSy (Default): Neuro Symbolic Architecture ģ¬ģ©
NeSy (XIL): Neuro Symbolic Architectureģ XIL ģ ģ©
ģ“ ė ģ¬ģ©ė NeSyģ ģ¤ėŖ ė°©ė²ė” ģ ė ¼ė¬øģģ ģ ģķ ė°©ģģ“ė©°, ģ“ė ģź°ģ ź³¼ ģėÆøė” ģ ģ¤ėŖ ģ ė ė¤ ģ¬ģ©ķ©ėė¤.
Training setup
Default: Cross Entropy Lossė„¼ ģ¬ģ©ķ ģ¼ė°ģ ģø ģ“ėÆøģ§ ė¶ė„ ė¬øģ ė„¼ ķøė ģøķ
XIL: Explanatory Lossė„¼ ģ¶ź°ģ ģ¼ė” ģ¬ģ©ķģ¬ ėŖØėøģ ķģµģ ź°ģ ģ ķė ģøķ
Evaluation metric
Classification accuracy
Result
Table 2: CLEVER-Hans3 ė°ģ“ķ°ģ
ź³¼ CLEVER-Hans7 ė°ģ“ķ°ģ
ģģ ģ¤ķ ź²°ź³¼
ź“ģ°° 1: CNN ėŖØėøģ Clever-Hansģ ź°ģ ģź°ģ ź²Ŗź³ ģė ź²ģ ė³“ģ¬ģ¤ėė¤.
ź·¼ź±°: Table2ģģ CNN(Default)ģ validation ģ±ė„ģ ź±°ģ ģė²½ģ ź°ź¹ģ§ė§, ź·øģ ė¹ķ“ test ģ±ė„ģ“ ė®ģ
ź“ģ°° 2: ģź°ģ ģø ģ¤ėŖ ģ ķģ©ķė XILģ CLEVER-Hans ė°ģ“ķ°ģ ģ ėķ“ ģ¤ķØķ ėŖØģµģ ė³“ģ¬ģ¤ėė¤.
ź·¼ź±°: Table2ģģ CNN(XIL)ģ validation ģ±ė„ģ ź±°ģ ģė²½ģ ź°ź¹ģ§ė§, ź·øģ ė¹ķ“ test ģ±ė„ģ“ (XILģ ģ ģ©ķģģė) ģ¬ģ ķ ė®ģ
ź“ģ°° 3: Neuro-Symbolic ėŖØėøģ CNN ėŖØėøģ ė¹ķ“ test accuracyź° ėģµėė¤.
ź·¼ź±°: Table2ģģ NeSy(Default)ģ test ģ±ė„ģ“ CNN(Default)ģ test ģ±ė„ė³“ė¤ ź½¤ ėģ ź²ģ ķģøķ ģ ģģ
ź“ģ°° 4: XILė” ź°ģ ķźø° ģ“ģ ģ, Neuro-Symbolic ėŖØėø ģģ Clever-Hansģ ź°ģ ģź°ģ ź²Ŗź³ ģė ź²ģ ė³“ģ¬ģ¤ėė¤.
ź·¼ź±°: Table2ģģ NeSy(Default)ģ test ģ±ė„ģ“ ģė²½ģ ź°ź¹ģ“ validation ģ±ė„ģ ė§ģ“ ėŖ» ėÆøģ¹ź³ ģė ėŖØģµģ ķģøķ ģ ģģ
ź“ģ°° 5: Neuro-Symbolic ėŖØėøģ ķµķ“ ģėÆøė” ģ ģø ģ¤ėŖ ź¹ģ§ ķģ©ķė XILģ ź²½ģ° Clever-Hans ė°ģ“ķ°ģ ź³¼ ź°ģ ė¬øģ ė„¼ ė§ģ“ ķ“ź²°ķģģ ė³“ģ¬ģ¤ėė¤.
ź·¼ź±°: Table2ģģ NeSy(XIL)ģ test ģ±ė„ģ“ validation ģ±ė„ ź·¼ģ²ė” ź°ģ„ ź°ź¹ź² ģØ ź²ģ ķģøķ ģ ģģ
=> ģ ģė¤ģ ģ ģķ ė°©ė²ģ“ ķØź³¼ģ ģ
=> ė¤ė„ø ģėÆøė”, ģėÆøė” ģ ģø ģ¤ėŖ ģ“ CLEVER-Hansģ ź°ģ ģź°ģ ķØź³¼ģ ģ
Figure 5: CLEVER-Hans3ģģ ķģµė ėŖØėøė¤ģ ģė” ė¤ė„ø ģ ģ±ģ ź²°ź³¼
Figure 5ģģė ģė” ė¤ė„ø 2ź°ģ§ ėŖØėøģ“ ģ¼ė°ģ ģ¼ė” ķģµķ ź²½ģ° (Default), ģ¬ėģ“ ź°ģ ķ ź²½ģ° (XIL)ģ ėķ“ģ ģ“ė»ź² ķ“ė¹ ģ¤ėŖ ė¤ģ“ ė°ėź³ ģėģ§ ė³“ģ¬ģ£¼ź³ ģė ź·øė¦¼ģ ėė¤.
CNN(Default), CNN(XIL), NeSY(Default) ėŖØė ģ¬ė°ė„“ź² ģģø”ķģ§ ėŖ»ķ ėŖØģµģ ė³¼ ģ ģź³ , NeSY(XIL) ź²½ģ°ė§ ģ¬ė°ė„“ź² ģģø”ķ ėŖØģµģ ė³¼ ģ ģģµėė¤.
CNN ėŖØėøģ ź²½ģ°, ģ“ė¤ ģ“ģ ė” ģøķ“ ėŖØėøģ“ ź²°ģ ķėģ§ ģėÆøė” ģ ģ¼ė” ķ“ģķ ģ ģģµėė¤.
NeSY ėŖØėøģ ź²½ģ°, ģėÆøė” ģ ģ¼ė” ėŖØėøģ“ ģ“ė¤ ģģø”ģ ķź³ ģėģ§ ķģøķ ģ ģģµėė¤.
5. Conclusion
ģ ģė¤ģ ģėÆøė” ģ (semantic) ģģ¤ģģ ėŖØėøģ ģģ ķ ģ ģź² ķė, ė“ė”-ģ¬ė³¼ė¦ (Neuro-Symbolic) ģ„ė©“ ķķ (scene representaiton) ź³µź°ģ ź°ģ ķė ė°©ė²ė” ģ ģ ģķ©ėė¤.
ėŖØėøģ ķØź³¼ė„¼ ģ ģ¦ķźø° ģķ“, ģė”ģ“ źµėė ė°ģ“ķ°ģ ģø CLEVER-Hans3ź³¼ CLEVER-Hans7ģ źµ¬ģ¶ķģµėė¤.
"ģź°ģ " ģ¤ėŖ ė§ģ¼ė” ģė³ķ ģ ģė źµėģģøģ "ģėÆøė” ģ " ģ¤ėŖ ģ ķµķ“ ģė³ķ ģ ģģģ ė³“ģ¬ģ£¼ģģµėė¤.
ź²°ź³¼ģ ģ¼ė”, ģ“ ģėÆøė” ģ ģģ¤ģ ėķ ķ¼ėė°±ģ ķµķ“ ķ“ė¹ ģėÆøģ ģ“ģ ģ ė§ģ¶ģ“ ėŖØėøģ ģģ ķ ģ ģź² ėģģµėė¤.
Take home message (ģ¤ėģ źµķ)
ģ“ ė ¼ė¬øģ Color-MNISTė¼ė motivated exampleģ ź±øģ³, ėŖØėøģ ź°ģ ķ ė ģ źø°ķøģ ģø ķķģ ģ“ģ©ķė ź²ģ“ ģ¤ģķģ§ ė³“ģ¬ģ¤ ė ¼ė¬øģ ėė¤.
ģ²ģģ¼ė” XILģ Neural Symbolic Architectureė„¼ ģ ģķģ¬, Grad-CAMź°ģ ģź°ģ ģ¤ėŖ ė¤ė³“ė¤ė ķØź³¼ģ ģ¼ė” ėŖØėøģ ź°ģ ģ“ ź°ė„ķØģ ģ¤ķ ź²°ź³¼ė„¼ ķµķ“ ė³“ģ¬ģ£¼ģģµėė¤.
ģ“ģ²ė¼ ė„ė¬ėģģ ė¹źø°ķøģ ģø ķķėæė§ ģėė¼ źø°ķøģ ģø ķķģ ģ ķģ©ķ ģ ģė¤ė©“, ģ¬ėģ“ ģ§ź°ķź³ ģøģ§ķė ė„ė „ģ ķģ©ķėė° ķ° ėģģ“ ė ģ ģģ ź² ź°ģµėė¤.
Author / Reviewer information
Author
ė°°ģ±ģ
KAIST AI
contact: seongsu@kaist.ac.kr
Reviewer
Korean name (English name): Affiliation / Contact information
Korean name (English name): Affiliation / Contact information
...
Reference & Additional materials
Last updated