NeSyXIL [Kor]

Stammer et al. / Right for the Right Concept - Revising Neuro-Symbolic Concepts by Interacting with their Explanations / CVPR 2021

English version of this article is available.

1. Problem definition

  • ė”„ėŸ¬ė‹ ė¶„ģ•¼ģ˜ ģ„¤ėŖ… ė°©ė²•ģ€ ėŒ€ė¶€ė¶„ ģ›ėž˜ ģž…ė „ ź³µź°„ģ— ėŒ€ķ•œ ėŖØėøģ˜ ģ˜ˆģø”ģ— ėŒ€ķ•œ ģ¤‘ģš”ė„ė„¼ ģ¶”ģ •ķ•˜ėŠ” ė°©ģ‹ģž…ė‹ˆė‹¤.

  • ģ“ėŸ¬ķ•œ "ģ‹œź°ģ " ģ„¤ėŖ…ģ€ ėŖØėøģ“ ģ–“ė–»ź²Œ ź²°ģ •ķ•˜ź³  ģžˆėŠ”ģ§€ģ— ėŒ€ķ•œ ģ˜ėÆøė” ģ ģø ģ„¤ėŖ…ģ„ ķ•˜ģ§€ ģ•Šź³  ģžˆģŠµė‹ˆė‹¤.

  • CLEVER-Hansģ™€ ź°™ģ“ ėŖØėøģ“ ģž˜ėŖ»ėœ ź²°ģ •ģ„ ė°°ģšø ė•Œ, ģ˜ėÆøė” ģ ģø ģ„¤ėŖ…ģ„ ķ†µķ•“ ėŖØėøģ˜ ķ–‰ė™ģ— ź°œģž…ķ•˜ėŠ” ź²ƒģ“ ģ–“ė µģŠµė‹ˆė‹¤.

  • Grad-CAMź³¼ ź°™ģ€ "ģ‹œź°ģ " ģ„¤ėŖ…ģ„ ķ™œģš©ķ•“ ķ”¼ė“œė°±ģ„ ģ£¼ėŠ” ė°©ģ‹ģ“ ģ•„ė‹ˆė¼ "ģ˜ėÆøė” ģ ģø" ķ”¼ė“œė°±ģ„ ķ†µķ•“ ėŖØėøģ— ź°œģž…ģ„ ķ•  ģˆ˜ ģžˆėŠ” ė°©ė²•ė” ģ“ ķ•„ģš”ķ•©ė‹ˆė‹¤.

CLEVER-Hans

  • https://simple.wikipedia.org/wiki/Clever_Hans

  • ML ėŖØėøė“¤ģ€ ķŠ¹ģ • ķƒœģŠ¤ķ¬ė„¼ ķ’€źø° ģœ„ķ•“ ģž˜ėŖ»ėœ featureė„¼ ķ•™ģŠµķ•˜ģ§€ė§Œ ģ„±ėŠ„ģ€ ģ¢‹ģ€ ź²½ģš°ź°€ ģžˆģŠµė‹ˆė‹¤. ģ“ź°™ģ€ ģˆœź°„ė“¤ģ„ Clever-Hans Momentė¼ź³  ģœ„ ė…¼ė¬øģ—ģ„œėŠ” ģ§€ģ¹­ķ•˜ź³  ģžˆģŠµė‹ˆė‹¤.

2. Motivation

  • ģ„¤ėŖ… ź°€ėŠ„ķ•œ ģøź³µģ§€ėŠ„ (Explainable AI, XAI)

    • ģ¼ė°˜ģ ģœ¼ė”œ ģ„¤ėŖ… ź°€ėŠ„ķ•œ ģøź³µģ§€ėŠ„ (XAI) ė°©ė²•ė” ģ€ ėŖØėøģ˜ ģ„¤ėŖ…ģ„ ģ‚¬ėžŒģ“ ģ“ķ•“ķ•  ģˆ˜ ģžˆėŠ” ė°©ģ‹ģœ¼ė”œ ė‚˜ķƒ€ė‚“ģ–“, (ėø”ėž™ė°•ģŠ¤ ķ˜•ķƒœ) ėŖØėøģ˜ ź²°ģ •ģ— ėŒ€ķ•œ ģ“ģœ ė„¼ ź²€ģ¦ķ•˜ėŠ” ė° ģ‚¬ģš©ė©ė‹ˆė‹¤.

    • ė‹¤ģ–‘ķ•œ XAI ė°©ė²•ė” ģ“ ģžˆģ§€ė§Œ, ėŒ€ė¶€ė¶„ ģ„¤ėŖ…ķ•˜ėŠ” ė°©ģ‹ģ“ ģž…ė „ ź³µź°„ ė ˆė²Øģ—ģ„œ ģ“ė£Øģ–“ģ§€ėŠ” ģ„¤ėŖ…ģ„ ģ‹œź°ķ™”ķ•˜ėŠ” ķ˜•ķƒœė”œ ģ“ė£Øģ–“ģ§‘ė‹ˆė‹¤.

      • [52, 2]: ģ—­ģ „ķŒŒė„¼ ķ™œģš©ķ•˜ģ—¬ ģž…ė „ ź³µź°„ģ— ėŒ€ķ•“ ģ‹œź°ģ ģœ¼ė”œ ķ‘œķ˜„ķ•©ė‹ˆė‹¤.

      • [28]: ėŖØėøģ˜ ź²°ģ •ģ— ėŒ€ķ•œ ģ„¤ėŖ…ģ„ prototype ķ˜•ķƒœė”œ ķ‘œķ˜„ķ•©ė‹ˆė‹¤.

    • ź·øėŸ¬ė‚˜ ģ‹œź°ģ ģœ¼ė”œ ģ„¤ėŖ…ķ•˜ėŠ” ė°©ė²•ė“¤ź³¼ėŠ” ė‹¤ė„ø ė°©ė²•ģœ¼ė”œ ģ„¤ėŖ…ģ„ ė§Œė“¤ģ–“ė‚“ėŠ” ģ—°źµ¬ė“¤ė„ ģžˆģ§€ė§Œ, ģ–“ė–¤ ģ—°źµ¬ė„ ėŖØėøģ˜ ź°œģž…ģ„ ģœ„ķ•œ ģˆ˜ė‹Øģœ¼ė”œģØ ģ„¤ėŖ…ģ„ ķ™œģš©ķ•˜ėŠ” ģ—°źµ¬ėŠ” ģ—†ģ—ˆģŠµė‹ˆė‹¤.

  • ģ„¤ėŖ…ģ„ ķ†µķ•œ ėŒ€ķ™”ķ˜• ķ•™ģŠµ (Explanatory interactive learning, XIL)

    • XIL = XAI + Active Learning

    • ķ•™ģŠµ ź³¼ģ •ģ—ģ„œ ėŖØėøģ“ ź²°ģ •ķ•œ ģ„¤ėŖ…ė“¤ź³¼ źµė„˜ķ•˜ė©“ģ„œ ģ‚¬ģš©ģžģ™€ XAIź°€ ķ˜‘ė „ķ•˜ėŠ” ķ˜•ķƒœė”œ ė³¼ ģˆ˜ ģžˆģŠµė‹ˆė‹¤.

    • ģ‚¬ģš©ģžėŠ” XILģ„ ķ†µķ•“ ėŖØėøģ“ ź²°ģ •ķ•œ ģ“ģœ ė„¼ ė¬¼ģ–“ė³¼ ģˆ˜ ģžˆź³ , ķ•„ģš”ķ•œ ź²½ģš° ėŖØėøģ„ ģˆ˜ģ •ķ•  ģˆ˜ė„ ģžˆź³ , ģ„¤ėŖ…ģ— ėŒ€ķ•“ ź°œģ„ ėœ ķ”¼ė“œė°±ģ„ ģ œź³µķ•  ģˆ˜ ģžˆģŠµė‹ˆė‹¤.

  • ė‰“ė”œ-ģ‹¬ė³¼ė¦­ ģ•„ķ‚¤ķ…ģ²˜ (Neuro-Symbolic architectures)

    • ė‰“ė”œ-ģ‹¬ė³¼ė¦­ ė¶„ģ•¼ėŠ” źø°ķ˜øģ  (symbolic) ėŖØėøź³¼ ė¹„źø°ķ˜øģ  (sub-symbolic) ėŖØėøģ˜ ģž„ģ ģ„ ź²°ķ•©ķ•˜ģ—¬ ź°œė³„ ķ•˜ģœ„ ģ‹œģŠ¤ķ…œģ˜ ė¬øģ œė„¼ ķ•“ź²°ķ•˜ėŠ” ė°©ė²•ģœ¼ė”œ ģµœź·¼ ėŖ‡ ė…„ ė™ģ•ˆ ģ ģ  ė” ź“€ģ‹¬ģ„ ė°›ź³  ģžˆėŠ” ė¶„ģ•¼ģž…ė‹ˆė‹¤.

    • ė‰“ė”œ-ģ‹¬ė³¼ė¦­ ģ•„ķ‚¤ķ…ģ²˜ėŠ” ķ¬ź²Œ ė‹¤ģŒź³¼ ź°™ģ€ ķŠ¹ģ§•ģ„ ź°–ź³  ģžˆģŠµė‹ˆė‹¤.

      • ė°ģ“ķ„° ģ¤‘ģ‹¬ (data-driven)

      • ė¹„źø°ķ˜øģ ģø ķ‘œķ˜„ (sub-symbolic representation)

      • źø°ķ˜øģ  ģ¶”ė”  ģ‹œģŠ¤ķ…œ (symbolic based reasoning system)

Motivating Example: Color-MNIST

  • ģ“ ģ—°źµ¬ģ—ģ„œ ė‹¤ė£Øź³  ģžˆėŠ” ķ•µģ‹¬ģ„ ģ „ė‹¬ķ•˜źø° ģœ„ķ•“, ģ €ģžė“¤ģ€ ģž˜ ģ•Œė ¤ģ§„ Color-MNIST ė°ģ“ķ„°ģ…‹ģ„ ķ†µķ•“ ģ„¤ėŖ…ķ•©ė‹ˆė‹¤. ColorMNISTėŠ” źø°ģ”“ MNIST ė°ģ“ķ„°ģ…‹ģ— ģƒ‰ģƒģ“ ģ¶”ź°€ėœ ķ† ģ“ ė°ģ“ķ„°ģ…‹ģž…ė‹ˆė‹¤. ģ“ ė°ģ“ķ„°ģ…‹ ė‚“ ķ•™ģŠµ ģ…‹ģ—ģ„œ, ź° ģˆ«ģžėŠ” ķŠ¹ģ • ģƒ‰ģƒģœ¼ė”œ ģ¹ ķ•“ģ ø ģžˆėŠ” ė°˜ė©“ģ—, ķ…ŒģŠ¤ķŠø ģ…‹ģ—ģ„œėŠ” ģƒ‰ģƒģ“ė¼ėŠ” ģ†ģ„±ģ€ ģ„žģ“ź±°ė‚˜ ė°˜ģ „ė©ė‹ˆė‹¤.

  • ColorMNIST ė°ģ“ķ„°ģ…‹ģ— ėŒ€ķ•“, ź°„ė‹Øķ•œ CNN ėŖØėøģ€ ķ›ˆė Ø ģ…‹ģ—ģ„œėŠ” 100% ģ •ķ™•ė„ģ— ė„ė‹¬ķ•  ģˆ˜ ģžˆģ§€ė§Œ ķ…ŒģŠ¤ķŠø ģ„øķŠøģ—ģ„œėŠ” 23%ģ— ė¶ˆź³¼ķ•©ė‹ˆė‹¤. ģ“ėŠ” ėŖØėøģ“ ģˆ«ģž ģžģ²“ė³“ė‹¤ ģ •ķ™•ķ•œ ģ˜ˆģø”ģ„ ģœ„ķ•“ ģƒ‰ģƒģ— ķ¬ź²Œ ģ§‘ģ¤‘ķ•˜ėŠ” ė²•ģ„ ė°°ģ› ģŒģ„ ģ•Œ ģˆ˜ ģžˆģŠµė‹ˆė‹¤.

  • Figure 2ėŠ” 9ė”œ ģ˜ˆģø”ė˜ėŠ” 0ģ— ėŒ€ķ•œ Grad-CAM ź²°ź³¼ė„¼ ģ‹œź°ķ™”ķ•œ ź·øė¦¼ģž…ė‹ˆė‹¤. ģ¦‰, ėŖØėøģ€ ģ™œ 0ģ“ė¼ėŠ” ģˆ«ģžė„¼ 9ė”œ ģ˜ˆģø”ķ–ˆėŠ”ź°€ģ— "ģ‹œź°ģ  ģ„¤ėŖ…"ģ„ ė³“ģ—¬ģ£¼ź³  ģžˆģŠµė‹ˆė‹¤. ģ“ ė•Œ, 0ģ“ė¼ėŠ” ķ˜•ķƒœė„¼ ėŖØėøģ“ ģ§‘ģ¤‘ķ•“ģ„œ ė³“ź³  ģžˆėŠ” ź²ƒģ„ ė³¼ ģˆ˜ ģžˆģ§€ė§Œ, ģ–“ė–¤ ģ˜ėÆøė” ģ ģø ź·¼ź±°ģ— ģ˜ķ•“ 9ė”œ ģ˜ˆģø”ķ–ˆėŠ”ģ§€ ģ•Œ ģˆ˜ ģ—†ģŠµė‹ˆė‹¤.

  • ė”°ė¼ģ„œ, ģ‹œź°ģ  ģ„¤ėŖ…ģ„ ķ†µķ•“ ėŖØėøģ“ ģ˜¬ė°”ė„ø ė¬¼ģ²“ģ— ģ“ˆģ ģ„ ė§žģ¶”ź³  ģžˆė‹¤ėŠ” ź²ƒģ€ ė¶„ėŖ…ķ•˜ģ§€ė§Œ, ėŖØėøģ“ ģž˜ėŖ»ėœ ģˆ«ģžė„¼ ģ˜ˆģø”ķ•˜ėŠ” ģ“ģœ ėŠ” źø°ė³ø ķ•™ģŠµ ė°ģ“ķ„° ė¶„ķ¬ģ— ėŒ€ķ•œ ģ“ķ•“ ģ—†ģ“ėŠ” ėŖ…ķ™•ķ•˜ģ§€ ģ•Šģ„ ź²ƒģž…ė‹ˆė‹¤.

  • ģ¤‘ģš”ķ•œ ź²ƒģ€ ėŖØėøģ“ ķ‹€ė¦¬ė”ė¼ė„, ģ“ėŸ¬ķ•œ ģ‹œź°ģ ģø ģ„¤ėŖ…ė§Œģ„ ė°”ķƒ•ģœ¼ė”œ XILģ„ ģ‚¬ģš©ķ•“ ėŖØėøģ˜ ź²°ģ •ģ„ ģˆ˜ģ •ķ•˜ėŠ” ź²ƒģ€ ź½¤ ģ‹¬ź°ķ•œ ė¬øģ œė”œ ė³¼ ģˆ˜ ģžˆģŠµė‹ˆė‹¤.

Idea

  • Color-MNIST ģ˜ˆģ‹œģ—ģ„œ ė³¼ ģˆ˜ ģžˆė“Æģ“, ģ €ģžė“¤ģ€ źø°ģ”“ģ˜ Grad-CAMź³¼ ź°™ģ€ ģ‹œź°ģ ģø ģˆ˜ģ¤€ģ˜ ģ„¤ėŖ…ė§Œģœ¼ė”œ ėŖØėøģ˜ ź²°ģ •ģ„ ķ•“ģ„ķ•˜ź³  ė” ė‚˜ģ•„ź°€ ź°œģž…ķ•˜ėŠ” ź²ƒģ€ ķž˜ė“¤ė‹¤ź³  ģƒź°ķ–ˆģŠµė‹ˆė‹¤.

  • ė”°ė¼ģ„œ, ģ˜ėÆøė” ģ  (semantic) ģˆ˜ģ¤€ģ—ģ„œ ėŖØėøģ„ ģˆ˜ģ •ķ•  ģˆ˜ ģžˆėŠ” ė‰“ė”œ-ģ‹¬ė³¼ė¦­ (Neuro-Symbolic) ė°©ė²•ė” ģ„ ģ œģ•ˆķ–ˆģŠµė‹ˆė‹¤.

  • ģ“ ė°©ė²•ģ„ ķ†µķ•“ ėŖØėøģ—ź²Œ "ź²°ģ •ģ„ ė‚“ė¦“ ė•ŒėŠ” ģƒ‰ģƒģ„ ģ ˆėŒ€ ė³“ź³  ź²°ģ •ķ•˜ģ§€ ė§ė¼."ė¼ėŠ” ė“±ģ˜ ź°œģž…ģ“ ź°€ėŠ„ķ•“ģ§‘ė‹ˆė‹¤.

3. Method

  • Neuro-Symbolic Architecture (Figure 3ģ˜ ģƒė‹Ø ė¶€ė¶„)

    • ķ¬ź²Œ concept embedding moduleź³¼ reasoning module 2ź°€ģ§€ ėŖØė“ˆė”œ źµ¬ģ„±ė˜ģ–“ ģžˆģŠµė‹ˆė‹¤.

    • concept moduleģ˜ ź²½ģš°, ģ‚¬ėžŒģ“ ģ“ķ•“ķ•  ģˆ˜ ģžˆėŠ” źø°ķ˜øģ ģø ķ‘œķ˜„ģœ¼ė”œ ė§¤ķ•‘ķ•˜ėŠ” ģ—­ķ• ģ„ ķ•˜ź³  ģžˆģŠµė‹ˆė‹¤.

    • ģ“ė ‡ź²Œ ė§¤ķ•‘ėœ źø°ķ˜øģ ģø ķ‘œķ˜„ģ— źø°ė°˜ķ•˜ģ—¬ ėŖØėøģ„ ģ˜ˆģø”ķ•˜ź²Œ ķ•˜ėŠ” ź²ƒģ“ reasoning moduleģ˜ ģ—­ķ• ģž…ė‹ˆė‹¤.

  • Retrieving Neuro-Symbolic Explanations (Figure 3ģ˜ ķšŒģƒ‰ ķ™”ģ‚“ķ‘œ)

    • concept embedding moduleź³¼ reasoning moduleģ“ ģ£¼ģ–“ģ”Œģ„ ė•Œ, ź°ź°ģ— ė§žėŠ” ģ„¤ėŖ…ė“¤ģ„ ģ¶”ģ¶œķ•  ģˆ˜ ģžˆģŠµė‹ˆė‹¤.

      • Figure 3ģ—ģ„œ, Semantic Explanierė„¼ ķ†µķ•“ ė‚˜ģ˜Ø ķšŒģƒ‰ ź°’ģœ¼ė”œ ķ•“ģ„ķ•  ģˆ˜ ģžˆģŠµė‹ˆė‹¤.

      • Figure 3ģ—ģ„œ, Visual Explanierė„¼ ķ†µķ•“ ė‚˜ģ˜Ø ķšŒģƒ‰ ź°’ģœ¼ė”œ ķ•“ģ„ķ•  ģˆ˜ ģžˆģŠµė‹ˆė‹¤.

  • Neuro-Symbolic Concepts

    • explanatory loss term

  • Reasoning Module

    • ģ“ėÆøģ§€ź°€ concep embedding moduleģ„ ģ§€ė‚˜ė©“, ė‚˜ģ˜¤ėŠ” ģ¶œė „ź°’ģ€ ģˆœģ„œź°€ ģ—†ėŠ” ģ§‘ķ•©ģž…ė‹ˆė‹¤.

    • ė”°ė¼ģ„œ ģ“ģ— ė§žėŠ” ģž…ė „ģ„ ė‹¤ė£Øźø° ģœ„ķ•“, Set Transformerė„¼ ķ™œģš©ķ•˜ģ—¬ ź²°ź³¼ ź°’ģ„ ģ˜ˆģø”ķ•©ė‹ˆė‹¤.

    • ė°˜ėŒ€ė”œ, reasoning moduleģ— ėŒ€ķ•œ ģ„¤ėŖ…ģ„ ģ¶”ģ¶œķ•˜źø° ģœ„ķ•“ģ„œėŠ” ģ£¼ģ–“ģ§„ symoblic representationģ— ėŒ€ķ•“ Set Transformerģ˜ ģ„¤ėŖ…ģ„ ė§Œė“¤ģ–“ģ•¼ ķ•©ė‹ˆė‹¤.

    • ģ“ė„¼ ģœ„ķ•“ gradient-based Integrated Gradients exaplanation ė°©ė²•ģ„ ģ‚¬ģš©ķ•©ė‹ˆė‹¤.

  • (Slot) Attention is All You Need (for object-based explanations)

(Gradient-based Integrated Gradients explanation, Set Transformer, Slot Attentionģ— ėŒ€ķ•“ ģžģ„øķ•˜ź²Œ ė‹¤ė£Øģ§€ėŠ” ģ•Šģ•˜ģŠµė‹ˆė‹¤.)

4. Dataset & Experiment & Result

Dataset: CLEVER-Hans

  • Dataset

    • CLEVER-Hans3

      • ģ•„ėž˜ģ™€ ź°™ģ€ 3ź°œģ˜ ķ“ėž˜ģŠ¤ ź·œģ¹™ģ„ ķ¬ķ•Øķ•˜ź³  ģžˆź³ , ź·ø ģ¤‘ 2ź°œ ķ“ėž˜ģŠ¤ ź·œģ¹™ģ€ confounderė”œ ģž‘ģš©ķ•©ė‹ˆė‹¤.

      • class rule 1: large (gray) cube and large cylinder (training/validation setģ—ģ„œėŠ” ź“„ķ˜øģ˜ ģ†ģ„±(gray)ģ— ķ•“ė‹¹ķ•˜ėŠ” ģ“ėÆøģ§€ź°€ ķ¬ķ•Øė˜ģ–“ ģžˆģ§€ė§Œ, test setģ—ģ„œėŠ” ź“„ķ˜øģ˜ ģ†ģ„±ģ“ ģ•„ė‹Œ ģ“ėÆøģ§€ė„ ķ¬ķ•Øķ•˜ź²Œ ė©ė‹ˆė‹¤.)

      • class rule 2: small metal cube and small (metal) sphere (training/validation setģ—ģ„œėŠ” ź“„ķ˜øģ˜ ģ†ģ„±(metal)ģ— ķ•“ė‹¹ķ•˜ėŠ” ģ“ėÆøģ§€ź°€ ķ¬ķ•Øė˜ģ–“ ģžˆģ§€ė§Œ, test setģ—ģ„œėŠ” ź“„ķ˜øģ˜ ģ†ģ„±ģ“ ģ•„ė‹Œ ģ“ėÆøģ§€ė„ ķ¬ķ•Øķ•˜ź²Œ ė©ė‹ˆė‹¤.)

      • class rule 3: large blue sphere and small yellow sphere (training/validation/test set ėŖØė‘ ė™ģ¼ķ•©ė‹ˆė‹¤.)

    • CLEVER-Hans7

      • CLEVER-Hans3ź³¼ ė¹„ģŠ·ķ•˜ź²Œ 7ź°œģ˜ ķ“ėž˜ģŠ¤ ź·œģ¹™ģ„ ķ¬ķ•Øķ•˜ź³  ģžˆź³ , ź·ø ģ¤‘ 4ź°œ ķ“ėž˜ģŠ¤ ź·œģ¹™ģ€ confounderė”œ ģž‘ģš©ķ•©ė‹ˆė‹¤.

Experimental setting

  • Dataset

    • CLEVER-Hans3

    • CLEVER-Hans7

  • Baselines

    • CNN (Default): ResNet-based CNN ģ‚¬ģš©

    • CNN (XIL): ResNet-based CNNģ— XIL ģ ģš©

      • ģ“ ė•Œ ģ‚¬ģš©ėœ CNNģ˜ ģ„¤ėŖ…ė°©ė²•ė” ģ€ (ė…¼ė¬øģ—ģ„œ ė§ķ•˜ėŠ” ģ‹œź°ģ  ģ„¤ėŖ…ģ˜ ģ˜ˆģ‹œė”œ) Grad-CAMģ„ ģ‚¬ģš©ķ•˜ģ˜€ģŠµė‹ˆė‹¤.

    • NeSy (Default): Neuro Symbolic Architecture ģ‚¬ģš©

    • NeSy (XIL): Neuro Symbolic Architectureģ— XIL ģ ģš©

      • ģ“ ė•Œ ģ‚¬ģš©ėœ NeSyģ˜ ģ„¤ėŖ…ė°©ė²•ė” ģ€ ė…¼ė¬øģ—ģ„œ ģ œģ•ˆķ•œ ė°©ģ‹ģ“ė©°, ģ“ėŠ” ģ‹œź°ģ ź³¼ ģ˜ėÆøė” ģ  ģ„¤ėŖ…ģ„ ė‘˜ ė‹¤ ģ‚¬ģš©ķ•©ė‹ˆė‹¤.

  • Training setup

    • Default: Cross Entropy Lossė„¼ ģ‚¬ģš©ķ•œ ģ¼ė°˜ģ ģø ģ“ėÆøģ§€ ė¶„ė„˜ ė¬øģ œė„¼ ķ‘øėŠ” ģ„øķŒ…

    • XIL: Explanatory Lossė„¼ ģ¶”ź°€ģ ģœ¼ė”œ ģ‚¬ģš©ķ•˜ģ—¬ ėŖØėøģ˜ ķ•™ģŠµģ— ź°œģž…ģ„ ķ•˜ėŠ” ģ„øķŒ…

  • Evaluation metric

    • Classification accuracy

Result

Table 2: CLEVER-Hans3 ė°ģ“ķ„°ģ…‹ź³¼ CLEVER-Hans7 ė°ģ“ķ„°ģ…‹ģ—ģ„œ ģ‹¤ķ—˜ ź²°ź³¼

  • ź“€ģ°° 1: CNN ėŖØėøģ€ Clever-Hansģ™€ ź°™ģ€ ģˆœź°„ģ„ ź²Ŗź³  ģžˆėŠ” ź²ƒģ„ ė³“ģ—¬ģ¤ė‹ˆė‹¤.

    • ź·¼ź±°: Table2ģ—ģ„œ CNN(Default)ģ˜ validation ģ„±ėŠ„ģ€ ź±°ģ˜ ģ™„ė²½ģ— ź°€ź¹ģ§€ė§Œ, ź·øģ— ė¹„ķ•“ test ģ„±ėŠ„ģ“ ė‚®ģŒ

  • ź“€ģ°° 2: ģ‹œź°ģ ģø ģ„¤ėŖ…ģ„ ķ™œģš©ķ•˜ėŠ” XILģ€ CLEVER-Hans ė°ģ“ķ„°ģ…‹ģ— ėŒ€ķ•“ ģ‹¤ķŒØķ•œ ėŖØģŠµģ„ ė³“ģ—¬ģ¤ė‹ˆė‹¤.

    • ź·¼ź±°: Table2ģ—ģ„œ CNN(XIL)ģ˜ validation ģ„±ėŠ„ģ€ ź±°ģ˜ ģ™„ė²½ģ— ź°€ź¹ģ§€ė§Œ, ź·øģ— ė¹„ķ•“ test ģ„±ėŠ„ģ“ (XILģ„ ģ ģš©ķ–ˆģŒģ—ė„) ģ—¬ģ „ķžˆ ė‚®ģŒ

  • ź“€ģ°° 3: Neuro-Symbolic ėŖØėøģ€ CNN ėŖØėøģ— ė¹„ķ•“ test accuracyź°€ ė†’ģŠµė‹ˆė‹¤.

    • ź·¼ź±°: Table2ģ—ģ„œ NeSy(Default)ģ˜ test ģ„±ėŠ„ģ“ CNN(Default)ģ˜ test ģ„±ėŠ„ė³“ė‹¤ ź½¤ ė†’ģ€ ź²ƒģ„ ķ™•ģøķ•  ģˆ˜ ģžˆģŒ

  • ź“€ģ°° 4: XILė”œ ź°œģž…ķ•˜źø° ģ“ģ „ģ—, Neuro-Symbolic ėŖØėø ģ—­ģ‹œ Clever-Hansģ™€ ź°™ģ€ ģˆœź°„ģ„ ź²Ŗź³  ģžˆėŠ” ź²ƒģ„ ė³“ģ—¬ģ¤ė‹ˆė‹¤.

    • ź·¼ź±°: Table2ģ—ģ„œ NeSy(Default)ģ˜ test ģ„±ėŠ„ģ“ ģ™„ė²½ģ— ź°€ź¹Œģš“ validation ģ„±ėŠ„ģ— ė§Žģ“ ėŖ» ėÆøģ¹˜ź³  ģžˆėŠ” ėŖØģŠµģ„ ķ™•ģøķ•  ģˆ˜ ģžˆģŒ

  • ź“€ģ°° 5: Neuro-Symbolic ėŖØėøģ„ ķ†µķ•“ ģ˜ėÆøė” ģ ģø ģ„¤ėŖ…ź¹Œģ§€ ķ™œģš©ķ•˜ėŠ” XILģ˜ ź²½ģš° Clever-Hans ė°ģ“ķ„°ģ…‹ź³¼ ź°™ģ€ ė¬øģ œė„¼ ė§Žģ“ ķ•“ź²°ķ–ˆģŒģ„ ė³“ģ—¬ģ¤ė‹ˆė‹¤.

    • ź·¼ź±°: Table2ģ—ģ„œ NeSy(XIL)ģ˜ test ģ„±ėŠ„ģ“ validation ģ„±ėŠ„ ź·¼ģ²˜ė”œ ź°€ģž„ ź°€ź¹ź²Œ ģ˜Ø ź²ƒģ„ ķ™•ģøķ•  ģˆ˜ ģžˆģŒ

    • => ģ €ģžė“¤ģ˜ ģ œģ•ˆķ•œ ė°©ė²•ģ“ ķšØź³¼ģ ģž„

    • => ė‹¤ė„ø ģ˜ėÆøė”œ, ģ˜ėÆøė” ģ ģø ģ„¤ėŖ…ģ“ CLEVER-Hansģ™€ ź°™ģ€ ģˆœź°„ģ— ķšØź³¼ģ ģž„

Figure 5: CLEVER-Hans3ģ—ģ„œ ķ•™ģŠµėœ ėŖØėøė“¤ģ˜ ģ„œė”œ ė‹¤ė„ø ģ •ģ„±ģ  ź²°ź³¼

  • Figure 5ģ—ģ„œėŠ” ģ„œė”œ ė‹¤ė„ø 2ź°€ģ§€ ėŖØėøģ“ ģ¼ė°˜ģ ģœ¼ė”œ ķ•™ģŠµķ•œ ź²½ģš° (Default), ģ‚¬ėžŒģ“ ź°œģž…ķ•œ ź²½ģš° (XIL)ģ— ėŒ€ķ•“ģ„œ ģ–“ė–»ź²Œ ķ•“ė‹¹ ģ„¤ėŖ…ė“¤ģ“ ė°”ė€Œź³  ģžˆėŠ”ģ§€ ė³“ģ—¬ģ£¼ź³  ģžˆėŠ” ź·øė¦¼ģž…ė‹ˆė‹¤.

  • CNN(Default), CNN(XIL), NeSY(Default) ėŖØė‘ ģ˜¬ė°”ė„“ź²Œ ģ˜ˆģø”ķ•˜ģ§€ ėŖ»ķ•œ ėŖØģŠµģ„ ė³¼ ģˆ˜ ģžˆź³ , NeSY(XIL) ź²½ģš°ė§Œ ģ˜¬ė°”ė„“ź²Œ ģ˜ˆģø”ķ•œ ėŖØģŠµģ„ ė³¼ ģˆ˜ ģžˆģŠµė‹ˆė‹¤.

  • CNN ėŖØėøģ˜ ź²½ģš°, ģ–“ė–¤ ģ“ģœ ė”œ ģøķ•“ ėŖØėøģ“ ź²°ģ •ķ–ˆėŠ”ģ§€ ģ˜ėÆøė” ģ ģœ¼ė”œ ķ•“ģ„ķ•  ģˆ˜ ģ—†ģŠµė‹ˆė‹¤.

  • NeSY ėŖØėøģ˜ ź²½ģš°, ģ˜ėÆøė” ģ ģœ¼ė”œ ėŖØėøģ“ ģ–“ė–¤ ģ˜ˆģø”ģ„ ķ•˜ź³  ģžˆėŠ”ģ§€ ķ™•ģøķ•  ģˆ˜ ģžˆģŠµė‹ˆė‹¤.

5. Conclusion

  • ģ €ģžė“¤ģ€ ģ˜ėÆøė” ģ  (semantic) ģˆ˜ģ¤€ģ—ģ„œ ėŖØėøģ„ ģˆ˜ģ •ķ•  ģˆ˜ ģžˆź²Œ ķ•˜ėŠ”, ė‰“ė”œ-ģ‹¬ė³¼ė¦­ (Neuro-Symbolic) ģž„ė©“ ķ‘œķ˜„ (scene representaiton) ź³µź°„ģ— ź°œģž…ķ•˜ėŠ” ė°©ė²•ė” ģ„ ģ œģ•ˆķ•©ė‹ˆė‹¤.

  • ėŖØėøģ˜ ķšØź³¼ė„¼ ģž…ģ¦ķ•˜źø° ģœ„ķ•“, ģƒˆė”œģš“ źµėž€ėœ ė°ģ“ķ„°ģ…‹ģø CLEVER-Hans3ź³¼ CLEVER-Hans7ģ„ źµ¬ģ¶•ķ–ˆģŠµė‹ˆė‹¤.

  • "ģ‹œź°ģ " ģ„¤ėŖ…ė§Œģœ¼ė”œ ģ‹ė³„ķ•  ģˆ˜ ģ—†ėŠ” źµėž€ģš”ģøģ„ "ģ˜ėÆøė” ģ " ģ„¤ėŖ…ģ„ ķ†µķ•“ ģ‹ė³„ķ•  ģˆ˜ ģžˆģŒģ„ ė³“ģ—¬ģ£¼ģ—ˆģŠµė‹ˆė‹¤.

  • ź²°ź³¼ģ ģœ¼ė”œ, ģ“ ģ˜ėÆøė” ģ  ģˆ˜ģ¤€ģ— ėŒ€ķ•œ ķ”¼ė“œė°±ģ„ ķ†µķ•“ ķ•“ė‹¹ ģ˜ėÆøģ— ģ“ˆģ ģ„ ė§žģ¶”ģ–“ ėŖØėøģ„ ģˆ˜ģ •ķ•  ģˆ˜ ģžˆź²Œ ė˜ģ—ˆģŠµė‹ˆė‹¤.

Take home message (ģ˜¤ėŠ˜ģ˜ źµķ›ˆ)

ģ“ ė…¼ė¬øģ€ Color-MNISTė¼ėŠ” motivated exampleģ— ź±øģ³, ėŖØėøģ— ź°œģž…ķ•  ė•Œ ģ™œ źø°ķ˜øģ ģø ķ‘œķ˜„ģ„ ģ“ģš©ķ•˜ėŠ” ź²ƒģ“ ģ¤‘ģš”ķ•œģ§€ ė³“ģ—¬ģ¤€ ė…¼ė¬øģž…ė‹ˆė‹¤.

ģ²˜ģŒģœ¼ė”œ XILģ— Neural Symbolic Architectureė„¼ ģ œģ•ˆķ•˜ģ—¬, Grad-CAMź°™ģ€ ģ‹œź°ģ  ģ„¤ėŖ…ė“¤ė³“ė‹¤ė„ ķšØź³¼ģ ģœ¼ė”œ ėŖØėøģ— ź°œģž…ģ“ ź°€ėŠ„ķ•Øģ„ ģ‹¤ķ—˜ ź²°ź³¼ė„¼ ķ†µķ•“ ė³“ģ—¬ģ£¼ģ—ˆģŠµė‹ˆė‹¤.

ģ“ģ²˜ėŸ¼ ė”„ėŸ¬ė‹ģ—ģ„œ ė¹„źø°ķ˜øģ ģø ķ‘œķ˜„ėæė§Œ ģ•„ė‹ˆė¼ źø°ķ˜øģ ģø ķ‘œķ˜„ģ„ ģž˜ ķ™œģš©ķ•  ģˆ˜ ģžˆė‹¤ė©“, ģ‚¬ėžŒģ“ ģ§€ź°ķ•˜ź³  ģøģ§€ķ•˜ėŠ” ėŠ„ė „ģ„ ķ™œģš©ķ•˜ėŠ”ė° ķ° ė„ģ›€ģ“ ė  ģˆ˜ ģžˆģ„ ź²ƒ ź°™ģŠµė‹ˆė‹¤.

Author / Reviewer information

Author

ė°°ģ„±ģˆ˜

  • KAIST AI

  • contact: seongsu@kaist.ac.kr

Reviewer

  1. Korean name (English name): Affiliation / Contact information

  2. Korean name (English name): Affiliation / Contact information

  3. ...

Reference & Additional materials

Last updated