VOS: OOD detection by Virtual Outlier Synthesis [Kor]
Du et al. / VOS-Learning What You Donโt Know by Virtual Outlier Synthesis / ICLR 2022 Poster
Last updated
Du et al. / VOS-Learning What You Donโt Know by Virtual Outlier Synthesis / ICLR 2022 Poster
Last updated
์ต๊ทผ ๋ฅ๋ฌ๋์ด ๋ฐ์ ํ์ฌ ๋ง์ Computer vision task์์ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ฌ์ฑํ๊ณ ์์ผ๋, ์ด๋ค์ ๋๋ถ๋ถ In-Distribution(ID) setting์์ ์คํ๋์๋ค. ์ฆ, ํ์ต์์ ์ฌ์ฉํ ๋ฐ์ดํฐ์ ๊ณผ ํ ์คํธ ๋ ์ฌ์ฉํ ๋ฐ์ดํฐ์ ์ ๋ถํฌ๊ฐ ๋์ผํ์๋ค. ํ์ง๋ง ๋ฅ๋ฌ๋ ๊ธฐ์ ์ ์ฌ์ฉํ๋ ๋ค์ํ ํ์ค ๋ฌธ์ ์์๋ ํ์ต ๋ ๋ณด์ง ๋ชปํ ๋ถํฌ์ ๋ฐ์ดํฐ์ (Out-of-Distribution(OOD) Dataset)์ด ํ ์คํธ ๋ ๋ฑ์ฅํ ๊ฐ๋ฅ์ฑ์ด ์ถฉ๋ถํ ๋๋ค. ํ์ง๋ง ์์ง๊น์ง๋ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ด Out-of-Distribution(OOD) ๋ฐ์ดํฐ์ ๋ํด์๋ ๋์ Confidence prediction์ ๋ด๋ฆฌ๋ ๋ฑ์ ๋ฌธ์ ์ ์ด ์กด์ฌํ๋ค. OOD detection์ ์ํ ๋ฐฉ๋ฒ ์ค ํ๋๋ ์ถฉ๋ถํ Unknown ๋ฐ์ดํฐ๋ฅผ ๋ชจ๋ธ์๊ฒ ํ์ต์์ผ In-distribution(ID)๊ณผ Out-of-distribution(OOD)์ ๊ตฌ๋ถํ๋ ํ์ดํธํ decision boundary๋ฅผ ์์ฑํ๋๋ก ํ๋ ๊ฒ์ด๋ค. ๋ ผ๋ฌธ์ ์ ์๋ ์ด๋ฅผ ์ํด ๊ฐ์์ Outlier ๋ฐ์ดํฐ๋ฅผ ํฉ์ฑํ๋ ์๋ก์ด ๋ฐฉ๋ฒ์ ์ ์ํ๋ค.
๋ํ, ๊ธฐ์กด์ OOD detection ๋ฐฉ๋ฒ๋ค์ ์ฃผ๋ก image ์ ์ฒด์ ๋ํด์ OOD๋ฅผ ํ๋ณํ์ผ๋, ์ค์ ๋ก๋ ์ด๋ฏธ์ง์ ์ฌ๋ฌ๊ฐ์ object๊ฐ ํผ์ฌ๋์ด ์์ผ๋ฉฐ(e.g. Object Detection) ๊ทธ ์ค์์ ์ด๋ค region์ด anomalousํ์ง๋ฅผ ํ๋จํ๋ ๊ฒ์ ๋งค์ฐ ์ค์ํ๋ค. ๋ฐ๋ผ์ ๋ ผ๋ฌธ์ ์ ์๋ image๊ฐ ์๋ object level์์ OOD๋ฅผ ์๋ณํ๋ ๊ฒ์ ๋ชฉํ๋ก ํ๋ค.
Problem Setup: input๊ณผ label space๋ ๊ฐ๊ฐ ๋ค์๊ณผ ๊ฐ๋ค. . ์ด๋, ๋ input image, ๋ object instance์ bounding box, ๋ K-way classification์์ object์ semantic label์ด๋ค. ์ฐ๋ฆฌ์ Object detection ๋ชจ๋ธ์ unknown joint distribution์์ ๋ฝํ in-distribution data ๋ก ๋ถํฐ ํ์ต๋๋ค. ๋ชจ๋ธ์ bounding box regression ๊ณผ classification ๋ฅผ ์ํํ๊ธฐ ์ํ ๋ชจ๋ธ ํ๋ผ๋ฏธํฐ ๋ฅผ ํ์ตํ๋ค. OOD detection์ ID์ OOD object๋ฅผ ๊ตฌ๋ถํ๋ binary classification problem์ผ๋ก ๋ณผ ์ ์๋ค. ๋ฅผ ์ ๋ํ marginal probability distribution์ด๋ผ๊ณ ํ์. test input ๊ณผ object detector๊ฐ ์์ธกํ bounding box ๊ฐ ์ฃผ์ด์ก์ ๋, OOD detection ๋ชฉํ๋ ๋ฅผ ์์ธกํ๋ ๊ฒ์ด๋ค. ์ด๋, ๋ object๊ฐ ID์์ ์๋ฏธํ๊ณ , ๋ OOD๋ฅผ ์๋ฏธํ๋ค.
OOD detection for classification ํฌ๊ฒ ๋ค์์ 2๊ฐ์ง์ ๋ฐฉ๋ฒ์ผ๋ก ๊ตฌ๋ถํ ์ ์๋ค: Post hoc & regularization-based method. Post hoc ๋ฐฉ๋ฒ์ผ๋ก๋ OOD input์ ๋ํด์ ๋์ softmax confidence score๋ฅผ ์์ธกํ๋๋ก ํ๋ ๋ฐฉ๋ฒ(Hendrycks & Gimpel, 2017.; Hein et al., 2019)์ด ์ฃผ๋ก baseline์ผ๋ก ์ฌ์ฉ๋๋ค. ์ด๋ฅผ ๋ฐ์ ์์ผ ODIN (Liang et al., 2018), Mahalanobis distance (Lee et al., 2018b), energy score (Liu et al., 2020a), Gram matrices based score (Sastry & Oore, 2020), and GradNorm score (Huang et al., 2021)์ ๋ฐฉ๋ฒ๋ค์ด ์ ์๋์๋ค. ๋ ๋ค๋ฅธ ๋ฐฉ๋ฒ์ธ regularization-based method์์๋ natural outlier image(Hendrycks et al., 2019; Mohseni et al., 2020; Zhang et al., 2021)๋ GAN ๋ฑ์ ํตํด ํฉ์ฑ ์ด๋ฏธ์ง๋ฅผ OOD sample๋ก ํ์ฉ(Lee et al., 2018)ํ์ฌ ๋ชจ๋ธ์ regularizationํ๋ค. ํ์ง๋ง real outlier data๋ฅผ ์ป๋ ๊ฒ์ ๋งค์ฐ ํ๋ค๋ค๋ ํ๊ณ์ ์ด ์๋ค. ์ด๋ฌํ ๋ฐฉ๋ฒ๋ค์ image ๋จ์์ OOD detection์์๋ ์ข์ ์ฑ๋ฅ์ ๋ฌ์ฑํ์์ผ๋, object detection๊ณผ ๊ฐ์ด ํ๋์ image ๋ด์ ์ฌ๋ฌ๊ฐ์ object instane๊ฐ ์กด์ฌํ๋ object level OOD detection์์๋ ์ฑ๋ฅ์ด ๊ฒ์ฆ๋์ง ์์๋ค.
OOD detection for object detection ์์ง๊น์ง object detection์ ์ํ OOD detection ์ฐ๊ตฌ๋ ํ๋ฐํ ์งํ๋์ง ์์๋ค. Joseph et al. (2021)์ energy score๋ฅผ ํ์ฉํ์ฌ OOD object๋ฅผ ๋ถ๋ณํ๊ณ ์ด๋ฅผ ํ์ฉํ์ฌ incremental object detection์ ์ํํ์๋ค. ํนํ, negative proposals๋ฅผ unknown sample๋ก ํ์ฉํ์ฌ model์ regularization ํ์๋๋ฐ, ์ด๋ ID์ OOD data๋ฅผ ๋์ผํ data distribution์์ ๋ฝ๊ฒ ํ์ฌ optimalํ decision boundary๋ฅผ ํ์ตํ์ง ๋ชปํ๋ค. ๋ช๊ฐ์ง ๋ค๋ฅธ ๋ ผ๋ฌธ์์๋ OOD๋ฅผ ํ๋ณํ๋ ๊ฒ์ด ์๋ uncertainty๋ฅผ estimationํ๋ ๋ฐ์ ์ง์คํ์๊ณ (Harakeh & Waslander, 2021; Riedlinger et al., 2021), ๋ ๋ค๋ฅธ ์ฐ๊ตฌ๋ก๋ Bayesian method๋ฅผ ํ์ฉํ์ฌ OOD detection์ ์ํํ๊ธฐ๋ ํ์์ผ๋ multiple inference pass๊ฐ ๋ถ๊ฐํผํ๋ค๋ ํ๊ณ์ ์ด ์๋ค.(Dhamija et al., 2020; Miller et al., 2019; 2018; Hall et al., 2020; Deepshikha et al., 2021)
image level์์ OOD detection์ ์ํํ๋ ๊ธฐ์กด์ ๋ฐฉ๋ฒ๋ค๊ณผ๋ ๋ฌ๋ฆฌ, image ๋ด์ object level์์ OOD detection์ ์ํํ ์ ์๋ ์๋ก์ด framework๋ฅผ ์ ์ํ๋ค.(OOD detection for Object detection task)
GAN์ฒ๋ผ ๊ณ ์ฐจ์์(high-dimentional) pixel space์์ outlier ๋ฐ์ดํฐ๋ฅผ ํฉ์ฑํ๋ ๊ธฐ์กด์ ๋ฐฉ๋ฒ๊ณผ๋ ๋ฌ๋ฆฌ, feature space์์ outlier๋ฅผ ํฉ์ฑํ๋ ๊ฒ์ด ๋ ์ข์ ์ฑ๋ฅ์ ๋ฌ์ฑํ๋ค๋ ๊ฒ์ ๋ณด์ธ๋ค.
์๋ก์ด unknwon-aware training objective๋ฅผ ์ ์ํจ์ผ๋ก์จ ID์ ํฉ์ฑ๋ outlier(OOD) ๊ฐ์ uncertainty surface๋ฅผ ๋์กฐ์ ์ผ๋ก ํ์ฑํ ์ ์๋๋ก ํ๋ค.
๋ค์์ 3๊ฐ์ง research question์ ๋ํ ๋ต์ ๋์ถํ๋ค.
์ด๋ป๊ฒ virtual outlier๋ฅผ ํฉ์ฑํ ๊ฒ์ธ๊ฐ?
์ด๋ป๊ฒ ํฉ์ฑ๋ outlier๋ฅผ ํ์ฉํ์ฌ ํจ๊ณผ์ ์ธ model regularization์ ์ํํ ๊ฒ์ธ๊ฐ?
Inference ๋ ์ด๋ป๊ฒ OOD detection์ ์ํํ ๊ฒ์ธ๊ฐ?
๋ ผ๋ฌธ์์ ์ ์ํ๋ framework์ธ VOS์ ์ ์ฒด์ ์ธ ๊ทธ๋ฆผ์ ์๋์ ๊ฐ๋ค.
Key idea๋ high-dimentional pixel space์์ image๋ฅผ ํฉ์ฑํ๋ ๊ฒ์ optimizeํ๋ ๊ฒ์ด ์ด๋ ต๊ธฐ ๋๋ฌธ์, feature space์์ virtual ourlier๋ฅผ ํฉ์ฑํ์๋ ๊ฒ์ด๋ค. ์ฐ์ object instance์ feature representation์ ๋ค์๊ณผ ๊ฐ์ด class-conditional multivariate Gaussian distritution์ผ๋ก ๊ฐ์ ํ๋ค.
์ ์์์ weight๋ classification์ ์ํํ๊ธฐ ์ง์ ์ last fully connected layer์ weight๋ฅผ ์๋ฏธํ๋ค.
๋ชจ๋ธ์ ํ์ตํจ์ ์์ด์ Key idea๋ ID data์ ๋ํด์๋ ๋ฎ์ OOD score๋ฅผ ์์ธกํ๊ณ , ํฉ์ฑ๋ outlier์ ๋ํด์๋ ๋์ OOD score๋ฅผ ์์ธกํ๋๋ก model์ regularizeํ๋ ๊ฒ์ด๋ค. ์ฌ์ด ์ดํด๋ฅผ ์ํด ์ฐ์ multi-class classification setting์์ uncertainty regularization์ ์๋ ๋ฐฉ์์ ๋ค์๊ณผ ๊ฐ์ด ์ค๋ช ํ ์ ์๋ค.
์ด์ classification์ด ์๋ Object detection setting์์๋ ๋ค์๊ณผ ๊ฐ์ด Energy๋ฅผ ์ ์ํ ์ ์๋ค.
๋ฐ๋ผ์, OOD detection for object detection์ ์ต์ข training objective๋ ๋ค์๊ณผ ๊ฐ๋ค.
Dataset
ID training data:
PASCAL VOC(Everingham et al., 2010)
Berkeley DeepDrive(BDD-100k2) (Yu et al., 2020)
OOD training data: subset images from the following datasets which do not contain ID category
MS-COCO (Lin et al., 2014)
OpenImages(validation set) (Kuznetsova et al., 2020)
Baselines
Maximum Softmax Probability (Hendrycks & Gimpel, 2017)
ODIN (Liang et al., 2018)
Mahalanobis distance (Lee et al., 2018)
Generalized ODIN (Hsu et al., 2020)
energy score (Liu et al., 2020)
CSI (Tack et al., 2020)
Gram matrices (Sastry & Oore, 2020)
Training setup
2๊ฐ์ง backbone architectures: ResNet-50 and RegNetX-4.0GF
class-conditional Gaussian ์ถ์ ์ ์ํด 1,000๊ฐ์ sample ์ฌ์ฉ
training iterations
For PASCAL VOC: 18,000 iters
For BDD-100k: 90,000 iters
Python 3.8.5 and PyTorch 1.7.0, using NVIDIA GeForce RTX 2080Ti GPUs
Evaluation metric
FPR95: the false positive rate of OOD samples when the true positive rate of ID samples is at 95%
AUROC: the area under the receiver operating characteristic curve
mAP: mean Average Precision for the object detection performance on the ID task
์์ Main results table์์ ํ์ธํ ์ ์๋ฏ์ด, ๋ ผ๋ฌธ์์ ์ ์ํ๋ VOS๋ ๋ค๋ฅธ baseline๋ค๋ณด๋ค OOD detection๊ณผ object detection ์ฑ๋ฅ ๋ชจ๋ ๋ฐ์ด๋๋ค. ๋จผ์ OOD detection ์ฑ๋ฅ์ ๋ํ๋ด๋ FPR95์ AUROC metric์ ๋ณด๋ฉด VOS๊ฐ ๋ค๋ฅธ ๋ฐฉ๋ฒ๋ค๋ณด๋ค ์๋ฑํ๊ฒ ์ข๋ค. ์ด์ ๋์์, VOS๋ ID์ ๋ํ object detection ์ฑ๋ฅ์ ๋ํ๋ด๋ mAP๋ฅผ ํค์น์ง ์์ผ๋ฉด์ ์ข์ OOD detection ์ฑ๋ฅ์ ๋ฌ์ฑํ๋ ๊ฒ์ ํ์ธํ ์ ์๋ค.
๋ค์์ผ๋ก visualization result๋ ์์ ๊ทธ๋ฆผ๊ณผ ๊ฐ๋ค. ๊ทธ๋ฆผ์ OOD image์ ๋ํ object detection ๊ฒฐ๊ณผ์ด๋ฉฐ, top row๋ vanilla Faster-RCNN model์ด๊ณ bottom row๋ VOS์ด๋ค. Blue bounding box๋ ID class๋ก ๋ถ๋ฅ๋ object์ด๊ณ , green bounding box๋ VOS์ ์ํด OOD๋ก ๋ถ๋ฅ๋ object์ด๋ค. ๊ทธ๋ฆผ์์ ํ์ธํ ์ ์๋ฏ์ด, VOS๋ OOD object๋ฅผ ์ detectionํ์ฌ false positive๋ฅผ ๊ฐ์์ํจ๋ค.๋ํ, 3rd column์ ๋ณด๋ฉด false positive object์ ๋ํ confidence score๋ฅผ ๋ฎ๊ฒ ์์ธกํจ์ผ๋ก์จ ๋ robustํ detection ๊ฒฐ๊ณผ๋ฅผ ์์ฑํ๋ค๋ ๊ฒ์ ์ ์ ์๋ค.
๋ ผ๋ฌธ์์๋ OOD detection์ ์ํด ์๋ก์ด unknwon-aware training framework(=VOS)๋ฅผ ์ ์ํ๋ค. ์ค์ outlier data๋ฅผ ํ์๋ก ํ๋ ๊ธฐ์กด์ ๋ฐฉ๋ฒ๊ณผ๋ ๋ค๋ฅด๊ฒ VOS๋ training ๋ feature space๋ก๋ถํฐ virtual outlier๋ฅผ ํฉ์ฑํ๋ค. ๊ทธ๋ฆฌ๊ณ ์ด๊ฒ์ ํ์ฉํ์ฌ model์ด ID์ OOD object๋ฅผ ๊ตฌ๋ถํ๋ decision boundary๋ฅผ ์ ํ์ตํ ์ ์๋๋ก ํ๋ค. ๊ทธ ๊ฒฐ๊ณผ VOS๋ ID task ์ฑ๋ฅ์ ์ ์งํ ์ฑ, state-of-the-art OOD detection ์ฑ๋ฅ์ ๋ฌ์ฑํ์์ผ๋ฉฐ object detection์์๋ ์ ์๋ํจ์ด ์ฆ๋ช ๋์๋ค.
๊ธฐ์กด์ ์ด๋ฏธ์ง ํฉ์ฑ์ ์ํ GAN, noise injection ๋ฑ์ ๋ฐฉ๋ฒ๋ค๊ณผ ๋ค๋ฅด๊ฒ, ๋ ผ๋ฌธ์์ ์ ์ํ feature space์ low-likelihood region์์ virtual outlier๋ฅผ ์ํ๋งํ๋ ๋ฐฉ๋ฒ์ด ํฅ๋ฏธ๋ก์ ๋ค. ๋ํ, ์์ง๊น์ง๋ object detection์์ OOD detection์ ์ํ ๋ฐฉ๋ฒ์ด ๋ณ๋ก ์์๋๋ฐ ๋ ผ๋ฌธ์์ powerfulํ baseline์ ์ ๊ณตํ ๊ฒ ๊ฐ๊ณ , ์ด๋ฅผ ๊ณ๊ธฐ๋ก OOD detection for Object detection ์ฐ๊ตฌ๊ฐ ํ๋ฐํ ์งํ๋ ๊ฒ์ผ๋ก ์์๋๋ค.
์ต์์ (Wonjeong Choi)
KAIST EE
https://github.com/wonjeongchoi
Korean name (English name): Affiliation / Contact information
Korean name (English name): Affiliation / Contact information
...
Hendrycks, D., & Gimpel, K. A baseline for detecting misclassified and out-of-distribution examples in neural networks. arXiv preprint arXiv:1610.02136, 2016.
Hein, M., Andriushchenko, M., & Bitterwolf, J. Why relu networks yield high-confidence predictions far away from the training data and how to mitigate the problem. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, pp. 41-50, 2019.
Shiyu Liang, Yixuan Li, and Rayadurgam Srikant. Enhancing the reliability of out-of-distribution image detection in neural networks. In International Conference on Learning Representations, ICLR 2018.
Kimin Lee, Kibok Lee, Honglak Lee, and Jinwoo Shin. A simple unified framework for detecting out-of-distribution samples and adversarial attacks. In Advances in Neural Information Processing Systems, pp. 7167โ7177, 2018.
Weitang Liu, Xiaoyun Wang, John Owens, and Yixuan Li. Energy-based out-of-distribution detection. Advances in Neural Information Processing Systems, 2020.
Chandramouli Shama Sastry and Sageev Oore. Detecting out-of-distribution examples with gram matrices. In Proceedings of the 37th International Conference on Machine Learning, ICML 2020, volume 119, pp. 8491โ8501, 2020.
Rui Huang, Andrew Geng, and Yixuan Li. On the importance of gradients for detecting distributional shifts in the wild. In Advances in Neural Information Processing Systems, 2021.
Dan Hendrycks, Mantas Mazeika, and Thomas Dietterich. Deep anomaly detection with outlier exposure. In International Conference on Learning Representations, 2019.
Sina Mohseni, Mandar Pitale, JBS Yadawa, and Zhangyang Wang. Self-supervised learning for generalizable out-of-distribution detection. In Proceedings of the AAAI Conference on Artificial Intelligence, volume 34, pp. 5216โ5223, 2020.
Jingyang Zhang, Nathan Inkawhich, Yiran Chen, and Hai Li. Fine-grained out-of-distribution detection with mixup outlier exposure. CoRR, abs/2106.03917, 2021.
Kimin Lee, Honglak Lee, Kibok Lee, and Jinwoo Shin. Training confidence-calibrated classifiers for detecting out-of-distribution samples. In International Conference on Learning Representations, 2018.
K. J. Joseph, Salman Khan, Fahad Shahbaz Khan, and Vineeth N. Balasubramanian. Towards open world object detection. In IEEE/CVF Conference on Computer Vision and Pattern Recognition, CVPR 2021.
Ali Harakeh and Steven L. Waslander. Estimating and evaluating regression predictive uncertainty in deep object detectors. In International Conference on Learning Representations, 2021.
Tobias Riedlinger, Matthias Rottmann, Marius Schubert, and Hanno Gottschalk. Gradient-based quantification of epistemic uncertainty for deep object detectors. CoRR, abs/2107.04517, 2021.
Akshay Raj Dhamija, Manuel Gunther, Jonathan Ventura, and Terrance E. Boult. The overlooked ยจ elephant of object detection: Open set. In IEEE Winter Conference on Applications of Computer Vision, WACV 2020, pp. 1010โ1019, 2020.
Dimity Miller, Feras Dayoub, Michael Milford, and Niko Sunderhauf. Evaluating merging strategies ยจ for sampling-based uncertainty techniques in object detection. In International Conference on Robotics and Automation, ICRA 2019, pp. 2348โ2354, 2019.
Dimity Miller, Lachlan Nicholson, Feras Dayoub, and Niko Sunderhauf. Dropout sampling for ยจ robust object detection in open-set conditions. In IEEE International Conference on Robotics and Automation, ICRA 2018, pp. 1โ7, 2018. doi: 10.1109/ICRA.2018.8460700.
David Hall, Feras Dayoub, John Skinner, Haoyang Zhang, Dimity Miller, Peter Corke, Gustavo Carneiro, Anelia Angelova, and Niko Sunderhauf. Probabilistic object detection: Definition and ยจ evaluation. In IEEE Winter Conference on Applications of Computer Vision, WACV 2020, pp. 1020โ1029, 2020.
Kumari Deepshikha, Sai Harsha Yelleni, P. K. Srijith, and C. Krishna Mohan. Monte carlo dropblock for modelling uncertainty in object detection. CoRR, abs/2108.03614, 2021.
Weitang Liu, Xiaoyun Wang, John Owens, and Yixuan Li. Energy-based out-of-distribution detection. Advances in Neural Information Processing Systems, 2020.
Mark Everingham, Luc Van Gool, Christopher K. I. Williams, John M. Winn, and Andrew Zisserman. The pascal visual object classes (VOC) challenge. International Journal of Computer Vision, 88(2):303โ338, 2010.
Fisher Yu, Haofeng Chen, Xin Wang, Wenqi Xian, Yingying Chen, Fangchen Liu, Vashisht Madhavan, and Trevor Darrell. BDD100K: A diverse driving dataset for heterogeneous multitask learning. In IEEE/CVF Conference on Computer Vision and Pattern Recognition, CVPR 2020, pp. 2633โ2642, 2020.
Tsung-Yi Lin, Michael Maire, Serge Belongie, James Hays, Pietro Perona, Deva Ramanan, Piotr Dollar, and C Lawrence Zitnick. Microsoft coco: Common objects in context. In ยด European conference on computer vision, pp. 740โ755, 2014.
Alina Kuznetsova, Hassan Rom, Neil Alldrin, Jasper Uijlings, Ivan Krasin, Jordi Pont-Tuset, Shahab Kamali, Stefan Popov, Matteo Malloci, Alexander Kolesnikov, et al. The open images dataset v4. International Journal of Computer Vision, pp. 1โ26, 2020.
์ด๋, ๋ class์ index๋ฅผ, ๋ network์ parameter๋ฅผ ์๋ฏธํ๊ณ , ๋ input , bounding box ์ ํด๋นํ๋ object instance์ ๋ํ feature representation์ด๋ค. ๊ทธ๋ฆฌ๊ณ ์์ gaussian ๋ถํฌ์ parameter๋ค()์ estimateํ๊ธฐ ์ํด training sample์ empirical class mean๊ณผ covariance๋ฅผ ๋ค์๊ณผ ๊ฐ์ด ๊ณ์ฐํ๋ค. ์ด๋, ๊ณ์ฐ ํจ์จ์ ์ํด ๊ฐ class๋ง๋ค ์ผ์ ๊ฐ์์ instance๋ฅผ queue์ ์ ์ฅํด๋๋ฉด์ ๊ณ์ฐํ๋ค.
์ฐ๋ฆฌ์ ๋ชฉํ๋ ์ด๋ฌํ feature ๋ถํฌ๋ก๋ถํฐ virtual outlier๋ฅผ ํฉ์ฑํ๋ ๊ฒ์ด๋ค. ๋ชจ๋ธ์ ์ด๋ ๊ฒ ์์ฑ๋ virtual outltier์ ํ์ต ๋ฐ์ดํฐ๋ฅผ feature ๊ณต๊ฐ์์ ๊ตฌ๋ถํ ์ ์๋ decision boundary๋ฅผ ํ์ตํ๊ฒ ๋๋ค. ์ด๋, ๋ชจ๋ธ์ด compactํ decision boundary๋ฅผ ํ์ตํ ์ ์๋๋ก ๋ ผ๋ฌธ์์๋ ์ถ์ ๋ class-conditional distribution์ -likelihood region์์ virtual outlier๋ฅผ ์ํ๋งํ๋ค. ์ฆ, ID data์ ๋ํ feature representation์์ ๋๋ฌด ๋ฉ๋ฆฌ ๋จ์ด์ง์ง ์์ ๊ณต๊ฐ์์ virtual outliter๋ฅผ ์์ฑํจ์ผ๋ก์จ ๋ ์ข์ decision boundary๋ฅผ ํ์ตํ ์ ์๋๋ก ํ๋ ๊ฒ์ด๋ค.
์ ์์์, ๋ class k์ ๋ํด sampling๋ virtual outliers๋ฅผ ์๋ฏธํ๋ค. ๋ง์ง๋ง์ผ๋ก ์์์ ์ํ๋ง๋ virtual outlier๋ก ๋ถํฐ classification output์ ๋ค์๊ณผ ๊ฐ์ด ์ ํด์ง๋ค.
๋จผ์ , input data ์ ๋ํด ๋ฅผ directํ๊ฒ ์ถ์ ํ๋ ๊ฒ์ intractableํ๋ค. ์๋ํ๋ฉด ์ ์ฒด input space ๋ก๋ถํฐ ์ํ๋ง์ ํด์ผํ๊ธฐ ๋๋ฌธ์ด๋ค. ๋ฐ๋ผ์ log partition function์ธ ์ด ์ ๋น๋ก(with some unknown factor)ํ๋ค๋ ๊ฒ์ ์ด์ฉํ๋ค. ์๋ ์์ ์๋ณ์ log๋ฅผ ์ทจํ์ฌ ๊ณ์ฐํ๋ฉด ์ฝ๊ฒ ๋น๋ก ๊ด๊ณ๋ฅผ ๋ณด์ผ ์ ์๋ค.
์ ์์์, ๋ label ์ ๋ํ ๋ชจ๋ธ์ logit output์ด๋ค. ์ด๋ negative log partition function์ free energy๋ผ๊ณ ๋ ๋ถ๋ฆฌ๋๋ฐ, ์ด๊ฒ์ OOD detection์ ์ํ uncertainty measurement์ ๋งค์ฐ ํจ๊ณผ์ ์์ด ์ฆ๋ช ๋์๋ค.(Liu et al., 2020) ๋ฐ๋ผ์, ์์์ ๋์ถ๋ Energy function์ binary sigmoid loss์ ํฉํ์ฌ uncertainty loss๋ฅผ ๋ค์๊ณผ ๊ฐ์ด ๋ํ๋ผ ์ ์๋ค.
์ด๋, ๋ slope of sigmoid๋ฅผ modulateํ๋ learnable parameter์ด๋ค. ์์ loss๋ฅผ ํตํด ID data์ ๋ํด์๋ high probability๋ฅผ ์์ธกํ๊ณ , OOD data์ ๋ํด์๋ low probability๋ฅผ ์์ธกํ๋ค.
์ด๋,๋ classification branch๋ก๋ถํฐ ๋์จ class k์ ๋ํ logit output์ด๋ฉฐ ๋ object detection dataset์ class imbalane ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ learning parameter ์ด๋ค.
์ด๋, ๋ uncertainty regularization weight, , ๋ ๊ฐ๊ฐ classification๊ณผ bounding box regression loss์ด๋ค.
Inference์์๋ OOD detection์ ์ํด logistic regression uncertainty branch์ ouput์ ์ฌ์ฉํ๋ค. test input , predicted bounding box ๊ฐ ์ฃผ์ด์ก์ ๋, object ์ ๋ํ OOD uncertainty score๋ ๋ค์๊ณผ ๊ฐ๋ค.
๊ทธ๋ฆฌ๊ณ ์์ score๋ก๋ถํฐ ID์ OOD๋ฅผ ๊ตฌ๋ถํ๊ธฐ ์ํด ๋ค์๊ณผ ๊ฐ์ด threshold ๋ฅผ ํ์ฉํ๋ค.
threshold ๋ ID data์ 95%๊ฐ ์ฌ๋ฐ๋ฅด๊ฒ ๊ตฌ๋ถ๋ ์ ์๋๋ก ํ๋ ์์น๋ก ์ ํด์ง๋ค.
uncertainty regularizer๋ training์ 2/3 ์์ ๋ถํฐ ์ ์ฉ()