MZSR [Kor]
Soh et al. / Meta-Transfer Learning for Zero-shot Super Resolution / CVPR 2020
Preface
Transfer Learning์ด๋?
Transfer Learning์ด๋ ์์ฃผ ํฐ ๋ฐ์ดํฐ์ ์ ํ๋ จ๋ ๋ชจ๋ธ์ ๊ฐ์ค์น๋ฅผ ๊ฐ์ง๊ณ ์์ ์ฐ๋ฆฌ๊ฐ ํด๊ฒฐํ๊ณ ์ ํ๋ ๊ณผ์ ์ ๋ง๊ฒ ์ฌ๋ณด์ ํด์ ์ฌ์ฉํ๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก ๋น๊ต์ ์ ์ ์์ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ง๊ณ ๋ ์ฐ๋ฆฌ๊ฐ ์ํ๋ ๊ณผ์ ๋ฅผ ํด๊ฒฐํ ์ ์๋ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ํ๋ จ์ํฌ ์ ์๋ ๊ฒ์ ๋๋ค.
Meta Learning์ด๋?
Meta learning์ด๋ ํ์ต์ ๋ํ ํ์ต์ ๋งํฉ๋๋ค. ์ฒซ ๋ฒ์งธ๋ ํ์ต์ ์ํด ์ฃผ์ด์ง ๋ฐ์ดํฐ๋ก๋ถํฐ ํจํด์ด๋ ํน์ง์ ์ฐพ๊ณ ์๋ก์ด ๋ฐ์ดํฐ๊ฐ ์ฃผ์ด์ก์ ๋, ๊ทธ ํน์ง์ ์ฐพ๋ ๊ฒ์ ๋๋ค. ๋ ๋ฒ์งธ๋ ๋ชจ๋ธ์ ํ๋ จํ๋ learning๋ณด๋ค ํ ๋จ๊ณ ์์ธ, Hyper-parameter์ ๋ํด์ ์ ํฉํ ๊ฐ์ ์ฐพ๋ Learning์ ์งํํฉ๋๋ค.
1. Problem definition
๋ณธ ๋ ผ๋ฌธ์ MZSR(Meta-Transfer Learning for Zero-shot Super Resolution)์ ํ ์ฅ์ ์ฌ์ง์์ ์ฝ๊ฐ์ ์ ๋ฐ์ดํธ๋ง์ ์ํํ์ฌ ์ฐ์ํ ํด์๋ ๋ณต์ ์ฑ๋ฅ์ ๋ณด์ผ ์ ๋ฐฉ๋ฒ์ ๋๋ค. ํน์ง์ Transfer-learning๊ณผ Meta-learning์ ์ด๋ฌํ Zero-shot Super Resolution ๋ถ์ผ์ ์ฌ์ฉํ๋ค๋ ์ ์ธ๋ฐ์, ์ฐ์ Transfer learning์ ์ด์ฉํ์ฌ ๋ง์ ์์ ์ธ๋ถ ์ด๋ฏธ์ง๋ก๋ถํฐ ์ฌ์ ํ์ต๋ ๋ชจ๋ธ(pre-trained model)์ ์ด์ฉํ์ฌ ์ถ๊ฐ์ ์ผ๋ก Fine-tune์ ์งํํ ์ ์๋๋ก ํฉ๋๋ค. ๋ค๋ง, ์ด Fine-tune์ ์งํํ ๋, Meta-learning์ ์ด์ฉํด์ ๋ค์ํ ์ปค๋(kernel)์ ๋ํด์ ๋น ๋ฅด๊ฒ ์ ์ํ ์ ์๊ฒ๋ ํ๋ ๊ฒ์ด ํน์ง์ ๋๋ค. ์ด Meta-learning ๊ณผ์ ์ ๋ง์น๊ณ ๋๋ฉด, ์ด๋ค ์ด๋ฏธ์ง๊ฐ ์ฃผ์ด์ก์ ๋, ์ด๋ค internal data repetition ์ ๋ณด๋ฅผ ์ด์ฉํด์ ํ์ต์ ์งํํ๋ ๊ทธ๋ฐ Zero-shot ๊ธฐ๋ฐ์ผ๋ก ํ์ต์ด ๋์ํ ๋, ์ด์ ๊ฐ์ด ์ฝ๊ฐ์ ์ ๋ฐ์ดํธ๋ง์ ์ด์ฉํด๋ ๋น ๋ฅด๊ฒ ์๋ํ๋ ํน์ ์ปค๋์ ๋ง๋ ๊ทธ๋ฐ ๊ฐ์ค์น๋ฅผ ์ฐพ์์ ํ์ต์ ์งํํ๋ ๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค.
2. Motivation
์ฆ ์ผ๋ฐ์ ์ผ๋ก ์ด ZSSR์ ํํ ์ฐ๋ฆฌ๊ฐ ์๊ณ ์๋ Zero-shot Super-resolution ๋ฐฉ๋ฒ์ธ๋ฐ์, ์ด๋ฐ ๊ฒฝ์ฐ์๋ ์๊ธฐ ์์ ์ด๋ฏธ์ง์ ๋ํด์ ์ฌ๋ฌ๋ฒ ํ์ต ๊ณผ์ ์ ๊ฑฐ์ณ์ผํ๊ธฐ ๋๋ฌธ์ ์ด๋ ๊ฒ ์ฝ 3000๋ฒ์ ์ ๋ฐ์ดํธ๊ฐ ํ์ํ๋ฐ์, ๋ณธ ๋ ผ๋ฌธ์์ ์ ์ํ๋ MZSR์ ์ด์ฉํ๊ฒ ๋๋ฉด, Transfer์ Meta-learning์ ์ฌ์ ์ ๋ฏธ๋ฆฌ ์ด์ฉํด๋๊ณ ์ค์ ๋ก meta-test ๊ณผ์ ์์ ๋จ์ํ ํ๋ฒ, ๊ทธ๋ฆฌ๊ณ ๋ง๊ฒ๋ 10๋ฒ ์ ๋์ ์ ๋ฐ์ดํธ๋ง ์ํํ๋๋ผ๋, ๊ฐ์ค์น๊ฐ ์ด ์ด๋ฏธ์ง์ ๋ง๊ฒ ์ ์ ํ๊ฒ ํน์ ์ปค๋์ ์ ๋ถํฉํ ์ ์๋๋ก ํ์ต์ด ๋๊ธฐ ๋๋ฌธ์, ์ ์ ์ ๋ฐ์ดํธ๋ง ๊ฐ์ง๊ณ ๋ ๋น ๋ฅด๊ฒ ๊ฐ์ค์น๋ฅผ ์ฐพ์ ์ ์์ด์ Zero-shot Super-resolution๋ฅผ ์ํ ๋ชจ๋ธ์ ๋น ๋ฅด๊ฒ ๋ง๋ค ์ ์๋ค๋ ๊ฒ์ด ์ฅ์ ์ ๋๋ค.
Related work
1) CNN๊ธฐ๋ฐ ์ ๊ทผ๋ฐฉ์
์ต๊ทผ์๋ CNN๊ธฐ๋ฐ์ ์ ๊ทผ๋ฐฉ๋ฒ์ด ๋์ ์ฑ๋ฅ์ ๋ณด์ด๊ณ ์์ด์ ๋ง์ด ์ฌ์ฉ๋๊ณ ์๋๋ฐ์, ์ด๋ ์ ํด์๋ ์ด๋ฏธ์ง๋ฅผ ๋คํธ์ํฌ์ ๋์ ํ์ฌ ๋์ ํด์๋๋ก ๋ฐํํ๋ ๋ฐฉ์์ผ๋ก ์ด๋ฃจ์ด์ง๋๋ค. ๋ฌผ๋ก , ์ด Neural Network์ ์ข ๋ฅ์ ๋ฐ๋ผ์ ์ ํด์๋์ ์ด๋ฏธ์ง๋ฅผ Bicubic ๋ฑ์ ์ด์ฉํ์ฌ ํฌ๊ธฐ๋ฅผ ํค์ด ๋ค์์ ์ด ์ด๋ฏธ์ง๋ฅผ Neural Network์ ๋ฃ์ด์ ๊ณ ํด์๋๋ก ๋ฐํํฉ๋๋ค. ์ด๋, ๊ณ ํด์๋ ์ด๋ฏธ์ง๋ค์ ํน์ kernal์ ์ด์ฉํ์ฌ Blur์ฒ๋ฆฌ๋ฅผ ํ๊ณ , Downsampling, Noise ์ถ๊ฐ ๊ณผ์ ์ ๊ฑฐ์ณ ์ ํด์๋๋ก ๋ง๋ค์ด์ Train data๋ก์จ ์ฌ์ฉํฉ๋๋ค. ๋ค๋ง, Downsampling ๊ณผ์ ์์ bicubic๊ณผ ๊ฐ์ ์ ์๋ ค์ง kernal๋ง์ ์ด์ฉํ๋ฉด non-bicubic ์ผ์ด์ค์ ๋ํ์ฌ ์ฑ๋ฅ์ด ๋จ์ด์ง๋ domain gap ๋ฌธ์ ๊ฐ ๋ฐ์ํ๊ฒ ๋ฉ๋๋ค.
2) SISR(Single Image Super-Resolution)
์ด ๋ถ์ผ์ ๋ํด์ ๊ธฐ๋ณธ์ ์ธ ๋ด์ฉ๋ถํฐ ์๊ธฐ ์ํด์ SISR(Single Image Super-Resolution)์ ๋ํด์ ๋ง์๋๋ฆฌ๊ฒ ์ต๋๋ค. ์ด ๋ถ์ผ๋ ํ ์ฅ์ ์ ํด์๋ ์ด๋ฏธ์ง(LR)๊ฐ ํ ์คํธ ํ์์ ์ฃผ์ด์ก์ ๋, ์ด๋ฅผ ๊ณ ํด์๋ ์ด๋ฏธ์ง(HR)๋ก ๋ณํํ๋ ๋ฐฉ๋ฒ์ ๋ค๋ฃน๋๋ค. ํฝ์ ์ฌ๋ฌ๊ฐ์ง ๊ฐ๋ค์ด ์กด์ฌํ๋ค๊ณ ํ์ ๋, ์ด ํฝ์ ์ ์๋ฅผ ๋๋ฆฐ๋ค๊ณ ํ๋ฉด, ์ฆ ๊ณ ํด์๋์ ์ด๋ฏธ์ง๋ก ๋ฐ๋๋ค๊ณ ํ๋ฉด, ๋ค์ํ ๋ฐฉ๋ฒ(1D nearest-neighbor, Linear, Cubic, 2D nearest-neighbor, Bilinear, Bicubic)์ ์ด์ฉํ์ฌ ํฝ์ ๊ฐ์ ์์ฑํฉ๋๋ค. ์ฌ๊ธฐ์ Cubic์ 3์ฐจํจ์๋ฅผ ์ด์ฉํ๋ ๋ด์ฉ์ด๋ผ๊ณ ๋ณด์๋ฉด ๋ฉ๋๋ค. ๋ฐ๋ผ์ ๊ธฐ์กด์ ์กด์ฌํ๋ ๊ฐ๊ฐ์ sample ๊ฐ์ ์ฐธ๊ณ ํ์ฌ ์ด ์ค๊ฐ ์ง์ ์ ํฝ์ ๊ฐ์ ๊ฒฐ์ ํ๋ ๋ฐฉ์์ด ๊ฐ์ฅ ์ ํต์ ์ด๋ฉฐ ๋ง์ด ์ฌ์ฉ๋๋ ๋ฐฉ๋ฒ์ ๋๋ค.
3) ZSSR(Zero Shot Super-Resolution)
MZSR์ Meta-test ๋จ๊ณ์์ ํ์ฉํ๊ฒ๋ Zero-Shot Super Resolution์ ๋ํด ์ค๋ช ๋๋ฆฌ๋๋ก ํ๊ฒ ์ต๋๋ค. ZSSR ์์ ๋ง์๋๋ฆฐ SISR๊ณผ ๋ฌ๋ฆฌ ํ์ต ๋จ๊ณ์์ ์๊ธฐ ์์ ์ฆ internal infromation์ ํ์ตํฉ๋๋ค. ์๊ธฐ ์์ image๋ก๋ถํฐ ์ถ์ถ๋ HR-LR pair๋ฅผ ๋ง๋ค์ด ํ์ต์ ์งํํ๊ณ ์ด๋ ๊ฒ ํ์ต๋ ์ ๋ณด๋ฅผ ํ ๋๋ก ์๋ณธ์ LR๋ก ์ด์ฉํ์ฌ ํ๋ํ ๊ฒฐ๊ณผ ์ฆ ์์ธก์ ์งํํฉ๋๋ค. ๊ทธ๋ฌ๋ ํ๊ณ์ ์ผ๋ก๋ ํ ์ฅ์ ์ด๋ฏธ์ง์ ๋ํด์๋ง ํ์ต์ ํ๋ค๋ณด๋ ํ์ต ์๊ฐ์ด ๋ง์ด ํ์ํ๊ณ , ๋ค๋ฅธ ์ด๋ฏธ์ง์ ์ฌ์ฉ ์ด๋ ต๋ค๋ ์ ์ ๋ณธ ๋ ผ๋ฌธ์์ ์ง์ ํ๊ณ ์์ต๋๋ค.
Idea
์๊ธฐ ์์ image๋ก๋ถํฐ ์ถ์ถ๋ HR-LR pair๋ฅผ ๋ง๋ค์ด ํ์ต์ ์งํํ๊ณ ์ด๋ ๊ฒ ํ์ต๋ ์ ๋ณด๋ฅผ ํ ๋๋ก ์๋ณธ์ LR๋ก ์ด์ฉํ์ฌ ํ๋ํ ๊ฒฐ๊ณผ๋ฅผ ํ ๋๋ก ์์ธก์ ์งํํฉ๋๋ค. ๊ทธ๋ฌ๋ ํ๊ณ์ ์ผ๋ก๋ ํ ์ฅ์ ์ด๋ฏธ์ง์ ๋ํด์๋ง ํ์ต์ ํ๋ค๋ณด๋ ํ์ต์๊ฐ์ด ๋ง์ด ํ์ํ๊ณ , ๋ค๋ฅธ ์ด๋ฏธ์ง์ ์ ์ฉ์ด ์ด๋ ต๋ค๋ ์ ์ ๋ณธ ๋ ผ๋ฌธ์์ ์ง์ ํ๊ณ ์์ต๋๋ค. ๋ฐ๋ผ์ ์ด ๋ ผ๋ฌธ์์๋ ๋ด์ฉ์ MAML(Model-Agnostic Meta-Learning)์ ์ ์ฉ์ ์ ์ํฉ๋๋ค. MAML์ ์ ์ ํ ์ด๊ธฐ ๊ฐ์ค์น(weight)๋ฅผ ์ฐพ๊ธฐ ์ํ ๋ฐฉ๋ฒ์ ๋๋ค. ๋ค์ํ ์์ (task)์ ๋ํด์ ๋น ๋ฅด๊ฒ ์ ์ํ ์ ์๋ ๊ฐ์ค์น๋ฅผ ์ฐพ๋๋ฐ ๋์์ ์ฃผ๋ฉฐ, Fine-tuning์๋ ๋์์ ์ค ์ ์์ต๋๋ค.
3. Method
๊ทธ๋์ ์ด๋ฌํ CNN ๊ธฐ๋ฐ์ ๋ฐฉ๋ฒ๊ณผ ZSSR์ ํ๊ณ์ ์ ๊ทน๋ณตํ๊ณ ์ ๋ณธ ๋ ผ๋ฌธ์ MZSR์ ์ ์ํฉ๋๋ค. ์ ์ฒด์ ์ธ ํ๋ฆ์ ๋ณด์๋ฉด externel data๋ก large scale training๊ณผ meta transfer learning์ ์งํํฉ๋๋ค. ๊ทธ๋ฆฌ๊ณ Meta-Test ๋จ๊ณ์์๋ zero-shot super-resolution ๋ฐฉ๋ฒ์ ์ฌ์ฉํฉ๋๋ค.

Large-scale Training๋จ๊ณ์์๋ ๋ค์ํ ์ด๋ฏธ์ง๋ก๋ถํฐ ๊ณตํต์ ์ผ๋ก ์ฌ์ฉ๋๋ representation๋ค์ ํ์ตํ ์ ์๋๋ก ํฉ๋๋ค. natural image๋ค๋ก ๋ถํฐ ํน์ง๊ฐ๋ค์ ๋ฐ์์์ ํ์ฉํจ์ผ๋ก์จ ๋์ ์ฑ๋ฅ์ ๋ณด์ด๋๋ก ํฉ๋๋ค. ์์์ ๋ณด์๋ฉด ๋ฐ์ดํํฝ์ผ๋ก low resolution image๋ฅผ ๋ง๋ค์ด์ HR, LR pair๋ฅผ ๋ง๋ ๋ค L1๋ฅผ ์ฌ์ฉํด์ loss๋ฅผ ์ต์ํํ๋ ๋ฐฉํฅ์ผ๋ก training ์งํํฉ๋๋ค.

์ด์ Meta-Transfer Learning ๋จ๊ณ์ ๋๋ค. Meta learning์ ํ์ต์ ์ํ ํ์ต์ด๋ผ๊ณ ๋ ํฉ๋๋ค. ๋์ค์ ํ์ต์ด ์ ๋ ์ ์๋๋ก ํ๊ธฐ ์ํด์ ํน์ ํ ๊ฐ task๋ก ๋น ๋ฅด๊ฒ ํ์ต๋ ์ ์๋๋ก ๋ง๋๋ ๊ฒ์ ๋๋ค. ๋ค์ํ kernel condition์ ๊ฐ์ฅ sensitiveํ initial point๋ฅผ ์ฐพ๊ธฐ ์ํด transfer-learning๊ณผ optimaization ๊ธฐ๋ฐ์ meta-learning ๋ฐฉ๋ฒ ์ฆ MAML์์ฌ์ฉํฉ๋๋ค. ์ด์ ๊ฐ์ด task๊ฐ 3๊ฐ๊ฐ ์๋ค๊ณ ํ ๋ ๊ฐ๊ฐ task์ ๋ง๋ optimalํ weight๊ฐ์ ์ธํ1, ์ธํ2, ์ธํ3์ด ์๊ณ ๊ฐ ์๊ณ , ํ์ดํ ๋์ผ๋ก ๋๋ฌํ๊ฒ ๋๋ฉด ๊ฐ๊ฐ์ ๊ฐ์ค์น๋ก ๊ฐ๋ ๊ฐ task์ ๋ํ loss์ ๋ฐฉํฅ์ฑ์ ๊ตฌํ ์ ์์ต๋๋ค. Kernel distribution์ ์ํด์๋ Covariance matrix์ ์ฌ์ฉํ๋๋ฐ์. ์ฒ์ ๊ดํธ๋ rotation matrix๋ก ์ธํ๋งํผ ์ด๋ฏธ์ง๋ฅผ ํ์ ํฉ๋๋ค. ๊ทธ๋ฆฌ๊ณ ๋๋ค ํ๋ผ๋ฏธํฐ๋ฅผ ์ฌ์ฉํ์ฌ ๋ธ๋ฌ์ฒ๋ฆฌ๋ฅผ ์ํํฉ๋๋ค. ๊ทธ๋ฆฌ๊ณ ๋ค์ ์ธํ๋งํผ ๋ฐ๋๋ก ํ์ ์ ์์ผ์ ์๋ณธ์ด๋ฏธ์ง๋ก ๋๋๋ฆด ์ ์๋๋ก ํฉ๋๋ค.

์ด์ ์ด meta-learner๋ฅผ train์ํต๋๋ค. Task-level Loss๋ฅผ ํตํด model parameter ๐๋ฅผ ์ ๋ฐ์ดํธํ๊ณ Test error๋ฅผ ์ต์ํํ๋ ๋ฐฉํฅ์ผ๋ก optimization์ ์งํํฉ๋๋ค.

๊ทธ ๋ค์์ Meta-Test ๋จ๊ณ์ ๋๋ค. ์ด๋ ์์ ์ค๋ช ๋๋ฆฐ Zero-shot super learning ๋ฐฉ์๊ณผ ๋์ผํ๊ฒ single image ๋ด์์ internal information์ ํ์ตํ๋ ๊ฑธ ์ ๊ทธ๋ฆผ์์ ๋ณด์ค ์ ์์ต๋๋ค.

์์ ์ค๋ช ๋๋ฆฐ Meta-Transfer Learning๊ณผ Meta-Test์ ์๊ณ ๋ฆฌ์ฆ์ ๋๋ค. Meta-Transfer Learning ์๊ณ ๋ฆฌ์ฆ์ ๋ณด์๋ฉด Data(D)๊ฐ ์์ ๋ ๋ LR๊ณผ HR batch๋ฅผ ๋ง๋ ๋ค์ L1 Loss๋ฅผ ์ด์ฉํด์ Training์ ์งํํฉ๋๋ค. ๊ทธ๋ฆฌ๊ณ task distridution ๋ด ๊ฐ task์ ๋ํด ๋์ค์ ํ์ต์ ์งํํ์ ๋ ํ์ต์ด ๋นจ๋ฆฌ ๋ ์ ์๋๋ก meta-learning์ ์งํํฉ๋๋ค. ๋ง์ง๋ง์ผ๋ก meta-learn์ optimizationํฉ๋๋ค. Meta-Test ๋จ๊ณ์์๋ ํ๋์ ์ด๋ฏธ์ง๊ฐ ๋ค์ด์์ ๋ ๊ฐ kernel์ ๋ง๊ฒ meta-learning์ด ๋ ๊ฐ์ค์น ๊ฐ์ ๋น ๋ฅด๊ฒ update ์ํต๋๋ค. ์ด๋ฐ ๊ณผ์ ์ ํตํด SR์ด๋ฏธ์ง๋ฅผ return ํ๋ ๊ฑธ ๋ณด์ค ์ ์์ต๋๋ค.
4. Experiment & Result
๋ฐ์ดํ๋น ์ผ๋ก ๋ค์ด์ํ๋ง๋ ๋ฐ์ดํฐ์ ์ ์คํ ๊ฒฐ๊ณผ์ ๋๋ค. ์๋ฌด๋๋ ๋ฐ์ดํ๋น ๋ค์ด์ํ๋ง์ ์งํํ๊ธฐ ๋๋ฌธ์ ๋ค๋ฅธ ๋ชจ๋ธ๊ณผ ๋น๊ตํ์ ๋ MZSR์ด ๋น๊ต์ ๋ฎ์ ์ฑ๋ฅ์ ๋ณด์ด๋ ๋ฐ์ดํฐ์ ์ด ์์ง๋ง 1-10๋ฒ์ ์ ๋ฐ์ดํธ๋ง์ผ๋ก ์ ์ฌํ ์ฑ๋ฅ์ ๋ผ ์ ์์์ ์ ์ ์์ต๋๋ค.
ํด๋น ํ ์ด๋ธ์ ๋ค์ํ ์ปค๋์ ์ฌ์ฉํ ์คํ ๊ฒฐ๊ณผ์ ๋๋ค. ๋นจ๊ฐ์์ด 1์, ํ๋์์ด 2์ ๊ฒฐ๊ณผ์ธ๋ฐ, ๋๋ถ๋ถ unsupervised ๋ฐฉ๋ฒ์ด ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์ด๋ฉฐ MZSR์ ๊ฒฝ์ฐ 10๋ฒ๋ง ์ ๋ฐ์ดํธํ ์คํ๊ฒฐ๊ณผ์์๋ ๋๋ถ๋ถ 1, 2์๋ฅผ ์ฐจ์งํ ๊ฒ์ ์ ์ ์์ต๋๋ค.
์ด๋ฌํ ์์น๋ฅผ ์๊ฐํํ ๊ฒฐ๊ณผ์ ๋๋ค. MZSR์ 10๋ฒ๋ง ์ ๋ฐ์ดํธ ํ์์๋ ์ฐ์ํ ๋ณต์ ์ฑ๋ฅ์ ๋ณด์ด๋ ๊ฒ์ ํ ์ ์์ต๋๋ค.
์ฌ๊ธฐ๋ ๋ง์ฐฌ๊ฐ์ง๋ก ํด๋น ์ปค๋ condition์์๋ MZSR์ 10๋ฒ๋ง ์ ๋ฐ์ดํธ ํ์์๋ ์ฐ์ํ ๋ณต์ ์ฑ๋ฅ์ ๋ณด์ด๊ณ ์์์ ์ ์ ์์ต๋๋ค.
Experimental setup
Dataset์ผ๋ก๋ Set5, BSD100, Urban100์ ์ ํด์๋๋ก ๋ณํํ ์ด๋ฏธ์ง, ๊ทธ๋ฆฌ๊ณ ์๋ณธ์ ์ด์ฉํ์ต๋๋ค.
๋น๊ต๋์์ผ๋ก๋ Bicubic, CARN, RCAN, ZSSR์ ์ด์ฉํ์์ต๋๋ค.
Training ์ธํ ์ ฮฑ = 0.01 and ฮฒ = 0.0001 ์ผ๋ก ์ค์ ํ์์ต๋๋ค.
๊ฒฐ๊ณผ๋ YCbCr color ๊ณต๊ฐ์ Y channel์์ PSNR(dB)๊ณผ SSIM์ ํ๊ท ์ ๋ธ ๊ฐ์ผ๋ก ํ๊ฐ๋ฉ๋๋ค. ๋นจ๊ฐ์์ ์ต์์ ๊ฒฐ๊ณผ๋ฅผ ๋ํ๋ด๊ณ ํ๋์์ ์ฐจ์ ์ ๋ํ๋ ๋๋ค. ๋ํ ๊ดํธ ์์ ์ซ์๋ ์ด ๋ ผ๋ฌธ์์ ์ ์ํ๋ MZSR๋ฐฉ๋ฒ์ ๊ทธ๋ ์ด๋์ธํธ ์ ๋ฐ์ดํธ์ ์๋ฅผ ๋ํ๋ ๋๋ค.
Result

MZSR์ ๊ฒฝ์ฐ ํ ๋ฒ์ gradient update๋ง์ผ๋ก ๋์ ์ฑ๋ฅ์ ๋ณด์์ ์์ ์ธ๊ธํ์ต๋๋ค. ๊ทธ๋ฆผ์ ๋ณด์๋ฉด initial point์์๋ ๊ฐ์ฅ ์ ์ข์ ์ฑ๋ฅ์ ๋ณด์ด๋ ๊ฒ์ ์ ์ ์์์ต๋๋ค. ๊ทธ๋ฌ๋ ์ด์ ๊ฐ์ด 1๋ฒ์ ์ ๋ฐ์ดํธ๋ง์ผ๋ก ๋ค๋ฅธ pre-trained network์ผ๋ก ๋ณต์๋ ์ด๋ฏธ์ง๋ณด๋ค ์ข์ ์ฑ๋ฅ์ ๋ผ ์ ์์์ ํ์ธํ ์ ์๋๋ฐ์, ์ด๋ ์ผ๋ง๋ MZSR์ด ๋น ๋ฅธ ์ ์ ๋ฅ๋ ฅ์ด ์๋์ง ์ ์ ์์ต๋๋ค.
๋ํ, MZSR์ ์๊ธฐ ์์ ์ผ๋ก๋ถํฐ ํ์ต์ ์งํํ๊ธฐ ๋๋ฌธ์ ์ค๋ฅธ์ชฝ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด multi-scale recurrent patterns์ ๊ฐ์ง ์ด๋ฏธ์ง์์๋ ์ข์ ์ฑ๋ฅ์ ๋ณด์ด๋ ๊ฒ์ ์ ์ ์์ต๋๋ค
5. Conclusion
๋ณธ ๋ ผ๋ฌธ์์๋ ์ธ๋ถ ์ํ๊ณผ ๋ด๋ถ ์ํ์ ๋ชจ๋ ํ์ฉํ์ฌ ๋น ๋ฅด๊ณ ์ ์ฐํ๋ฉฐ ๊ฐ๋ฒผ์ด ์์ฒด ๊ฐ๋ ์ดํด์๋ ๋ฐฉ๋ฒ์ ์ ์ํ์์ต๋๋ค. ๊ตฌ์ฒด์ ์ผ๋ก, ๋ณธ ๋ ผ๋ฌธ์์๋ Blur kernal์ ๋ค์ํ ์กฐ๊ฑด์ ๋ฏผ๊ฐํ ์ด๊ธฐ ๊ฐ์ค์น๋ฅผ ์ฐพ๊ธฐ ์ํด Transfer Learning๊ณผ ํจ๊ป ์ต์ ํ ๊ธฐ๋ฐ Meta Learning์ ์ด์ฉํฉ๋๋ค. ๋ฐ๋ผ์ ๋ณธ ๋ ผ๋ฌธ์์์ ๋ฐฉ๋ฒ์ ๋ช ๊ฐ์ง ๊ทธ๋ผ๋ฐ์ด์ ์ ๋ฐ์ดํธ ๋ด์์ ํน์ ์ด๋ฏธ์ง ์กฐ๊ฑด์ ๋น ๋ฅด๊ฒ ์ ์ํ ์ ์๋ค๋ ๊ฒ์ด ์ฅ์ ์ ๋๋ค. ๊ด๋ฒ์ํ ์คํ์ ํตํด MZSR์ด ์์ฒ ๋ฒ์ ๊ฒฝ์ฌ ํ๊ฐ ๋ฐ๋ณต์ด ํ์ํ ZSSR์ ํฌํจํ ๋ค๋ฅธ ๋ฐฉ๋ฒ๋ณด๋ค ์ฐ์ํ๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋๋ค. ๋ค๋ง ๋คํธ์ํฌ ๋คํธ์ํฌ ๋ชจํ, ํ์ต ์ ๋ต, multi-scale ๋ชจ๋ธ ๋ฑ ์์ ์์ ๊ฐ์ ํ ๋ถ๋ถ์ด ๋ง์ ๊ฒ์ผ๋ก ๋ณด์ ๋๋ค.. ๊ฒฐ๋ก ์ ์ผ๋ก MZSR์ internal๊ณผ external ์ํ์ ๋ชจ๋ ์ฌ์ฉํ์ฌ ์ ์ ์ ๋ฐ์ดํธ๋ก๋ง์ผ๋ก ํด์๋ ๋ณต์์ ์ํํ๊ฒ ํ๋ ๋น ๋ฅด๊ณ flexibleํ ๋ฐฉ๋ฒ์ด๋ผ๊ณ ๋ง์๋๋ฆด ์์์ต๋๋ค.
Take home message (์ค๋์ ๊ตํ)
์กฐ๊ธ ๋ ์ฐฝ์์ ์ธ ์๊ฐ์ ํ ์ ์๋ ์ฌ๋์ด ๋์.
Transfer learning๊ณผ Meta learning์ ์กฐํฉ์ ๋ค๋ฅธ ๋ถ์ผ๋ก ์ฐ๊ฒฐ๋ ์ ์์๋งํผ ๊ทธ ์ํฅ๋ ฅ์ด ๋ง์คํ๋ค.
Author / Reviewer information
Author
๋ฐฑ์ ์ฝ (Jeongyeop Baek)
M.S. student, Civil & Engineering Department, KAIST (Advisor: Seongju Chang)
Interested in occupant-centric HVAC control based on individual thermal comfort
jungyubaik@kaist.ac.kr
https://baekkkkk96.tistory.com/
Reviewer
Korean name (English name): Affiliation / Contact information
Korean name (English name): Affiliation / Contact information
...
Reference & Additional materials
Jae Woong Soh, Sunwoo Cho, Namik Cho. Meta-Transfer Learning for Zero-shot Super Resolution. In CVPR, 2020.
Official GitHub repository : https://www.github.com/JWSoh/MZSR.
Eirikur Agustsson and Radu Timofte. Ntire 2017 challenge on single image super-resolution: Dataset and study. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Workshops, pages 126โ135, 2017.
Namhyuk Ahn, Byungkon Kang, and Kyung-Ah Sohn. Fast, accurate, and lightweight super-resolution with cascading residual network. In Proceedings of the European Conference on Computer Vision(ECCV), pages 252โ268, 2018.
Antreas Antoniou, Harrison Edwards, and Amos Storkey. How to train your maml. In ICLR, 2019.
Last updated