MZSR [Kor]
Soh et al. / Meta-Transfer Learning for Zero-shot Super Resolution / CVPR 2020
Last updated
Soh et al. / Meta-Transfer Learning for Zero-shot Super Resolution / CVPR 2020
Last updated
Transfer Learning์ด๋ ์์ฃผ ํฐ ๋ฐ์ดํฐ์ ์ ํ๋ จ๋ ๋ชจ๋ธ์ ๊ฐ์ค์น๋ฅผ ๊ฐ์ง๊ณ ์์ ์ฐ๋ฆฌ๊ฐ ํด๊ฒฐํ๊ณ ์ ํ๋ ๊ณผ์ ์ ๋ง๊ฒ ์ฌ๋ณด์ ํด์ ์ฌ์ฉํ๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก ๋น๊ต์ ์ ์ ์์ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ง๊ณ ๋ ์ฐ๋ฆฌ๊ฐ ์ํ๋ ๊ณผ์ ๋ฅผ ํด๊ฒฐํ ์ ์๋ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ํ๋ จ์ํฌ ์ ์๋ ๊ฒ์ ๋๋ค.
Meta learning์ด๋ ํ์ต์ ๋ํ ํ์ต์ ๋งํฉ๋๋ค. ์ฒซ ๋ฒ์งธ๋ ํ์ต์ ์ํด ์ฃผ์ด์ง ๋ฐ์ดํฐ๋ก๋ถํฐ ํจํด์ด๋ ํน์ง์ ์ฐพ๊ณ ์๋ก์ด ๋ฐ์ดํฐ๊ฐ ์ฃผ์ด์ก์ ๋, ๊ทธ ํน์ง์ ์ฐพ๋ ๊ฒ์ ๋๋ค. ๋ ๋ฒ์งธ๋ ๋ชจ๋ธ์ ํ๋ จํ๋ learning๋ณด๋ค ํ ๋จ๊ณ ์์ธ, Hyper-parameter์ ๋ํด์ ์ ํฉํ ๊ฐ์ ์ฐพ๋ Learning์ ์งํํฉ๋๋ค.
๋ณธ ๋ ผ๋ฌธ์ MZSR(Meta-Transfer Learning for Zero-shot Super Resolution)์ ํ ์ฅ์ ์ฌ์ง์์ ์ฝ๊ฐ์ ์ ๋ฐ์ดํธ๋ง์ ์ํํ์ฌ ์ฐ์ํ ํด์๋ ๋ณต์ ์ฑ๋ฅ์ ๋ณด์ผ ์ ๋ฐฉ๋ฒ์ ๋๋ค. ํน์ง์ Transfer-learning๊ณผ Meta-learning์ ์ด๋ฌํ Zero-shot Super Resolution ๋ถ์ผ์ ์ฌ์ฉํ๋ค๋ ์ ์ธ๋ฐ์, ์ฐ์ Transfer learning์ ์ด์ฉํ์ฌ ๋ง์ ์์ ์ธ๋ถ ์ด๋ฏธ์ง๋ก๋ถํฐ ์ฌ์ ํ์ต๋ ๋ชจ๋ธ(pre-trained model)์ ์ด์ฉํ์ฌ ์ถ๊ฐ์ ์ผ๋ก Fine-tune์ ์งํํ ์ ์๋๋ก ํฉ๋๋ค. ๋ค๋ง, ์ด Fine-tune์ ์งํํ ๋, Meta-learning์ ์ด์ฉํด์ ๋ค์ํ ์ปค๋(kernel)์ ๋ํด์ ๋น ๋ฅด๊ฒ ์ ์ํ ์ ์๊ฒ๋ ํ๋ ๊ฒ์ด ํน์ง์ ๋๋ค. ์ด Meta-learning ๊ณผ์ ์ ๋ง์น๊ณ ๋๋ฉด, ์ด๋ค ์ด๋ฏธ์ง๊ฐ ์ฃผ์ด์ก์ ๋, ์ด๋ค internal data repetition ์ ๋ณด๋ฅผ ์ด์ฉํด์ ํ์ต์ ์งํํ๋ ๊ทธ๋ฐ Zero-shot ๊ธฐ๋ฐ์ผ๋ก ํ์ต์ด ๋์ํ ๋, ์ด์ ๊ฐ์ด ์ฝ๊ฐ์ ์ ๋ฐ์ดํธ๋ง์ ์ด์ฉํด๋ ๋น ๋ฅด๊ฒ ์๋ํ๋ ํน์ ์ปค๋์ ๋ง๋ ๊ทธ๋ฐ ๊ฐ์ค์น๋ฅผ ์ฐพ์์ ํ์ต์ ์งํํ๋ ๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค.
์ฆ ์ผ๋ฐ์ ์ผ๋ก ์ด ZSSR์ ํํ ์ฐ๋ฆฌ๊ฐ ์๊ณ ์๋ Zero-shot Super-resolution ๋ฐฉ๋ฒ์ธ๋ฐ์, ์ด๋ฐ ๊ฒฝ์ฐ์๋ ์๊ธฐ ์์ ์ด๋ฏธ์ง์ ๋ํด์ ์ฌ๋ฌ๋ฒ ํ์ต ๊ณผ์ ์ ๊ฑฐ์ณ์ผํ๊ธฐ ๋๋ฌธ์ ์ด๋ ๊ฒ ์ฝ 3000๋ฒ์ ์ ๋ฐ์ดํธ๊ฐ ํ์ํ๋ฐ์, ๋ณธ ๋ ผ๋ฌธ์์ ์ ์ํ๋ MZSR์ ์ด์ฉํ๊ฒ ๋๋ฉด, Transfer์ Meta-learning์ ์ฌ์ ์ ๋ฏธ๋ฆฌ ์ด์ฉํด๋๊ณ ์ค์ ๋ก meta-test ๊ณผ์ ์์ ๋จ์ํ ํ๋ฒ, ๊ทธ๋ฆฌ๊ณ ๋ง๊ฒ๋ 10๋ฒ ์ ๋์ ์ ๋ฐ์ดํธ๋ง ์ํํ๋๋ผ๋, ๊ฐ์ค์น๊ฐ ์ด ์ด๋ฏธ์ง์ ๋ง๊ฒ ์ ์ ํ๊ฒ ํน์ ์ปค๋์ ์ ๋ถํฉํ ์ ์๋๋ก ํ์ต์ด ๋๊ธฐ ๋๋ฌธ์, ์ ์ ์ ๋ฐ์ดํธ๋ง ๊ฐ์ง๊ณ ๋ ๋น ๋ฅด๊ฒ ๊ฐ์ค์น๋ฅผ ์ฐพ์ ์ ์์ด์ Zero-shot Super-resolution๋ฅผ ์ํ ๋ชจ๋ธ์ ๋น ๋ฅด๊ฒ ๋ง๋ค ์ ์๋ค๋ ๊ฒ์ด ์ฅ์ ์ ๋๋ค.
์ต๊ทผ์๋ CNN๊ธฐ๋ฐ์ ์ ๊ทผ๋ฐฉ๋ฒ์ด ๋์ ์ฑ๋ฅ์ ๋ณด์ด๊ณ ์์ด์ ๋ง์ด ์ฌ์ฉ๋๊ณ ์๋๋ฐ์, ์ด๋ ์ ํด์๋ ์ด๋ฏธ์ง๋ฅผ ๋คํธ์ํฌ์ ๋์ ํ์ฌ ๋์ ํด์๋๋ก ๋ฐํํ๋ ๋ฐฉ์์ผ๋ก ์ด๋ฃจ์ด์ง๋๋ค. ๋ฌผ๋ก , ์ด Neural Network์ ์ข ๋ฅ์ ๋ฐ๋ผ์ ์ ํด์๋์ ์ด๋ฏธ์ง๋ฅผ Bicubic ๋ฑ์ ์ด์ฉํ์ฌ ํฌ๊ธฐ๋ฅผ ํค์ด ๋ค์์ ์ด ์ด๋ฏธ์ง๋ฅผ Neural Network์ ๋ฃ์ด์ ๊ณ ํด์๋๋ก ๋ฐํํฉ๋๋ค. ์ด๋, ๊ณ ํด์๋ ์ด๋ฏธ์ง๋ค์ ํน์ kernal์ ์ด์ฉํ์ฌ Blur์ฒ๋ฆฌ๋ฅผ ํ๊ณ , Downsampling, Noise ์ถ๊ฐ ๊ณผ์ ์ ๊ฑฐ์ณ ์ ํด์๋๋ก ๋ง๋ค์ด์ Train data๋ก์จ ์ฌ์ฉํฉ๋๋ค. ๋ค๋ง, Downsampling ๊ณผ์ ์์ bicubic๊ณผ ๊ฐ์ ์ ์๋ ค์ง kernal๋ง์ ์ด์ฉํ๋ฉด non-bicubic ์ผ์ด์ค์ ๋ํ์ฌ ์ฑ๋ฅ์ด ๋จ์ด์ง๋ domain gap ๋ฌธ์ ๊ฐ ๋ฐ์ํ๊ฒ ๋ฉ๋๋ค.
์ด ๋ถ์ผ์ ๋ํด์ ๊ธฐ๋ณธ์ ์ธ ๋ด์ฉ๋ถํฐ ์๊ธฐ ์ํด์ SISR(Single Image Super-Resolution)์ ๋ํด์ ๋ง์๋๋ฆฌ๊ฒ ์ต๋๋ค. ์ด ๋ถ์ผ๋ ํ ์ฅ์ ์ ํด์๋ ์ด๋ฏธ์ง(LR)๊ฐ ํ ์คํธ ํ์์ ์ฃผ์ด์ก์ ๋, ์ด๋ฅผ ๊ณ ํด์๋ ์ด๋ฏธ์ง(HR)๋ก ๋ณํํ๋ ๋ฐฉ๋ฒ์ ๋ค๋ฃน๋๋ค. ํฝ์ ์ฌ๋ฌ๊ฐ์ง ๊ฐ๋ค์ด ์กด์ฌํ๋ค๊ณ ํ์ ๋, ์ด ํฝ์ ์ ์๋ฅผ ๋๋ฆฐ๋ค๊ณ ํ๋ฉด, ์ฆ ๊ณ ํด์๋์ ์ด๋ฏธ์ง๋ก ๋ฐ๋๋ค๊ณ ํ๋ฉด, ๋ค์ํ ๋ฐฉ๋ฒ(1D nearest-neighbor, Linear, Cubic, 2D nearest-neighbor, Bilinear, Bicubic)์ ์ด์ฉํ์ฌ ํฝ์ ๊ฐ์ ์์ฑํฉ๋๋ค. ์ฌ๊ธฐ์ Cubic์ 3์ฐจํจ์๋ฅผ ์ด์ฉํ๋ ๋ด์ฉ์ด๋ผ๊ณ ๋ณด์๋ฉด ๋ฉ๋๋ค. ๋ฐ๋ผ์ ๊ธฐ์กด์ ์กด์ฌํ๋ ๊ฐ๊ฐ์ sample ๊ฐ์ ์ฐธ๊ณ ํ์ฌ ์ด ์ค๊ฐ ์ง์ ์ ํฝ์ ๊ฐ์ ๊ฒฐ์ ํ๋ ๋ฐฉ์์ด ๊ฐ์ฅ ์ ํต์ ์ด๋ฉฐ ๋ง์ด ์ฌ์ฉ๋๋ ๋ฐฉ๋ฒ์ ๋๋ค.
MZSR์ Meta-test ๋จ๊ณ์์ ํ์ฉํ๊ฒ๋ Zero-Shot Super Resolution์ ๋ํด ์ค๋ช ๋๋ฆฌ๋๋ก ํ๊ฒ ์ต๋๋ค. ZSSR ์์ ๋ง์๋๋ฆฐ SISR๊ณผ ๋ฌ๋ฆฌ ํ์ต ๋จ๊ณ์์ ์๊ธฐ ์์ ์ฆ internal infromation์ ํ์ตํฉ๋๋ค. ์๊ธฐ ์์ image๋ก๋ถํฐ ์ถ์ถ๋ HR-LR pair๋ฅผ ๋ง๋ค์ด ํ์ต์ ์งํํ๊ณ ์ด๋ ๊ฒ ํ์ต๋ ์ ๋ณด๋ฅผ ํ ๋๋ก ์๋ณธ์ LR๋ก ์ด์ฉํ์ฌ ํ๋ํ ๊ฒฐ๊ณผ ์ฆ ์์ธก์ ์งํํฉ๋๋ค. ๊ทธ๋ฌ๋ ํ๊ณ์ ์ผ๋ก๋ ํ ์ฅ์ ์ด๋ฏธ์ง์ ๋ํด์๋ง ํ์ต์ ํ๋ค๋ณด๋ ํ์ต ์๊ฐ์ด ๋ง์ด ํ์ํ๊ณ , ๋ค๋ฅธ ์ด๋ฏธ์ง์ ์ฌ์ฉ ์ด๋ ต๋ค๋ ์ ์ ๋ณธ ๋ ผ๋ฌธ์์ ์ง์ ํ๊ณ ์์ต๋๋ค.
์๊ธฐ ์์ image๋ก๋ถํฐ ์ถ์ถ๋ HR-LR pair๋ฅผ ๋ง๋ค์ด ํ์ต์ ์งํํ๊ณ ์ด๋ ๊ฒ ํ์ต๋ ์ ๋ณด๋ฅผ ํ ๋๋ก ์๋ณธ์ LR๋ก ์ด์ฉํ์ฌ ํ๋ํ ๊ฒฐ๊ณผ๋ฅผ ํ ๋๋ก ์์ธก์ ์งํํฉ๋๋ค. ๊ทธ๋ฌ๋ ํ๊ณ์ ์ผ๋ก๋ ํ ์ฅ์ ์ด๋ฏธ์ง์ ๋ํด์๋ง ํ์ต์ ํ๋ค๋ณด๋ ํ์ต์๊ฐ์ด ๋ง์ด ํ์ํ๊ณ , ๋ค๋ฅธ ์ด๋ฏธ์ง์ ์ ์ฉ์ด ์ด๋ ต๋ค๋ ์ ์ ๋ณธ ๋ ผ๋ฌธ์์ ์ง์ ํ๊ณ ์์ต๋๋ค. ๋ฐ๋ผ์ ์ด ๋ ผ๋ฌธ์์๋ ๋ด์ฉ์ MAML(Model-Agnostic Meta-Learning)์ ์ ์ฉ์ ์ ์ํฉ๋๋ค. MAML์ ์ ์ ํ ์ด๊ธฐ ๊ฐ์ค์น(weight)๋ฅผ ์ฐพ๊ธฐ ์ํ ๋ฐฉ๋ฒ์ ๋๋ค. ๋ค์ํ ์์ (task)์ ๋ํด์ ๋น ๋ฅด๊ฒ ์ ์ํ ์ ์๋ ๊ฐ์ค์น๋ฅผ ์ฐพ๋๋ฐ ๋์์ ์ฃผ๋ฉฐ, Fine-tuning์๋ ๋์์ ์ค ์ ์์ต๋๋ค.
๊ทธ๋์ ์ด๋ฌํ CNN ๊ธฐ๋ฐ์ ๋ฐฉ๋ฒ๊ณผ ZSSR์ ํ๊ณ์ ์ ๊ทน๋ณตํ๊ณ ์ ๋ณธ ๋ ผ๋ฌธ์ MZSR์ ์ ์ํฉ๋๋ค. ์ ์ฒด์ ์ธ ํ๋ฆ์ ๋ณด์๋ฉด externel data๋ก large scale training๊ณผ meta transfer learning์ ์งํํฉ๋๋ค. ๊ทธ๋ฆฌ๊ณ Meta-Test ๋จ๊ณ์์๋ zero-shot super-resolution ๋ฐฉ๋ฒ์ ์ฌ์ฉํฉ๋๋ค.
Large-scale Training๋จ๊ณ์์๋ ๋ค์ํ ์ด๋ฏธ์ง๋ก๋ถํฐ ๊ณตํต์ ์ผ๋ก ์ฌ์ฉ๋๋ representation๋ค์ ํ์ตํ ์ ์๋๋ก ํฉ๋๋ค. natural image๋ค๋ก ๋ถํฐ ํน์ง๊ฐ๋ค์ ๋ฐ์์์ ํ์ฉํจ์ผ๋ก์จ ๋์ ์ฑ๋ฅ์ ๋ณด์ด๋๋ก ํฉ๋๋ค. ์์์ ๋ณด์๋ฉด ๋ฐ์ดํํฝ์ผ๋ก low resolution image๋ฅผ ๋ง๋ค์ด์ HR, LR pair๋ฅผ ๋ง๋ ๋ค L1๋ฅผ ์ฌ์ฉํด์ loss๋ฅผ ์ต์ํํ๋ ๋ฐฉํฅ์ผ๋ก training ์งํํฉ๋๋ค.
์ด์ Meta-Transfer Learning ๋จ๊ณ์ ๋๋ค. Meta learning์ ํ์ต์ ์ํ ํ์ต์ด๋ผ๊ณ ๋ ํฉ๋๋ค. ๋์ค์ ํ์ต์ด ์ ๋ ์ ์๋๋ก ํ๊ธฐ ์ํด์ ํน์ ํ ๊ฐ task๋ก ๋น ๋ฅด๊ฒ ํ์ต๋ ์ ์๋๋ก ๋ง๋๋ ๊ฒ์ ๋๋ค. ๋ค์ํ kernel condition์ ๊ฐ์ฅ sensitiveํ initial point๋ฅผ ์ฐพ๊ธฐ ์ํด transfer-learning๊ณผ optimaization ๊ธฐ๋ฐ์ meta-learning ๋ฐฉ๋ฒ ์ฆ MAML์์ฌ์ฉํฉ๋๋ค. ์ด์ ๊ฐ์ด task๊ฐ 3๊ฐ๊ฐ ์๋ค๊ณ ํ ๋ ๊ฐ๊ฐ task์ ๋ง๋ optimalํ weight๊ฐ์ ์ธํ1, ์ธํ2, ์ธํ3์ด ์๊ณ ๊ฐ ์๊ณ , ํ์ดํ ๋์ผ๋ก ๋๋ฌํ๊ฒ ๋๋ฉด ๊ฐ๊ฐ์ ๊ฐ์ค์น๋ก ๊ฐ๋ ๊ฐ task์ ๋ํ loss์ ๋ฐฉํฅ์ฑ์ ๊ตฌํ ์ ์์ต๋๋ค. Kernel distribution์ ์ํด์๋ Covariance matrix์ ์ฌ์ฉํ๋๋ฐ์. ์ฒ์ ๊ดํธ๋ rotation matrix๋ก ์ธํ๋งํผ ์ด๋ฏธ์ง๋ฅผ ํ์ ํฉ๋๋ค. ๊ทธ๋ฆฌ๊ณ ๋๋ค ํ๋ผ๋ฏธํฐ๋ฅผ ์ฌ์ฉํ์ฌ ๋ธ๋ฌ์ฒ๋ฆฌ๋ฅผ ์ํํฉ๋๋ค. ๊ทธ๋ฆฌ๊ณ ๋ค์ ์ธํ๋งํผ ๋ฐ๋๋ก ํ์ ์ ์์ผ์ ์๋ณธ์ด๋ฏธ์ง๋ก ๋๋๋ฆด ์ ์๋๋ก ํฉ๋๋ค.
์ด์ ์ด meta-learner๋ฅผ train์ํต๋๋ค. Task-level Loss๋ฅผ ํตํด model parameter ๐๋ฅผ ์ ๋ฐ์ดํธํ๊ณ Test error๋ฅผ ์ต์ํํ๋ ๋ฐฉํฅ์ผ๋ก optimization์ ์งํํฉ๋๋ค.
๊ทธ ๋ค์์ Meta-Test ๋จ๊ณ์ ๋๋ค. ์ด๋ ์์ ์ค๋ช ๋๋ฆฐ Zero-shot super learning ๋ฐฉ์๊ณผ ๋์ผํ๊ฒ single image ๋ด์์ internal information์ ํ์ตํ๋ ๊ฑธ ์ ๊ทธ๋ฆผ์์ ๋ณด์ค ์ ์์ต๋๋ค.
์์ ์ค๋ช ๋๋ฆฐ Meta-Transfer Learning๊ณผ Meta-Test์ ์๊ณ ๋ฆฌ์ฆ์ ๋๋ค. Meta-Transfer Learning ์๊ณ ๋ฆฌ์ฆ์ ๋ณด์๋ฉด Data(D)๊ฐ ์์ ๋ ๋ LR๊ณผ HR batch๋ฅผ ๋ง๋ ๋ค์ L1 Loss๋ฅผ ์ด์ฉํด์ Training์ ์งํํฉ๋๋ค. ๊ทธ๋ฆฌ๊ณ task distridution ๋ด ๊ฐ task์ ๋ํด ๋์ค์ ํ์ต์ ์งํํ์ ๋ ํ์ต์ด ๋นจ๋ฆฌ ๋ ์ ์๋๋ก meta-learning์ ์งํํฉ๋๋ค. ๋ง์ง๋ง์ผ๋ก meta-learn์ optimizationํฉ๋๋ค. Meta-Test ๋จ๊ณ์์๋ ํ๋์ ์ด๋ฏธ์ง๊ฐ ๋ค์ด์์ ๋ ๊ฐ kernel์ ๋ง๊ฒ meta-learning์ด ๋ ๊ฐ์ค์น ๊ฐ์ ๋น ๋ฅด๊ฒ update ์ํต๋๋ค. ์ด๋ฐ ๊ณผ์ ์ ํตํด SR์ด๋ฏธ์ง๋ฅผ return ํ๋ ๊ฑธ ๋ณด์ค ์ ์์ต๋๋ค.
๋ฐ์ดํ๋น ์ผ๋ก ๋ค์ด์ํ๋ง๋ ๋ฐ์ดํฐ์ ์ ์คํ ๊ฒฐ๊ณผ์ ๋๋ค. ์๋ฌด๋๋ ๋ฐ์ดํ๋น ๋ค์ด์ํ๋ง์ ์งํํ๊ธฐ ๋๋ฌธ์ ๋ค๋ฅธ ๋ชจ๋ธ๊ณผ ๋น๊ตํ์ ๋ MZSR์ด ๋น๊ต์ ๋ฎ์ ์ฑ๋ฅ์ ๋ณด์ด๋ ๋ฐ์ดํฐ์ ์ด ์์ง๋ง 1-10๋ฒ์ ์ ๋ฐ์ดํธ๋ง์ผ๋ก ์ ์ฌํ ์ฑ๋ฅ์ ๋ผ ์ ์์์ ์ ์ ์์ต๋๋ค.
ํด๋น ํ ์ด๋ธ์ ๋ค์ํ ์ปค๋์ ์ฌ์ฉํ ์คํ ๊ฒฐ๊ณผ์ ๋๋ค. ๋นจ๊ฐ์์ด 1์, ํ๋์์ด 2์ ๊ฒฐ๊ณผ์ธ๋ฐ, ๋๋ถ๋ถ unsupervised ๋ฐฉ๋ฒ์ด ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์ด๋ฉฐ MZSR์ ๊ฒฝ์ฐ 10๋ฒ๋ง ์ ๋ฐ์ดํธํ ์คํ๊ฒฐ๊ณผ์์๋ ๋๋ถ๋ถ 1, 2์๋ฅผ ์ฐจ์งํ ๊ฒ์ ์ ์ ์์ต๋๋ค.
์ด๋ฌํ ์์น๋ฅผ ์๊ฐํํ ๊ฒฐ๊ณผ์ ๋๋ค. MZSR์ 10๋ฒ๋ง ์ ๋ฐ์ดํธ ํ์์๋ ์ฐ์ํ ๋ณต์ ์ฑ๋ฅ์ ๋ณด์ด๋ ๊ฒ์ ํ ์ ์์ต๋๋ค.
์ฌ๊ธฐ๋ ๋ง์ฐฌ๊ฐ์ง๋ก ํด๋น ์ปค๋ condition์์๋ MZSR์ 10๋ฒ๋ง ์ ๋ฐ์ดํธ ํ์์๋ ์ฐ์ํ ๋ณต์ ์ฑ๋ฅ์ ๋ณด์ด๊ณ ์์์ ์ ์ ์์ต๋๋ค.
Dataset์ผ๋ก๋ Set5, BSD100, Urban100์ ์ ํด์๋๋ก ๋ณํํ ์ด๋ฏธ์ง, ๊ทธ๋ฆฌ๊ณ ์๋ณธ์ ์ด์ฉํ์ต๋๋ค.
๋น๊ต๋์์ผ๋ก๋ Bicubic, CARN, RCAN, ZSSR์ ์ด์ฉํ์์ต๋๋ค.
Training ์ธํ ์ ฮฑ = 0.01 and ฮฒ = 0.0001 ์ผ๋ก ์ค์ ํ์์ต๋๋ค.
๊ฒฐ๊ณผ๋ YCbCr color ๊ณต๊ฐ์ Y channel์์ PSNR(dB)๊ณผ SSIM์ ํ๊ท ์ ๋ธ ๊ฐ์ผ๋ก ํ๊ฐ๋ฉ๋๋ค. ๋นจ๊ฐ์์ ์ต์์ ๊ฒฐ๊ณผ๋ฅผ ๋ํ๋ด๊ณ ํ๋์์ ์ฐจ์ ์ ๋ํ๋ ๋๋ค. ๋ํ ๊ดํธ ์์ ์ซ์๋ ์ด ๋ ผ๋ฌธ์์ ์ ์ํ๋ MZSR๋ฐฉ๋ฒ์ ๊ทธ๋ ์ด๋์ธํธ ์ ๋ฐ์ดํธ์ ์๋ฅผ ๋ํ๋ ๋๋ค.
MZSR์ ๊ฒฝ์ฐ ํ ๋ฒ์ gradient update๋ง์ผ๋ก ๋์ ์ฑ๋ฅ์ ๋ณด์์ ์์ ์ธ๊ธํ์ต๋๋ค. ๊ทธ๋ฆผ์ ๋ณด์๋ฉด initial point์์๋ ๊ฐ์ฅ ์ ์ข์ ์ฑ๋ฅ์ ๋ณด์ด๋ ๊ฒ์ ์ ์ ์์์ต๋๋ค. ๊ทธ๋ฌ๋ ์ด์ ๊ฐ์ด 1๋ฒ์ ์ ๋ฐ์ดํธ๋ง์ผ๋ก ๋ค๋ฅธ pre-trained network์ผ๋ก ๋ณต์๋ ์ด๋ฏธ์ง๋ณด๋ค ์ข์ ์ฑ๋ฅ์ ๋ผ ์ ์์์ ํ์ธํ ์ ์๋๋ฐ์, ์ด๋ ์ผ๋ง๋ MZSR์ด ๋น ๋ฅธ ์ ์ ๋ฅ๋ ฅ์ด ์๋์ง ์ ์ ์์ต๋๋ค.
๋ํ, MZSR์ ์๊ธฐ ์์ ์ผ๋ก๋ถํฐ ํ์ต์ ์งํํ๊ธฐ ๋๋ฌธ์ ์ค๋ฅธ์ชฝ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด multi-scale recurrent patterns์ ๊ฐ์ง ์ด๋ฏธ์ง์์๋ ์ข์ ์ฑ๋ฅ์ ๋ณด์ด๋ ๊ฒ์ ์ ์ ์์ต๋๋ค
๋ณธ ๋ ผ๋ฌธ์์๋ ์ธ๋ถ ์ํ๊ณผ ๋ด๋ถ ์ํ์ ๋ชจ๋ ํ์ฉํ์ฌ ๋น ๋ฅด๊ณ ์ ์ฐํ๋ฉฐ ๊ฐ๋ฒผ์ด ์์ฒด ๊ฐ๋ ์ดํด์๋ ๋ฐฉ๋ฒ์ ์ ์ํ์์ต๋๋ค. ๊ตฌ์ฒด์ ์ผ๋ก, ๋ณธ ๋ ผ๋ฌธ์์๋ Blur kernal์ ๋ค์ํ ์กฐ๊ฑด์ ๋ฏผ๊ฐํ ์ด๊ธฐ ๊ฐ์ค์น๋ฅผ ์ฐพ๊ธฐ ์ํด Transfer Learning๊ณผ ํจ๊ป ์ต์ ํ ๊ธฐ๋ฐ Meta Learning์ ์ด์ฉํฉ๋๋ค. ๋ฐ๋ผ์ ๋ณธ ๋ ผ๋ฌธ์์์ ๋ฐฉ๋ฒ์ ๋ช ๊ฐ์ง ๊ทธ๋ผ๋ฐ์ด์ ์ ๋ฐ์ดํธ ๋ด์์ ํน์ ์ด๋ฏธ์ง ์กฐ๊ฑด์ ๋น ๋ฅด๊ฒ ์ ์ํ ์ ์๋ค๋ ๊ฒ์ด ์ฅ์ ์ ๋๋ค. ๊ด๋ฒ์ํ ์คํ์ ํตํด MZSR์ด ์์ฒ ๋ฒ์ ๊ฒฝ์ฌ ํ๊ฐ ๋ฐ๋ณต์ด ํ์ํ ZSSR์ ํฌํจํ ๋ค๋ฅธ ๋ฐฉ๋ฒ๋ณด๋ค ์ฐ์ํ๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋๋ค. ๋ค๋ง ๋คํธ์ํฌ ๋คํธ์ํฌ ๋ชจํ, ํ์ต ์ ๋ต, multi-scale ๋ชจ๋ธ ๋ฑ ์์ ์์ ๊ฐ์ ํ ๋ถ๋ถ์ด ๋ง์ ๊ฒ์ผ๋ก ๋ณด์ ๋๋ค.. ๊ฒฐ๋ก ์ ์ผ๋ก MZSR์ internal๊ณผ external ์ํ์ ๋ชจ๋ ์ฌ์ฉํ์ฌ ์ ์ ์ ๋ฐ์ดํธ๋ก๋ง์ผ๋ก ํด์๋ ๋ณต์์ ์ํํ๊ฒ ํ๋ ๋น ๋ฅด๊ณ flexibleํ ๋ฐฉ๋ฒ์ด๋ผ๊ณ ๋ง์๋๋ฆด ์์์ต๋๋ค.
์กฐ๊ธ ๋ ์ฐฝ์์ ์ธ ์๊ฐ์ ํ ์ ์๋ ์ฌ๋์ด ๋์.
Transfer learning๊ณผ Meta learning์ ์กฐํฉ์ ๋ค๋ฅธ ๋ถ์ผ๋ก ์ฐ๊ฒฐ๋ ์ ์์๋งํผ ๊ทธ ์ํฅ๋ ฅ์ด ๋ง์คํ๋ค.
๋ฐฑ์ ์ฝ (Jeongyeop Baek)
M.S. student, Civil & Engineering Department, KAIST (Advisor: Seongju Chang)
Interested in occupant-centric HVAC control based on individual thermal comfort
jungyubaik@kaist.ac.kr
https://baekkkkk96.tistory.com/
Korean name (English name): Affiliation / Contact information
Korean name (English name): Affiliation / Contact information
...
Jae Woong Soh, Sunwoo Cho, Namik Cho. Meta-Transfer Learning for Zero-shot Super Resolution. In CVPR, 2020.
Official GitHub repository : https://www.github.com/JWSoh/MZSR.
Eirikur Agustsson and Radu Timofte. Ntire 2017 challenge on single image super-resolution: Dataset and study. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Workshops, pages 126โ135, 2017.
Namhyuk Ahn, Byungkon Kang, and Kyung-Ah Sohn. Fast, accurate, and lightweight super-resolution with cascading residual network. In Proceedings of the European Conference on Computer Vision(ECCV), pages 252โ268, 2018.
Antreas Antoniou, Harrison Edwards, and Amos Storkey. How to train your maml. In ICLR, 2019.