Local Implicit Image Function [Kor]
Chen et al. / Learning Continuous Image Representation with Local Implicit Image Function / CVPR 2021
English version of this article is available.
๐ 1. Problem Definition
Image as a Function
Image Representation์ ๋ํ ๊ธฐ์ด๋ ์ด๋ฏธ์ง๋ฅผ ํจ์๋ก ๋ํ๋ด๋๋ฐ์ ์์ํฉ๋๋ค. ํจ์๋ ์ ๋ ฅ์ ๋ฃ์ผ๋ฉด ๋ฌด์ธ๊ฐ ๊ฐ์ ๋ฐํํด์ฃผ๋ ๊ฑฐ์ฃ . ์ ๋ฐ๋ผ์ ์ ๊ฐ์ด ๋ฐ๋๋๋ฐ, Figure 1์ ๋คํญํจ์, ์ง์ํจ์, ์ผ๊ฐํจ์์ฒ๋ผ ์ฌ์ธ ์๋ ์๊ณ , ์๋๋ฉด Figure 2 ์ฒ๋ผ ๋ฌด์ง ๋ณต์กํ ์๋ ์์ต๋๋ค.


๋จ์ํ ํํ์ ํจ์๋ ํจ์์์ ์ ์ถํ๊ธฐ ์ฝ์ต๋๋ค.
์ด๋ฏธ์ง์ฒ๋ผ ๊ฐ ํฝ์น ์์น์ ๋ํด์ RGB๊ฐ์ด ๋ค์ํ ๊ฒฝ์ฐ, ์์น๊ฐ ์ฃผ์ด์ก์ ๋, R,G,B๋ฅผ ๋งตํํ๋ ํจ์๋ฅผ ์ฐพ๋ ๊ฒ์ ์ด๋ ค์ต๋๋ค.
Image -> Function : ์ด๋ฏธ์ง๋ ํฝ์ ์ขํ์ ๋ํด์ RGB ๊ฐ์ ๋ฐํํ๋ ํจ์๋ก ์๊ฐํ ์ ์์ต๋๋ค. Figure 2 ์ฒ๋ผ ์ด๋ฏธ์ง ํจ์๋ ํ๋์ ๋ด๋ ๊ต์ฅํ ๋ณต์กํ๊ณ , ์ฌ๊ธฐ์ ๋ง๋ ๋คํญํจ์๋ ํจ์๋ฅผ ์ฐพ๋ ๊ฒ์ ๋ถ๊ฐ๋ฅ์ ๊ฐ๊น์ต๋๋ค. ๊ทธ๋ฌ๋ฏ๋ก ์ด๋ฏธ์ง์ ๊ฐ์ ๋์์ํค๋ ํจ์๋ฅผ ์ฐพ๋ ๊ฒ์ ๊ฒฐ์ฝ ์ฌ์ด ๊ฒ ์๋๊ณ , ์ด๋ฅผ ์ธ๊ณต์ ๊ฒฝ๋ง์ผ๋ก ํ์ตํ๋ ค๋ ์๋๊ฐ ์์์ต๋๋ค. ์ด ๋ถ์ผ๋ฅผ Neural Implicit Represenation (NIR) ์ด๋ผ๊ณ ํฉ๋๋ค.
Why we need NIR??
๊ตณ์ด ์ด๋ฏธ์ง๋ฅผ ํจ์๋ก ํ์ต์ํค๋ ๋ชฉ์ ์ ๋ค์๊ณผ ๊ฐ์ด 2๊ฐ์ง๊ฐ ์์ต๋๋ค.
Neural Network์ ํ๋ผ๋ฏธํฐ ์๊ฐ ์ด๋ฏธ์ง ๋ฐ์ดํฐ ์ฌ์ด์ฆ๋ณด๋ค ์๋ค๋ฉด ๋ฐ์ดํฐ ์์ถํจ๊ณผ๊ฐ ์์ต๋๋ค.
์ด๋ฏธ์ง๋ ๊ธฐ๋ณธ์ ์ผ๋ก Discrete (Pixel 1, Pixel 2, ...) ์ธ๋ฐ, ์ฐ์์ ์ธ ํจ์๋ก ๋ํ๋์ผ๋ก์จ ํฝ์ ์ฌ์ด์ ์์น์ ๋ํ RGB๋ฅผ ์ ์ ์์ต๋๋ค. (โญ)
ํฌ์คํ ์์ ์๊ฐํ๋ ๋ ผ๋ฌธ๋ CVPR 2021์ ์ถํ๋ NIR ๊ด๋ จ ๋ ผ๋ฌธ์ผ๋ก (โญ) ๋ ๋ฒ์งธ ๋ชฉ์ (Continuous Representation)์ ๋ค๋ค์ต๋๋ค.๋ณธ ํฌ์คํ ์ ๋ ผ๋ฌธ์ ๋ ๊ฐ์ง contribution์ ์ค๋ช ํฉ๋๋ค.
Discrete Image๋ฅผ Continuous ํ ์ด๋ฏธ์ง ํํ์ผ๋ก ํ์ต์ํค๋ ๋ฐฉ๋ฒ
Continuous Representation์ ํตํด ๋ ๋์ Resolution์ ๋ง๋๋ ๋ฐฉ๋ฒ
๐ 2. Local Implicit Image Function (LIIF)
Definition
ํฝ์ ์ ๋ํด์ RGB ๊ฐ์ ์ ์ถํ๋ ํจ์๋ ๋ก ๋ํ๋ผ ์ ์์ต๋๋ค. ๋ชจ๋ธ์ ํฝ์ ์์น ์ ๋ณด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก RGB๊ฐ(ํน์ Grey scale)์ ์ ์ถํฉ๋๋ค. ์ ์ํ ๋ชจ๋ธ์ธ Local Implicit Image Function(LIIF) ๋ Latent Code๋ฅผ ์ด์ฉํ์ฌ Image ์ ๋ํ ์ ๋ณด ๊ฐ ์์ ๋, ์ด๋ฅผ Continuous image ๋ก ํ์ต์ํค๋ ๊ฒ์ ๋ชฉ์ ์ผ๋ก ํฉ๋๋ค. ์์น ์ ๋ณด ๋ฟ๋ง ์๋๋ผ, Latent Code์๋ ์์กด์ํจ LIIF์ ๋ชจ๋ธ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
: ํ๋์ ํฝ์ ์ ๋ํ RGB ๊ฐ
: Continuous space์์ ์์น
: Latent Code
:neural network , neural network์ ํ๋ผ๋ฏธํฐ
Latent Code for continuous position
Latent Code๋ ์ด๋ฏธ์ง๊ฐ ์์ ๋, ๊ฐ ํฝ์ ๋ง๋ค Latent Code๊ฐ ์์ต๋๋ค. ๋ฐ๋ผ์ ์ ์ฒด ๊ฐ์ Latent Code๊ฐ ์์ต๋๋ค. ์ด๋ฆ์ด Latent Code์ธ ์ด์ ๋, ๊ฐ Low Resolution ์ด๋ฏธ์ง์ ๋ํ ํฌ๊ธฐ์ด๊ธฐ ๋๋ฌธ์, ์๋ ์ด๋ฏธ์ง๋ณด๋ค ํฝ์ ์๊ฐ ์ ๊ธฐ ๋๋ฌธ์ ๋๋ค. ์ด๋ก๋ถํฐ ์ํ๋ continuous ์์น ๊ฐ ์์ ๋, ๊ฐ๊น์ด Latent code๋ฅผ ์ ํํด์ฃผ๋ฉด ๋ฉ๋๋ค. Figure 4์์๋ ์์น์ ๋ํด์ 1๊ฐ๊ฐ ์๋ 4 ๊ฐ์ Latent Code๋ฅผ ์ ํํ์๋๋ฐ, ์ด๋ฅผ ๋ ผ๋ฌธ์์๋ Local ensemble์ด๋ผ๊ณ ๋ถ๋ฆ ๋๋ค. ์ด๋ฅผ ์ฌ์ฉํ๋ ์ด์ ๋ 4.3 ์์ ๋ค๋ฃจ๊ฒ ์ต๋๋ค.


์ ์ฒด 4x4 Pixel์ด ์์ ๋, Latent Code๋ 4x4 ๊ฐ๊ฐ ๊ฐ ์์น๋ณ๋ก ๊ณ ๋ฅด๊ฒ ๋ถํฌ๋์ด ์์ต๋๋ค.
continuous ํ ์์น ์ ๋ํด์ ๋ ์์ ๊ฐ๊น์ด 4๊ฐ์ Latent Code๋ก ์ ํด์ง๋๋ค.
Continuous Representation using Latent Code
์ด๋ฏธ์ง์ ๋ํ Latent Code๊ฐ ๊ณ ์ ๋์ด ์์ผ๋ฏ๋ก ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก Continuous Image์ ์ขํ์ ๋ํ RGB ๊ฐ์ Latent Code์ ์์น ์ ์ ์ฐจ์ด๋ฅผ ์ ๋ ฅ์ผ๋ก ๋ฃ์ด์ ๊ณ์ฐ๋ฉ๋๋ค. Latent code์ ์๋์์น๋ฅผ ๋ฃ๋ continous representation์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
: ํ๋์ ํฝ์ ์ ๋ํ RGB ๊ฐ
: Continuous space์์ ์์น
: Latent Code
:neural network , neural network์ ํ๋ผ๋ฏธํฐ
: ์ ์ ์ํด์ ์๊ธฐ๋ ์ฌ๊ฐํ์ ๋์ด
์ ๋ ฅ์ผ๋ก Latent Code์์ ๊ฑฐ๋ฆฌ ์ฐจ์ด๊ฐ ์ฃผ์ด์ง๊ธฐ ๋๋ฌธ์, continuous ํ ๊ฑฐ๋ฆฌ ์ฐจ์ด๋ฅผ ์ ๋ ฅ์ผ๋ก ๋ฃ๊ฒ ๋๋ค๋ฉด, ์ด๋ฏธ์ง์ ๋ํ continuous representation ์ ์ป๊ฒ ๋ฉ๋๋ค. Figure 5 ์์ ๋ํ๋๋ฏ์ด, ์ฐ์์ ์ธ ๋ค์ ๋ค์ํ๊ฒ ์ ํํ ์ ์๊ณ , continousํ ์๋์์น ๊ฐ์ด ๊ณ์ฐ๋ฉ๋๋ค.

๐ 3. Pipeline
์์์ Latent Code์ LIIF ํจ์์ ์๋ฏธ๋ฅผ ์ดํด๋ดค์ต๋๋ค. ์ฃผ์ด์ง ๋ฐ์ดํฐ์ ๋ํด์ ํด๋น ๋ชจ๋ธ์ ํ์ต์ํค๊ธฐ ์ํด์ ์ ์๋ Self-Supervised Learning ๋ฐฉ๋ฒ์ ์ ์ํ์์ต๋๋ค. ๋ฐ์ดํฐ์ ํ์ต ๋ฐฉ๋ฒ์ ๋ํด์ ์์๋ณด๊ฒ ์ต๋๋ค.
โ๏ธ Data Preparation ๋จ๊ณ
โ๏ธ Training ๋จ๊ณ
Data Preparation
Data Preparation์์๋ Down-sampling๋ ์ด๋ฏธ์ง(์ด๋ฏธ์ง์ ํฝ์ ์ ๊ฐ์)์ ์์ธกํ pixel ์์น ์ RGB ๊ฐ ์ ์ค๋นํฉ๋๋ค. Figure 6 ์ ๋ํ๋์๋ฏ์ด, ์ฃผ์ด์ง ์ด๋ฏธ์ง๋ฅผ Down-samplingํ์ฌ ํฌ๊ธฐ๋ฅผ ์ค์ด๊ณ ์ด ์ ๋ณด๋ก๋ถํฐ ์ฌ์ด์ฆ๊ฐ ํฐ ์๋ ์ด๋ฏธ์ง์ ํฝ์ ์ ๋ํ RGB๋ฅผ ์์ธกํฉ๋๋ค. ์ฆ, Higer resolution์ ํ๊ฒํ ํ์ฌ ํ์ตํ๊ณ ์ ํฉ๋๋ค. ํฝ์ ์ ๋ํ ๋ด์ฉ์ ๋ฐ์์ ์กฐ๊ธ ๋ ์์ธํ ์ค๋ช ํ๊ฒ ์ต๋๋ค.

Training
ํ์ตํ ๋๋ Down-sampling๋ ์ด๋ฏธ์ง()๋ฅผ pretrained encoder์ ๋ฃ์ด์ feature vector๋ฅผ ๋ฝ์์ค๋๋ค. ์ด ๊ฐ์ด Latent Code ์ญํ ์ ํ๋ฉฐ, pretrained encoder๋ ์ด๋ฏธ์ง์ ์ฌ์ด์ฆ๋ฅผ ๊ทธ๋๋ก ์ ์งํด์ค๋๋ค. Figure 7 ์ฒ๋ผ Data Preparation ๋จ๊ณ์์ ์ป์ ๊ณผ Latent Code๋ค์ LIIF model์ ๋ฃ์ด์ค์ผ๋ก์จ, ์ํ๋ RGB๊ฐ ์ ์์ธกํฉ๋๋ค. ์ดํ ์ค์ ๊ฐ๊ณผ Loss๋ก ๊ณ์ฐํด์ฃผ๋ฉด ํ์ต์ด ๋ฉ๋๋ค.
๐จ ์ธ์ฝ๋์ ์ญํ ์ ์ด๋ฏธ์ง ๊ฐ๋ณ์ ๋ํ Latent Code๋ฅผ ๋ฝ์๋ด๋ ๊ฒ ์ ๋๋ค. ๋ฐ๋ผ์ ๋ค์ํ ์ด๋ฏธ์ง ์ํ์ ๋ํ ํ์ต์ด ๊ฐ๋ฅํฉ๋๋ค. ๊ธฐ์กด์ NIR์ด ์ด๋ฏธ์ง ํ๋์ ๋ํด์ Fitting ํ๋ ๊ฒ๊ณผ ์ฐจ์ด๊ฐ ์์ต๋๋ค.

๐ง input์ ํฌ๊ธฐ๋ 48x48 ์ธ๋ฐ, 224x224 ๋ฅผ ์ป๋ ๋ฐฉ๋ฒ์ ๋ฌด์์ผ๊น?
๐ง input์ ํฌ๊ธฐ๋ 48x48 ์ธ๋ฐ, 224x224 ๋ฅผ ์ป๋ ๋ฐฉ๋ฒ์ ๋ฌด์์ผ๊น?
์ด๋ฏธ์ง์ size๊ฐ 48x48 ์ด๋ 224x224๋ก Resolution์ด ๋ค๋ฅผ์ง๋ผ๋, ๋ ์ด๋ฏธ์ง๋ ๋์ผํ ์ด๋ฏธ์ง๋ฅผ ๋ํ๋ด๊ณ ์์ต๋๋ค. ๋ฐ๋ผ์ ๋ ์ด๋ฏธ์ง๋ฅผ ๋ชจ๋ [0,1]x[0,1] ๋ก normalize ํ๋ค๋ฉด, ํฝ์ ํฌ๊ธฐ์ ์๊ด์๋ ์ด๋ฏธ์ง๋ฅผ ์ป์ ์ ์์ต๋๋ค.
๊ทธ๋์ Data Preparation ๋จ๊ณ์์๋ Ground Truth ์ด๋ฏธ์ง๋ก๋ถํฐ ์ํ๋ ์์น๊ฐ [0,224]์ ๋ฒ์๊ฐ ์๋ [0,1] ๋ฒ์์ ๋๋ค.
๐ 4. Additional Engineering
LIIF ๋ฐฉ๋ฒ์ ์ถ๊ฐ์ ์ธ ๋ฐฉ๋ฒ๋ค์ ํตํด์ ์ฑ๋ฅ์ ์ฌ๋ฆด ์ ์์ต๋๋ค. ์ฌ๊ธฐ์๋ ์ด 3๊ฐ์ ๋ฐฉ๋ฒ์ด ์ ์๋๋ฉฐ, ์ ๋ค ์ฌ์ฉํ์ ๋, ๊ฐ์ฅ ์ข์ ์ฑ๋ฅ์ ๋ณด์ ๋๋ค.
โ๏ธ Featuer Unfolding : Latent Code๋ฅผ ์ฃผ๋ณ 3x3 Latent Code ์ Concatenation
โ๏ธ Local Ensemble : continuous position ์ ๋ํด์ 4๊ฐ์ Latetn Code ์ ํ
โ๏ธ Cell Decoding : RGB๋ฅผ Predictionํ ๋, ์ํ๋ cell size ์ถ๊ฐ.
Feature Unfolding
Encoder๋ก๋ถํฐ ๋์จ Feature (Latent Code)์ ๋ํด์, ์ฃผ๋ณ 3x3์ ๋ํ concatenation์ ํจ์ผ๋ก์จ, ์์น์ ๋ํ ํํ๋ ฅ์ ๋์ ๋๋ค. ์ด ๊ฒฝ์ฐ, input์ dimesion์ ๋ํ size๋ 9๋ฐฐ ์ฆ๊ฐํ๊ฒ ๋ฉ๋๋ค.
Local Ensemble
๊ฑฐ๋ฆฌ ๊ธฐ๋ฐ์ผ๋ก Latent Code๋ฅผ ์ ํํ๋๋ฐ ํ ๊ฐ์ง ๋ฌธ์ ์ ์ด ์์ต๋๋ค. ๊ฑฐ๋ฆฌ ๊ธฐ๋ฐ์ผ๋ก ์ ํํ๊ฒ ๋๋ค๋ฉด Figure 8 ์ฒ๋ผ ๋ค์ Latent Code๋ก ๋์ด๊ฐ๊ฒ ๋๋ ์์ ์์ ๋ ์ฌ์ด์ ๊ฑฐ๋ฆฌ๊ฐ ๊ต์ฅํ ๊ฐ๊น์ธ์ง๋ผ๋ Latent Code๊ฐ ๋ค๋ฅผ ์ ์๋ค๋ ๊ฒ ์ ๋๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด์ Figure 9์ฒ๋ผ ์ฃผ๋ณ 4๊ฐ์ Latent Codes๋ฅผ ์ ํํ๋ ๋ฐฉ๋ฒ์ ๋๋ค.


๋ง์ผ ๊ฐ์ฅ ๊ฐ๊น์ด Latent Code ํ๋๋ง ๊ณ ๋ฅธ๋ค๋ฉด, ๋ฒ์๋ฅผ ๋์ด๊ฐ๋ฉด์ Latent Code๊ฐ ๊ธ๋ณํ๋ ํ์์ด ๋ํ๋ฉ๋๋ค.
์ฌ๋ถ๋ฉด์ ๋ํด์ ๊ฐ๊น์ด 4๊ฐ๋ฅผ ๊ณ ๋ฅธ๋ค๋ฉด ์ ํ์ ๋ํ ๋ฒ์๋ฅผ ๋์ด๊ฐ ๋ ์ ๋ฐ๋ง ๋ฐ๋๊ฒ ๋ฉ๋๋ค. ์ผ์ชฝ ์ ๋ํด์๋ ๊ฐ๊น์ด ์์น์ ์๋ Latent Code๊ฐ ์ ํ๋๋ฉฐ, ์ค๋ฅธ์ชฝ x์ ๋ํด์๋ ๊ฐ๊น์ด ์์น์ ์๋ ๊ฐ ์ ํ๋ฉ๋๋ค.
Cell Decoding
LIIF ๋ชจ๋ธ์ ์์น์ ๋ํ ์ ๋ณด์ ๊ทผ์ฒ Latent Code์ ์ ๋ณด๋ฅผ ์ค๋๋ค. ํ์ง๋ง ์ฐ๋ฆฌ๊ฐ ์ด๋ ์ ๋์ Resolution์ ๋ชฉํ๋ก ํ๋์ง ์๋ ค์ฃผ์ง ๋ชปํฉ๋๋ค. ์๋ฅผ ๋ค์ด์, ์์ ๋ก ํด์๋๋ฅผ ๋์ผ ๋, ์ขํ์ ๋ํ ์ ๋ณด๋ ์ฃผ์ง๋ง, ์ฐ๋ฆฌ๊ฐ ๋ชฉํ๋ก ํ๋ Decoding Cell์ ์ฌ์ด์ฆ๋ฅผ ์ฃผ์ง ๋ชปํฉ๋๋ค. ์์์์๋ ํด๋น ์์น๋ก๋ถํฐ ์ ํฌ๊ธฐ๋ฅผ ์ํ๋ค๋ ๊ฒ์ ์๋ ค์ค์ผ ํฉ๋๋ค. Cell Decoding์ ํฌํจํ LIIF ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค. ๊ธฐ์กด Pixcel๊ฐ์ Cell ํฌ๊ธฐ๋ฅผ ์ถ๊ฐ์ ์ผ๋ก ๋ถ์ฌ์ ์ ๋ ฅ์ผ๋ก ๋ฃ์ด์ค๋๋ค.
๐ 5. Experiments
High Resolution Benchmark
Figure 10 ์ High Resolution Benchmark์ธ DIV2K ๋ฐ์ดํฐ์ ์ ๋ํด์ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋๋ค. ์ฒซ ๋ฒ์งธ Row Group์ EDSR ์ธ์ฝ๋๋ฅผ, ๋ ๋ฒ์งธ Row Group์ RDN ์ธ์ฝ๋๋ฅผ ์ฌ์ฉํ ๊ฒฝ์ฐ๋ฅผ ๋ํ๋ ๋๋ค.
EDSR ์ ์ฌ์ฉํ ๊ฒฝ์ฐ, ๋ค๋ฅธ High Resolution ๋ฐฉ์๋ค๋ณด๋ค ๋ ๋์ ์ฑ๋ฅ์ ๋ณด์ ๋๋ค. ๋ํ Out-of-distribution์ ๋ํด์๋ ์ ์๋ ๋ชจ๋ธ์ด ๋์ฑ ๋์ ์ฑ๋ฅ์ ๋ณด์ ๋๋ค. ์ด๋ x1~x4๋ฐฐ๋ก high resolution์ ๋ง๋ค๋๋ก ํ์ตํ ๋ชจ๋ธ์ ๋ ๋์ resoltuion์ ์๊ตฌํ ๊ฒฝ์ฐ์ ๋๋ค. LIIF๋ชจ๋ธ์ด ๋ ๋์ ์ฑ๋ฅ์ ๋ณด์ด๋ ๊ฒ์ Latent code์ ์๋ ์์น๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์์ธกํ๊ธฐ ๋๋ฌธ์ผ๋ก ์ถ์ธกํฉ๋๋ค.
RDN ์ธ์ฝ๋๋ฅผ ์ฌ์ฉํ ๊ฒฝ์ฐ๋, in-distribution์ ๋ํด์ ๋น์ทํ ์ฑ๋ฅ์ ๋ณด์ด์ง๋ง ๋ง์ฐฌ๊ฐ์ง๋ก out-of-distribution์ ๋ํด์ ๋์ ์ฑ๋ฅ์ ๋ณด์ ๋๋ค.
๐ก ๊ฒฐ๊ณผ์ ์ผ๋ก LIIF ๋ชจ๋ธ์ ๋ ๋์ resolution์ ์๊ตฌํ๋ ๊ฒฝ์ฐ, ๋ค๋ฅธ ๋ชจ๋ธ์ ๋นํด์ ์๋ฑํ ์ฑ๋ฅ์ ๋ณด์ธ๋ค๋ ๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค.

Continuous Representation
Continuous Representation์ ์ ํ์ตํ๋ค๋ฉด ์ด๋ฏธ์ง๋ฅผ ํ๋ํ์ ๋๋ ๋๊ธฐ์ง ์๊ณ ์ ๋๋ก ๋ณด์ฌ์ผ ํฉ๋๋ค. ๋ค๋ฅธ NIR์ด๋ High resolution ๋ชจ๋ธ๋ค๊ณผ ๋น๊ตํ์ ๋, LIIF์ ์ด๋ฏธ์ง๋ ๋์ฑ ์ฐ์์ ์ธ ํํ๋ก ๋ํ๋๊ฒ ๋ฉ๋๋ค. ๋ค๋ฅธ ๋ชจ๋ธ๋ค์ด ์ฝ๊ฐ์ ๋๊ธฐ๋ ํ์์ด๋, Blur ํจ๊ณผ๊ฐ ์๋ ๋ฐ๋ฉด, LIIF ๋ชจ๋ธ์ ์์ฑ๋ ์ด๋ฏธ์ง๊ฐ ๊ต์ฅํ ๋ถ๋๋ฌ์ด ๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค.

๐ 6. Conclusion
์ด ๋ ผ๋ฌธ์์๋ ์ฐ์์ ์ธ ์ด๋ฏธ์ง ํํ์ ์ํ Local Implicit Image Function()์ ์ ์ํ์์ต๋๋ค. Latent code์ ์์น์์ ํน์ ์์น๊น์ง ๋จ์ด์ง ์ ์ RGB ๊ฐ์ ์ ์ถํจ์ผ๋ก์จ continuous image representation์ ๊ฐ๋ฅํ๊ฒ ๋ง๋ค์์ต๋๋ค. ๋ํ ์ด๋ฏธ์ง ๊ฐ๋ณ์ด ์๋, ์ด๋ฏธ์ง๋ฅผ pre-trained encoder๋ฅผ ์ฌ์ฉํ์ฌ ์ด๋ฏธ์ง์ ๋ํ feature vector๋ฅผ latent code์ ๊ธฐ๋ฐ์ผ๋ก ์ฌ์ฉํจ์ผ๋ก์จ, ๋ค์ํ ์ด๋ฏธ์ง์ ๋ํด ์ ์ฉ๊ฐ๋ฅํ Training ๊ธฐ๋ฒ์ ์ ์ํ์์ต๋๋ค.
์ด๋ฏธ์ง๋ ํฝ์ ์์น์ ๋ํด์ RGB ๊ฐ์ ๊ฐ์ง๊ธฐ ๋๋ฌธ์, ๋๋ฌด ํฐ ์ด๋ฏธ์ง๋ ๋ฐ์ดํฐ์ ์ฉ๋์ ๋ํ ์ด์๋ก ์ ์ฅํ๊ธฐ ์ด๋ ค์ด ์ ์ด ์์ต๋๋ค. ๋ง์ผ NIR์ด ๋์ฑ ๋ฐ๋ฌํ์ฌ, ํจ์ฌ ์ ์ ๋ชจ๋ธ๋ก ์ด๋ฏธ์ง๋ฅผ ์ธ์ธ ์ ์๋ ๋ชจ๋ธ์ด ์๋ค๋ฉด, ๋ฐ์ดํฐ ์ ์ก ์, ์ด๋ฏธ์ง๋ฅผ ๋ณด๋ด๋ ๊ฒ์ด ์๋๋ผ, Neural Network๋ฅผ ๋ณด๋ด๋ ๊ฒ๋ ํฅํ์๋ ๊ฐ๋ฅํ ๊ฒ ๊ฐ์ต๋๋ค.
Take Home Message
๋ณดํต Implicit Neural Represenation์ ์ฃผ์ด์ง ๋ฐ์ดํฐ๋ก๋ถํฐ ๋ฐ๋ก ํจ์๋ฅผ ํ์ต์ํค๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค. ๊ทธ๋์ ๋ฐ์ดํฐ๊ฐ ์์ ๋๋ง๋ค ํจ์๋ฅผ ์๋ก ํ์ตํด์ผ ํ์ฃ . ๋ฅ๋ฌ๋์ ์ด์ฉํ๋ฉด, ์ด๋ฏธ์ง๋ก๋ถํฐ Feature Vector๋ฅผ ๋ฝ์ ์ ์๊ธฐ์, Feature Vector๋ฅผ input์ผ๋ก ์ผ๋ฐํ์์ผ์ ํ์ต์ํค๋ ๊ฒ์ด ๊ฐ๋ฅํ ๊ฒ์ ์ด ๋ ผ๋ฌธ์์ ํ์ธํ ์ ์์์ต๋๋ค. ๋ํ Continuous Domain์ Feature๋ก๋ถํฐ ๊ฑฐ๋ฆฌ๋ก ํด์ํ ๊ฒ๋ ์ข์ ์ ๊ทผ๋ฒ์ ๋๋ค.
๐ Author / Reviewer information
Author
๋ฐ๋ฒ์ง (Bumjin Park): KAIST / bumjin@kaist.ac.kr
Reviewer
None
๐ฐ References & Additional materials
Last updated
Was this helpful?