MipNerF [Kor]

(Description) Jonathan T. Barron et al. / Mip-Nerf - A Multiscale Representation for Anti-Aliasing Neural Radiance Fields / ICCV 2021

Mip-Nerf: A Multiscale Representation for Anti-Aliasing Neural Radiance Fields [Kor]

1. Problem definition

NeRF๋Š” ํ•œ ์žฅ๋ฉด์„ ๋‚˜ํƒ€๋‚ธ ์—ฌ๋Ÿฌ ๊ฐœ์˜ ์‚ฌ์ง„๋“ค์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•ด๋‹น ์žฅ๋ฉด์˜ 3์ฐจ์› ์ด๋ฏธ์ง€๋ฅผ ๋ณต์›ํ•˜๋Š” ๋ชจ๋ธ์ด๋‹ค. ์•„๋ž˜์˜ ์ˆ˜์‹์„ ํ†ตํ•ด์„œ ํ•ด๋‹น ๋ฌธ์ œ๋ฅผ ์ˆ˜ํ•™์ ์œผ๋กœ ์ •์˜ํ•  ์ˆ˜ ์žˆ๋‹ค.

Equation1: Mathematical description of 3D image reconstruction

์—ฌ๊ธฐ์„œ x, y, z๋Š” ๊ณต๊ฐ„ ์ƒ์—์„œ์˜ ์œ„์น˜๋ฅผ ๋œปํ•˜๋ฉฐ, theta์™€ phi๋Š” ํ•ด๋‹น ์œ„์น˜๋ฅผ ๋ฐ”๋ผ๋ณด๋Š” ๊ฐ๋„๋ฅผ ๋‚˜ํƒ€๋‚ธ๋‹ค. (r, g, b)๋Š” ๋ชจ๋ธ์— ์˜ํ•ด์„œ ์‚ฐ์ถœ๋˜๋Š” ๋ณต์›๋œ ์ด๋ฏธ์ง€์—์„œ์˜ ์ƒ‰์ƒ์„ ๋œปํ•˜๋ฉฐ, sigma๋Š” ๋ณต์›๋œ ์ด๋ฏธ์ง€์—์„œ์˜ ๋ฐ€๋„๋ฅผ ๋œปํ•œ๋‹ค.

์•„๋ž˜์˜ ๊ทธ๋ฆผ์„ ํ†ตํ•ด์„œ ์–ด๋–ป๊ฒŒ NeRF๊ฐ€ ์—ฌ๋Ÿฌ ๊ฐœ์˜ ๊ฐ๋„์—์„œ ์ฐ์€ ์‚ฌ์ง„์„ ๊ธฐ๋ฐ˜์œผ๋กœ 3์ฐจ์› ์ด๋ฏธ์ง€๋ฅผ ๋ณต์›ํ•˜๋Š”์ง€๋ฅผ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค.

Figure 1: Volumetric scene rendering using multiple images on different views

2. Motivation

์œ„์˜ ๊ทธ๋ฆผ์ฒ˜๋Ÿผ ํ•™์Šต๊ณผ ์‹œ์— ์‚ฌ์šฉํ•œ ์ด๋ฏธ์ง€๊ฐ€ ๊ฐ์ฒด๋กœ๋ถ€ํ„ฐ ๊ฐ™์€ ๊ฑฐ๋ฆฌ์—์„œ ์ฐํ˜€ ํ•ด์ƒ๋„๊ฐ€ ๊ฐ™์€ ์ƒํ™ฉ์ธ ๊ฒฝ์šฐ๋ฉด ๊ธฐ์กด์˜ NeRF ๋ฐฉ๋ฒ•๋ก ์ด ํšจ๊ณผ์ ์ด์ง€๋งŒ, ๊ทธ๋ ‡์ง€ ์•Š์€ ๊ฒฝ์šฐ 3์ฐจ์› ์ด๋ฏธ์ง€ ๋ณต์› ์‹œ ์•„๋ž˜์˜ ๊ทธ๋ฆผ์ฒ˜๋Ÿผ ์ด๋ฏธ์ง€๊ฐ€ ๊นจ์ง€๋Š” ํ˜„์ƒ์ด ๊ด€์ฐฐ๋œ๋‹ค. ์ผ๋ฐ˜์ ์œผ๋กœ ๊ฐ€๊นŒ์šด ๊ณณ์—์„œ ์ฐํžŒ ์ด๋ฏธ์ง€์˜ ๊ฒฝ์šฐ ํ๋ฆฟํ•˜๊ฒŒ ๋ณต์›๋˜๋ฉฐ, ๋จผ ๊ณณ์—์„œ ์ฐํžŒ ์ด๋ฏธ์ง€์˜ ๊ฒฝ์šฐ ๋ณต์›๋œ ์ด๋ฏธ์ง€๊ฐ€ ๋Š๊ธฐ๋Š” ํ˜„์ƒ(aliasing)์ด ๋ฐœ์ƒํ•œ๋‹ค.

Figure 2: (left) Rendered image with aliasing (right) Rendered image without aliasing

์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด์„œ ๋‹ค์–‘ํ•œ ๋ฐฉ๋ฒ•๋ก ์ด ์ œ์•ˆ๋˜์—ˆ์œผ๋ฉฐ, ๋ณธ ์—ฐ๊ตฌ์—์„œ๋Š” ์›๋ฟ”ํ˜•ํƒœ์˜ ๊ด‘์„ ์„ ํ•˜๋‚˜์˜ ํ”ฝ์…€์„ ๋Œ€์‘ํ•˜์˜€๊ณ , ํ™•๋ฅ ๋ถ„ํฌ ํ•จ์ˆ˜ ํ˜•ํƒœ์˜ ์—ฐ์†ํ•จ์ˆ˜๋กœ ํŠน์„ฑ(feature)์„ ํ‘œํ˜„ํ•จ์œผ๋กœ์จ ์ด๋ฅผ ํ•ด๊ฒฐํ•˜์˜€๋‹ค.

Mipmapping ๊ธฐ๋ฒ•์€ ์ด๋ฏธ์ง€๊ฐ€ ๋Š๊ธฐ๋Š” ํ˜„์ƒ์„ ๋ฐฉ์ง€ํ•˜๊ธฐ ์œ„ํ•œ pre-filtered ๊ธฐ๋ฐ˜ ์ „์ฒ˜๋ฆฌ ๋ฐฉ์‹์ด๋‹ค. ์ด ๊ธฐ๋ฒ•์€ ์—ฐ์†์ ์ธ ๊ณต๊ฐ„์— ๋Œ€ํ•ด์„œ ํŠน์„ฑ์„ ์‚ฐ์ถœํ•จ์œผ๋กœ์จ ์ด๋ฏธ์ง€ ๋ Œ๋”๋ง ์‹œ์— ์ด๋ฏธ์ง€๊ฐ€ ๋Š๊ธฐ๋Š” ํ˜„์ƒ์„ ๋ฐฉ์ง€ํ•  ์ˆ˜ ์žˆ๋‹ค. Mipmapping์—์„œ๋Š” ํ”ฝ์…€์„ ํ†ต๊ณผํ•˜๋Š” ๋‹จ์ผ ๊ด‘์„ ์ด ์•„๋‹Œ ์›๋ฟ”ํ˜•ํƒœ์˜ ๊ตฌ์กฐ๋ฅผ ํ•˜๋‚˜์˜ ํ”ฝ์…€์— ๋Œ€์‘์‹œ์ผœ์„œ ๊ณต๊ฐ„ ์˜์—ญ์˜ ํŠน์„ฑ(feature)์„ 3์ฐจ์› Gaussian ๋ถ„ํฌ๋กœ ๊ทผ์‚ฌํ•˜๋Š” ๋ฐฉ์‹์„ ์‚ฌ์šฉํ•œ๋‹ค. ์ด ์™ธ์—๋„ supersampling ๊ธฐ๋ฐ˜์œผ๋กœ ๋ Œ๋”๋ง ์‹œ์— ์—ฌ๋Ÿฌ ๊ฐœ์˜ ๊ด‘์„ ์„ ํ•˜๋‚˜์˜ ํ”ฝ์…€์— ๋Œ€์‘์‹œํ‚ด์œผ๋กœ์จ ํ•ด์ƒ๋„๋ฅผ ๋†’์ด๋Š” ๋ฐฉ์‹์„ ์ด์šฉํ•˜์—ฌ ์ด๋ฏธ์ง€ ๋Š๊น€ ํ˜„์ƒ์„ ๋ฐฉ์ง€ํ•˜๊ธฐ๋„ ํ•œ๋‹ค.

Pumarola et al.(2020)์˜ D-NeRF๋Š” 5์ฐจ์›์˜ ์ธํ’‹ ๋ฐ์ดํ„ฐ์— ์‹œ๊ฐ„ ์ฐจ์›์„ ๋”ํ•ด 6์ฐจ์› ์ธํ’‹ ๋ฐ์ดํ„ฐ๋ฅผ ์ด์šฉํ•˜์—ฌ 3์ฐจ์› ์ด๋ฏธ์ง€๋ฅผ ๋ณต์›ํ•˜๋ฏ€๋กœ์จ ์ •์ ์ธ ๊ฐ์ฒด ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ๋™์ ์ธ ๊ฐ์ฒด์˜ 3์ฐจ์› ์ด๋ฏธ์ง€๋ฅผ ๋ณต์›ํ•˜๋Š” ๋ฐ ์„ฑ๊ณตํ•˜์˜€๋‹ค. Martin-Brualla et al.(2020)์ด ์ œ์•ˆํ•œ NeRF-W๋Š” ๋ชจ๋ธ์„ ์„ธ ๊ฐœ์˜ ๋ชจ๋“ˆ๋กœ ๊ตฌ์„ฑํ•จ์œผ๋กœ์จ ์ธํ’‹ ๋ฐ์ดํ„ฐ์˜ ํ•ด์ƒ๋„๊ฐ€ ๋‹ค๋ฅธ ์ƒํ™ฉ์—์„œ๋„ 3์ฐจ์› ์ด๋ฏธ์ง€๋ฅผ ๋ณต์›ํ•˜๋Š”๋ฐ ์ข‹์€ ์„ฑ๋Šฅ์„ ๋ณด์ด๋„๋ก ํ•˜์˜€๋‹ค. ๊ทธ๋“ค์ด ์ œ์•ˆํ•œ ์„ธ๊ฐ€์ง€ ๋ชจ๋“ˆ์€ ์ฒซ๋ฒˆ์งธ๋Š” ์ผ์‹œ์ ์œผ๋กœ ์ด๋ฏธ์ง€๋ฅผ ๋ณต์›ํ•˜๋Š” ๋ชจ๋“ˆ, ๋‘๋ฒˆ์งธ๋Š” ์˜๊ตฌ์ ์œผ๋กœ ๋‚จ์•„์žˆ๋Š” ๋ชจ๋“ˆ, ๊ทธ๋ฆฌ๊ณ  ๋ณต์›์˜ ๋ถˆํ™•์‹ค์„ฑ์„ ๋‹ค๋ฃจ๋Š” ๋ชจ๋“ˆ์ด๋‹ค. ์ด๋ฅผ ํ†ตํ•ด์„œ ๋‹ค์–‘ํ•œ ํ˜•ํƒœ์˜ ์ธํ’‹ ์ด๋ฏธ์ง€๋ฅผ ์ด์šฉํ•˜๋”๋ผ๋„ 3์ฐจ์› ์ด๋ฏธ์ง€์˜ ๋ณต์› ์„ฑ๋Šฅ์ด ๋†’์•„์ง€๋Š” ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค.

Idea

๊ธฐ์กด์˜ NeRF ๋ชจ๋ธ์€ ํ•˜๋‚˜์˜ ๊ด‘์„ ์ด ํ•˜๋‚˜์˜ ์ด๋ฏธ์ง€ ํ”ฝ์…€์— ๋Œ€์‘๋œ๋‹ค๋Š” ๊ฐ€์ •ํ•˜์— ๋ชจ๋ธ์„ ๊ตฌ์ถ•ํ•˜์˜€๋‹ค. ํ•˜์ง€๋งŒ ์ด๋ฅผ ํ†ตํ•ด์„œ๋Š” ๊ฐ์ฒด๋กœ๋ถ€ํ„ฐ ๋‹ค์–‘ํ•œ ๊ฑฐ๋ฆฌ์—์„œ ์ˆ˜์ง‘๋˜๋Š” ์ด๋ฏธ์ง€๋“ค์ด ๋ชจ๋ธ์— ์ž…๋ ฅ๋˜์—ˆ์„ ๋•Œ ๋ณต์›๋œ 3์ฐจ์› ์ด๋ฏธ์ง€๊ฐ€ ๊นจ์ง€๊ฒŒ ๋˜๋Š” ํ•œ๊ณ„๊ฐ€ ์กด์žฌํ•œ๋‹ค. ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด์„œ ์—ฌ๋Ÿฌ ๊ฐœ์˜ ๊ด‘์„ ์„ ํ•˜๋‚˜์˜ ํ”ฝ์…€์— ๋Œ€์‘์‹œํ‚ค๋ฉด ์ด๋ฏธ์ง€ ๋ณต์› ์‹œ์— ๊ณ„์‚ฐ๋Ÿ‰์ด ๋„ˆ๋ฌด ์ปค์„œ ์‹ค์šฉ์ ์ด์ง€ ์•Š์€ ์‹ค์ •์ด๋‹ค.

์ด์— ์ €์ž๋“ค์€ ์›๋ฟ”ํ˜•ํƒœ์˜ ๊ด‘์„ ์„ ํ•˜๋‚˜์˜ ํ”ฝ์…€์— ๋Œ€์‘์‹œ์ผฐ์œผ๋ฉฐ, ๊ด‘์›์œผ๋กœ๋ถ€ํ„ฐ ๊ฑฐ๋ฆฌ๊ฐ€ ๋ฉ€์–ด์ง์— ๋”ฐ๋ผ์„œ ๋Œ€์‘๋˜๋Š” ๋ฉด์ ์ด ๋„“์–ด์ง€๋Š” ๊ฒƒ์„ ๋ฐ˜์˜ํ•˜๊ธฐ ์œ„ํ•ด์„œ ํŠน์„ฑ(feature)์„ ์—ฐ์†ํ•จ์ˆ˜๋กœ ๊ตฌ์„ฑํ•˜์˜€๋‹ค. ๋˜ํ•œ, ๋‹จ์ผ ์ ์ด ์•„๋‹Œ ๊ณต๊ฐ„ ์˜์—ญ์„ ํŠน์„ฑํ™” ํ•˜๊ธฐ ์œ„ํ•ด์„œ ๋‹จ์ˆœํ•œ ์œ„์น˜ ์ธ์ฝ”๋”ฉ์ด ์•„๋‹Œ ์ ๋ถ„ ํ˜•ํƒœ์˜ ์œ„์น˜ ์ธ์ฝ”๋”ฉ(integrated positional encoding)๋ฐฉ์‹์„ ์ œ์•ˆํ•˜์˜€๋‹ค. ์ด๋ฅผ ํ†ตํ•ด์„œ ๊ณต๊ฐ„ ์˜์—ญ์— ํ•ด๋‹นํ•˜๋Š” ์—ฐ์†์ ์ธ ํŠน์„ฑ์„ ์ด์šฉํ•จ์œผ๋กœ์จ 3์ฐจ์› ์ด๋ฏธ์ง€ ๋ณต์› ์‹œ ์ด๋ฏธ์ง€๊ฐ€ ๋Š๊ธฐ๋Š” ํ˜„์ƒ(aliasing)์„ ํ•ด๊ฒฐํ•˜์˜€๋‹ค.

3. Method

๋จผ์ € ๋ณธ ์—ฐ๊ตฌ์—์„œ ์‚ฌ์šฉํ•œ ์›๋ฟ” ํ˜•ํƒœ์˜ ๊ตฌ์กฐ ๋‚ด์—์„œ์˜ ์œ„์น˜ ์ง‘ํ•ฉ์„ ์•„๋ž˜์™€ ๊ฐ™์ด ์ˆ˜ํ•™์ ์œผ๋กœ ๋‚˜ํƒ€๋‚ผ ์ˆ˜ ์žˆ๋‹ค.

Equation2: Location set in a cornal structure

์ด ๊ตฌ์กฐ์˜ ํŠน์„ฑ์„ ์ ๋ถ„์„ ํ†ตํ•ด์„œ ๊ณ„์‚ฐํ•˜์˜€์œผ๋ฉฐ, ์ ๋ถ„์‹์„ ์‚ฌ์šฉ ์‹œ์— 3์ฐจ์› Gaussian ๋ถ„ํฌ๋ฅผ ์ด์šฉํ•˜์—ฌ ํ•ด๋‹น ์ ๋ถ„์„ ๊ณต๊ฐ„์— ๋Œ€ํ•ด์„œ ๋‹ซํ˜€์žˆ๋„๋ก ํ•˜์˜€๋‹ค. ์—ฌ๊ธฐ์„œ ์›๋ฟ” ํ˜•ํƒœ์˜ ๊ณต๊ฐ„ ์˜์—ญ ๋‚ด์—์„œ F(x,)F(x,)์˜ ํ‰๊ท ๊ณผ ๋ถ„์‚ฐ์„ ๊ณ„์‚ฐํ•˜์—ฌ Gaussian ๋ถ„ํฌ๋ฅผ ์ถ”์ •ํ•˜์˜€๋‹ค.

Equation3: Estimation of gaussian distribution

์ตœ์ ํ™” ๊ณผ์ •์—์„œ ์‚ฌ์šฉํ•œ loss ํ•จ์ˆ˜๋Š” ์•„๋ž˜์˜ ์ˆ˜์‹์œผ๋กœ ํ‘œํ˜„๋œ๋‹ค. ์•„๋ž˜์˜ ์ˆ˜์‹์—์„œ ์‚ฌ์šฉํ•œ coarse sample์€ stratified sampling ๊ณผ์ •์„ ํ†ตํ•ด์„œ ์ถ”์ถœํ•œ 128๊ฐœ์˜ ์ƒ˜ํ”Œ์„ ์ด์šฉํ•˜๋ฉฐ, fine sample์€ alpha composite weight ๊ธฐ๋ฐ˜์˜ 128๊ฐœ์˜ ์ƒ˜ํ”Œ์„ ์ด์šฉํ•œ๋‹ค.

Equation4: Propose loss function using the coarse and fine sampling

4. Experiment & Result

Experimental setup

์‹คํ—˜ ๊ณผ์ •์—์„œ๋Š” ๋‘ ๊ฐœ์˜ ๋ฐ์ดํ„ฐ ์…‹์ด ์‚ฌ์šฉ๋˜์—ˆ๋‹ค. ํ•˜๋‚˜๋Š” NeRF ์—ฐ๊ตฌ์—์„œ ์‚ฌ์šฉ๋˜๋˜ Blender Dataset๊ณผ ํ•˜๋‚˜๋Š” ์ž„์˜๋กœ ํ•ด์ƒ๋„๋ฅผ ์กฐ์ ˆํ•œ Multiscale Blender Dataset์ด๋‹ค. ๊ธฐ์กด์˜ ์—ฐ๊ตฌ์—์„œ ์‚ฌ์šฉํ•˜๋˜ Blender Dataset์€ ๊ฐ™์€ ๊ฑฐ๋ฆฌ์—์„œ ๊ฐ์ฒด๋ฅผ ์ฐ์€ ์ด๋ฏธ์ง€๋งŒ์„ ์ด์šฉํ•˜์—ฌ 3์ฐจ์› ์ด๋ฏธ์ง€ ๋ณต์› ์„ฑ๋Šฅ์„ ๋น„๊ตํ•˜์˜€๋‹ค. ์ด๋ฅผ ํ†ตํ•ด์„œ NeRF์˜ ์•ฝ์ ์„ ๊ฐ์ถœ ์ˆ˜๋Š” ์žˆ์—ˆ์ง€๋งŒ ํ˜„์‹ค ์„ธ๊ณ„์—์„œ ์‚ฌ์šฉ๋˜๋Š” ์ด๋ฏธ์ง€ ๋ฐ์ดํ„ฐ์˜ ๊ฒฝ์šฐ ๋‹ค์–‘ํ•œ ํ•ด์ƒ๋„๋ฅผ ๋„๊ฒŒ ๋œ๋‹ค. ์ด ์ƒํ™ฉ์— ๋Œ€ํ•ด์„œ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•ด์„œ Blender Dataset์˜ ํ•ด์ƒ๋„๋ฅผ 1/2, 1/4, 1/8๋กœ ๋‚ฎ์ถ˜ ์ด๋ฏธ์ง€๋ฅผ ํฌํ•จ์‹œํ‚จ Multiscale Blender Dataset์„ ์‹คํ—˜์— ์‚ฌ์šฉํ•˜์˜€๋‹ค.

์‹คํ—˜์—์„œ ์‚ฌ์šฉํ•œ ๋น„๊ต๊ตฐ์€ ์›๋ž˜์˜ NeRF ๋ชจ๋ธ๊ณผ Mip-NeRF์˜ ์ฃผ์š” component๋ฅผ ํ•˜๋‚˜์”ฉ ์ œ๊ฑฐํ•œ ๋ชจ๋ธ๊ณผ ๋น„๊ตํ•˜์˜€๋‹ค. ์ด๋ฅผ ํ†ตํ•ด์„œ ์ œ์•ˆํ•œ ๋ชจ๋ธ ๊ตฌ์กฐ๊ฐ€ ํšจ๊ณผ์ ์ธ์ง€, ๋˜ํ•œ ์‚ฌ์šฉํ•œ ๊ฐ๊ฐ์˜ component๊ฐ€ ๋ชจ๋ธ ์„ฑ๋Šฅ ํ–ฅ์ƒ์— ๋„์›€์ด ๋˜๋Š”์ง€ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค. ํ•™์Šต ๊ณผ์ •์€ ๋ฐฉ๋ฒ•๋ก  ํŒŒํŠธ์—์„œ ์„ค๋ช…ํ•œ ๊ฒƒ๊ณผ ๊ฐ™์ด coarse์™€ fine sample ๊ฐ๊ฐ 128๊ฐœ๋ฅผ ์ด์šฉํ•˜์˜€์œผ๋ฉฐ, ํ•ด์ƒ๋„๋ฅผ ๋–จ์–ด๋œจ๋ฆฐ ์ด๋ฏธ์ง€๋ฅผ ์ด์šฉํ•˜์—ฌ ํ•™์Šต์‹œํ‚ฌ ๊ฒฝ์šฐ Loss์— ๊ฐ€์ค‘์น˜๋ฅผ ๊ณฑํ•˜์—ฌ์„œ ๊ณต์ •ํ•œ ํ•™์Šต์„ ๊ฐ€๋Šฅ์ผ€ํ•˜์˜€๋‹ค (์˜ˆ์‹œ: 1/2 ํ•ด์ƒ๋„: 4๋ฐฐ, 1/4 ํ•ด์ƒ๋„: 16๋ฐฐ).

ํ‰๊ฐ€์— ์‚ฌ์šฉํ•œ ์ง€ํ‘œ๋Š” ์ด๋ฏธ์ง€ ๋ณต์› ํ‰๊ฐ€์—์„œ ํ”ํžˆ ์‚ฌ์šฉ๋˜๋Š” PSNR, SSIM, LPIPS๋ฅผ ์‚ฌ์šฉํ•˜์˜€๋‹ค. ์—ฌ๊ธฐ์„œ PSNR์™€ SSIM์€ ๋†’์„ ์ˆ˜๋ก, LPIPS๋Š” ๋‚ฎ์„ ์ˆ˜๋ก ๋ณต์› ์„ฑ๋Šฅ์ด ์ข‹์€ ๊ฒƒ์ด๋‹ค.

Result

Table 1: Performance comparison of Mip-NerF and original NerF model (top right, red box)

์œ„์˜ ์—์„œ ์•Œ ์ˆ˜ ์žˆ๋“ฏ์ด ์ œ์•ˆํ•œ Mip NerF๊ฐ€ ์ด๋ฏธ์ง€ ๋ณต์›์— ์žˆ์–ด์„œ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ด๋Š” ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค. ํŠนํžˆ ์›๋ž˜์˜ NerF ๋ชจ๋ธ์€ ์ž…๋ ฅ๋˜๋Š” ์ด๋ฏธ์ง€์˜ ํ•ด์ƒ๋„๊ฐ€ ๋‚ฎ์•„์ง์— ๋”ฐ๋ผ์„œ ๋ณต์›์„ฑ๋Šฅ์ด ๊ธ‰๊ฒฉํžˆ ๊ฐ์†Œํ•˜๋Š” ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์ง€๋งŒ ์ œ์•ˆํ•œ Mip-NerF์˜ ๊ฒฝ์šฐ ๋ณต์› ์„ฑ๋Šฅ์ด ๊ฐ์†Œํ•˜์ง€ ์•Š๋Š” ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด์„œ ๋ณธ ์—ฐ๊ตฌ์—์„œ ์ œ์•ˆํ•œ ๋ชจ๋ธ์ด ๋ณด๋‹ค ํ˜„์‹ค์ ์ธ ์ด๋ฏธ์ง€ ๋ณต์›์— ์žˆ์–ด์„œ ์œ ์šฉํ•˜๊ฒŒ ์‚ฌ์šฉ๋  ๊ฒƒ์ž„์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค.

5. Conclusion

๋ณธ ์—ฐ๊ตฌ์—์„œ ์ œ์•ˆํ•œ Mip-NerF ๋ชจ๋ธ์€ ์›๋ฟ” ํ˜•ํƒœ์˜ ๊ตฌ์กฐ๋ฅผ ํ•˜๋‚˜์˜ ํ”ฝ์…€์— ๋Œ€์‘์‹œ์ผœ์„œ ๊ณต๊ฐ„ ์˜์—ญ์˜ ํŠน์„ฑ(feature)์„ 3์ฐจ์› Gaussian ๋ถ„ํฌ๋กœ ๊ทผ์‚ฌํ•˜๋Š” ๋ฐฉ์‹์„ ์‚ฌ์šฉํ•˜์—ฌ์„œ ๋‹จ์ผ ํ•ด์ƒ๋„์˜ ์ธํ’‹ ๋ฐ์ดํ„ฐ์—์„œ๋งŒ ์ข‹์€ ์„ฑ๋Šฅ์„ ๋ณด์ด๋˜ NeRF ๋ชจ๋ธ์„ ๋‹ค์–‘ํ•œ ํ•ด์ƒ๋„์—์„œ์˜ ์ด๋ฏธ์ง€๋“ค์—์„œ๋„ ์ž˜ ์ž‘๋™ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜์˜€๋‹ค. ์‹คํ—˜ ๊ฒฐ๊ณผ ์šฐ๋ฆฌ๊ฐ€ ์ œ์ž‘ํ•œ Multiscale ๋ฐ์ดํ„ฐ์…‹์—์„œ๋Š” ๊ธฐ์กด์˜ NeRF ๋ชจ๋ธ์— ๋น„ํ•ด์„œ ์„ฑ๋Šฅ์ด 60% ์ข‹์•˜์œผ๋ฉฐ, ๊ธฐ์กด์— ์‚ฌ์šฉํ•˜๋˜ ๋‹จ์ผ ํ•ด์ƒ๋„ Blender Dataset์—์„œ๋„ 17% ์„ฑ๋Šฅ ๊ฐœ์„ ์„ ํ•˜์˜€๋‹ค. ๋˜ํ•œ ํ•™์Šต ์‹œ๊ฐ„๋„ NeRF ๋ชจ๋ธ์— ๋น„ํ•ด์„œ 7% ์ •๋„ ๋นจ๋ผ์ง€๋Š” ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค.

Take home message (์˜ค๋Š˜์˜ ๊ตํ›ˆ)

์ €์ž๋“ค์€ ๊ธฐ์กด์˜ Anti-aliasing mipmapping ํ•„ํ„ฐ๋ง ๋ฐฉ๋ฒ•์„ NeRF ๋ชจ๋ธ์— ์ ์šฉํ•จ์œผ๋กœ์จ NeRF ๋ชจ๋ธ์˜ ๊ทผ๋ณธ์ ์ธ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค.

๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์„ ๊ตฌ์ถ• ์‹œ ๋ฌธ์ œ์ ์„ ๋ช…ํ™•ํ•˜๊ฒŒ ์ •์˜ํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•˜๋‹ค.

๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์„ ๊ตฌ์ถ• ์‹œ ๋ฌธ์ œ์ ์˜ ํ•ด๊ฒฐ๋ฐฉ์•ˆ์„ ๋„์ถœํ•  ๋•Œ ๊ธฐ์กด์˜ ์ „ํ†ต์ ์ธ ๋ฐฉ๋ฒ•๋ก ์„ ์ฐธ๊ณ ํ•˜๋Š” ๊ฒƒ์ด ์ƒ๋‹นํ•œ ๋„์›€์ด ๋  ์ˆ˜ ์žˆ๋‹ค.

Author information

Author

์กฐํ•ด์ฐฌ (Haechan Cho)

  • Affiliation (KAIST AI)

  • I am eager to learn new things.

  • Contact information (gkqkemwh@kaist.ac.kr)

Last updated

Was this helpful?