Pop-Out Motion [Kor]
Lee et al. / Pop-Out Motion - 3D-Aware Image Deformation via Learning the Shape Laplacian / CVPR 2022
์๋
ํ์ธ์. ๋ณธ ํฌ์คํ
์์๋ ์ฌํด CVPR์ ๋ฐํ๋ Pop-Out Motion์ด๋ผ๋ ๋
ผ๋ฌธ์ ์๊ฐ๋๋ฆฌ๊ณ ์ ํฉ๋๋ค. ์์ฐ์ค๋ฌ์ด 3D-Aware Image Deformation์ ์ํ ํ์ต ๊ธฐ๋ฐ์ ํ์ดํ๋ผ์ธ์ ์ ์ํ ๋
ผ๋ฌธ์ด๋ฉฐ, 3D Vision
, Shape Deformation
, 2D-to-3D Reconstruction
๋ฑ์ ํค์๋์ ๊ด์ฌ์ด ์์ผ์ ๋ถ๋ค์ด๋ผ๋ฉด ๋
ผ๋ฌธ ๋ณธ๋ฌธ ๋ฐ ํ๋ก์ ํธ ํ์ด์ง๋ฅผ ๊ตฌ๊ฒฝํด์ฃผ์๋ฉด ๊ฐ์ฌํ๊ฒ ์ต๋๋ค. ํด๋น ๋
ผ๋ฌธ์ ์ ๊ฐ 1์ ์๋ก ์ฐธ์ฌํ์์ผ๋ฉฐ, KAIST ์ ์ฐํ๋ถ์ ์ฑ๋ฏผํ๊ต์๋๊ณผ ๊นํ๊ท ๊ต์๋๊ป์ ์ง๋ํด์ฃผ์
จ์ต๋๋ค. (์ข์ ์ฐ๊ตฌ ์ง๋๋ฅผ ํด์ฃผ์ ๋ ๊ต์๋๊ป ๊ฐ์ฌ๋๋ฆฝ๋๋ค.)
1. Problem Definition
๋ณธ ๋
ผ๋ฌธ์ 3D-Aware Image Deformation
์ด๋ผ๋ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ ์ ํฉ๋๋ค. ์ฌ์ฉ์๊ฐ ์ด๋ฏธ์ง ๋ด์ ๊ฐ์ฒด ๋ชจ์์ ์์ฐ์ค๋ฝ๊ฒ ๋ณํํ๋ ๊ฒ์ ๊ฐ๋ฅํ๊ฒ ํ๋, 2D ์์์ ํผ์ฌ์ฒด๊ฐ ๋ง์น 3D ๊ณต๊ฐ์ ์กด์ฌํ๋ ๊ฒ๊ณผ ๊ฐ์ด ๋ณํํ ์ ์๋๋ก ํ๋ ๊ฒ์ด ๋ชฉํ์
๋๋ค. ์ด ๋ ์ง๊ด์ ์ธ ์ด๋ฏธ์ง ์์ ์ ์ํ์ฌ ์ฌ์ฉ์๊ฐ ํคํฌ์ธํธ ๋ฑ์ Deformation Handle
์ ๋งค๊ฐ์ฒด๋ก์ ์ฌ์ฉํ ์ ์๋๋ก ํฉ๋๋ค. ์๋์ ๊ทธ๋ฆผ ์์๋ฅผ ๋ณด์๋ฉด, ์ฌ์ฉ์๊ฐ ์ด๋ฏธ์ง์ ํคํฌ์ธํธ๋ค (ํ๋์ ์ ํ์) ์ ์ง์ ํ๊ณ ๊ทธ ์ค ํ๋๋ฅผ ์ ํํ์ฌ ์์ง์ผ ๊ฒฝ์ฐ (๋นจ๊ฐ์ ํ์ดํ ํ์), ๊ทธ๋ฆผ ๋ด์ ์ฌ๋ ๊ฐ์ฒด ๋ชจ์์ด ๊ทธ์ ๋ง์ถ์ด ์์ฐ์ค๋ฝ๊ฒ ๋ณํ๋๋ ๊ฒ์ ๋ณผ ์ ์์ต๋๋ค. ์ด ๋ ํ์ด ๋ชธํต ๋ถ๋ถ ์์ ์์นํ๊ฒ ๋๊ฑฐ๋, ํ ๋ฐ์ด ๋ค๋ฅธ ๋ฐ ๋ค๋ก ๊ฐ๋ ค์ง๋ ๋ฑ์ 3D ๊ณต๊ฐ์ ๋ํ ์ดํด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ ์์ ๋ณํ์ด ์ผ์ด๋๊ฒ ๋ฉ๋๋ค. ์ด๋ฌํ 3D-Aware Image Deformation
๊ธฐ๋ฅ์ ์ธํฐ๋ ํฐ๋ธ ์์ ํธ์ง ์ดํ๋ฆฌ์ผ์ด์
๋ฑ์ ์ ์ฉํ๊ฒ ์ฐ์ผ ์ ์์ต๋๋ค.

2. Motivation
Related work
๊ธฐ์กด์๋ 3D ๊ณต๊ฐ์ ๋ํ ์ดํด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์์ ํธ์ง์ ๊ฐ๋ฅํ๊ฒ ํ ๊ธฐ๋ฒ๋ค์ด ๋ง์ด ์ฐ๊ตฌ๋์ด ์์ง๋ง, ๊ธ๋ก๋ฒํ Scene ์ ๋ณด (์. ๋ทฐํฌ์ธํธ, ์นด๋ฉ๋ผ ํ๋ผ๋ฏธํฐ, ์กฐ๋ช ) ๋ ๊น์ด ์ ๋ณด๋ฅผ ์์ ํ๋ ๊ฒ์ ์ ํ๋์ด ์์์ต๋๋ค. Human Pose Transfer ์ชฝ์ ์ฐ๊ตฌ๋ค์ ์์ ์ ์ฌ๋์ ์์ธ๋ฅผ ๋ณํํ๋ ๊ฒ์ ๊ฐ๋ฅํ๊ฒ ํ์ง๋ง, ์ฌ๋์ด ์๋ ๋ค๋ฅธ ์ข ๋ฅ (์. ๋งํ ์บ๋ฆญํฐ) ์ ์์ ์ ๊ฐ์ฒด์ ๋ํด์๋ ๋์ํ์ง ์๋๋ค๋ ํ๊ณ์ ์ด ์์์ต๋๋ค. 3D ๋ชจ๋ธ ๊ธฐ๋ฐ ๋ณํ ๊ธฐ๋ฒ๋ค์ ์์ ์ ๊ฐ์ฒด ์ข ๋ฅ์ ๊ตญํ๋์ง ์๊ณ ๋์ํ๋ค๋ ์ฅ์ ์ด ์์ง๋ง, ์ ๋ ฅ ์์์ ๋์๋๋ ์ ํํ 3D ๋ชจ๋ธ์ ํ์๋ก ํ๋ค๋ ๋จ์ ์ด ์กด์ฌํฉ๋๋ค. ์ด๋ฌํ ํ๊ณ์ ๋ค์ ๊ฐ์ ํ๊ธฐ ์ํ์ฌ ์ ํฌ ์ฐ๊ตฌ์์๋ ๊ฐ์ฒด ์ข ๋ฅ์ ๊ตญํ๋์ง ์๊ณ ์ต๋ํ ์์ ๋กญ๊ฒ ์์ ๋ณํ์ด ๊ฐ๋ฅํ ํ๋ ์์ํฌ๋ฅผ ๊ณ ์ํ๋ ๊ฒ์ ๋ชฉํ๋ก ํ์์ต๋๋ค.
Idea
๊ฐ์ฒด ์ข ๋ฅ์ ๊ตญํ๋์ง ์๊ณ ์ต๋ํ ์์ ๋กญ๊ฒ ์์ ๋ณํ์ด ๊ฐ๋ฅํ๊ฒ ํ๊ธฐ ์ํ์ฌ ์ ๋ ฅ ์์์ผ๋ก๋ถํฐ ๋ณต์๋ 3D Shape์ ๋ํด Handle-Based Deformation Weight [1] ์ ๊ธฐ๋ฐ์ผ๋ก ์์ ๋ณํ์ ๋ชจ๋ธ๋งํฉ๋๋ค. (1) Tetrahedral Mesh ํํ์ 3D Shape ๋ฐ (2) ์ฌ์ฉ์๊ฐ ์ง์ ํ Deformation Handle ์ด ์ฃผ์ด์ก์ ๋, Handle-Based Deformation์ ๋ค์๊ณผ ๊ฐ์ด ๋ชจ๋ธ๋ง๋ฉ๋๋ค:
์ ์์์์ ์ ๋ ์ ๋ ฅ Mesh์ ๋ฒ์งธ Vertex์ ๋ํ ๋ณํ ์ ๋ฐ ๋ณํ ํ ์์น, ๋ Vertex ์ Handle ์ ๋์๋๋ Deformation Weight, ๋ ์ฌ์ฉ์๊ฐ Handle ์ ๊ฐํ๋ Affine Transformation ํ๋ ฌ์ ์๋ฏธํฉ๋๋ค.
์ด ๋ ์ฌ์ฉํ๋ Handle-Based Deformation Weight [1] ์ ๋ค์๊ณผ ๊ฐ์ ์์์ ํตํด ๊ณ์ฐ๋ฉ๋๋ค:
์ ์์์์ ๊ฐ Deformation Handle์ ๋ํ Deformation Weights ๋ Deformation Energy ์ ๋ํ Constrained Optimization ๋ฌธ์ ์ ํด๋ก์ ์ ์๋ฉ๋๋ค.
ํด๋น Deformation Energy ๋ ์ ๋ ฅ Mesh์ Shape Laplacian์ ์ด์ฉํ์ฌ ์ ์๋๋๋ฐ, 2D-to-3D Reconstruction์ ํตํด ๋ณต์๋ Mesh๋ก๋ถํฐ๋ ๋ถ์ ํํ Shape Laplacian์ด ๊ณ์ฐ๋๋ค๋ ๋ฌธ์ ๊ฐ ์์ต๋๋ค. Shape Laplacian์ Mesh Topology (์ฆ, Mesh Vertex ๊ฐ์ Edge๋ก์ ํํ๋ ์ฐ๊ฒฐ ๊ด๊ณ) ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ์ฌ ์ ์๋๋๋ฐ, 2D ์์์ผ๋ก๋ถํฐ ์ ํํ Mesh Topology ์ ๋ณด๋ฅผ ๋ณต์ํ ์ ์๋ Topology-Aware Mesh Reconstruction์ ์ฌ๋ฌ ์ด๋ ค์๋ค ๋๋ฌธ์ ์์ง ํ๋ฆฌ์ง ์์ ๋ฌธ์ ๋ก ๋จ์์์ต๋๋ค. ๋ฐ๋ผ์ ์ ํฌ์ ํต์ฌ ์์ด๋์ด๋ 2D๋ก๋ถํฐ ๋ณต์๋ 3D Shape์ ๋ํ Shape Laplacian ์ ๋ณด๋ฅผ ํ์ต ๊ธฐ๋ฐ์ ๊ธฐ๋ฒ์ ํตํด ์ ํํ๊ฒ ์์ธกํ ํ, ์ด๋ฅผ Handle-Based Deformation Weight ๊ณ์ฐ์ ์ด์ฉํ๋ ๊ฒ์ ๋๋ค.
3. Method
์์ ์ธ๊ธ๋๋ ธ๋ฏ์ด, ์ ํฌ๋ 3D-Aware Image Deformation์ ๋ชจ๋ธ๋งํ๊ธฐ ์ํ ํ์ต ๊ธฐ๋ฐ์ ๊ธฐ๋ฒ์ ์ ์ํฉ๋๋ค. ์ฐ์ ์ ๋ ฅ ์์์ ๋ํ์ฌ 3D Reconstruction Method (PIFu [2]) ๋ฅผ ์ ์ฉํจ์ผ๋ก์จ ์์ ์ ๊ฐ์ฒด์ ๋์ํ๋ 3D Point Cloud๋ฅผ ์์ธกํฉ๋๋ค. (์ ํฌ๋ Mesh Edge ์ ๋ณด๊ฐ ์ฌ์ฉ๋๋ Shape Laplacian ๊ณ์ฐ์ ํ์ต ๊ธฐ๋ฐ์ ๊ธฐ๋ฒ์ผ๋ก ๋์ฒดํ ๊ฒ์ด๊ธฐ ๋๋ฌธ์, Mesh๊ฐ ์๋ Point Cloud ํํ์ Shape์ ์ฌ์ฉํฉ๋๋ค.) ๋ค์์ ๋ณต์๋ 3D Point Cloud์ ๋ํ Shape Laplacian์ ์ธ์ฌํ๊ฒ ์ค๊ณ๋ ๋ด๋ด๋ท์ ์ด์ฉํ์ฌ ์์ธกํฉ๋๋ค. ์ด๋ ๊ฒ ์์ธก๋ Shape Laplacian์ ์ด์ฉํ์ฌ ์ฌ์ฉ์๊ฐ ์์๋ก ์ง์ ํ Deformation Handle์ ๋ํ Handle-Based Deformation Weight [1]์ ๊ณ์ฐํ๊ณ , ์ด๋ฅผ ํตํด ๋ชจ๋ธ๋ง ๋ 3D Deformation์ ๋ค์ 2D Image Plane์ ํฌ์ฌํจ์ผ๋ก์จ 3D-Aware Image Deformation์ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค.
์ง๊ธ๋ถํฐ๋ ์ ํฌ์ ํต์ฌ ์์ด๋์ด์ธ Point Cloud๋ก๋ถํฐ Shape Laplacian์ ์์ธกํ๋ ๋คํธ์ํฌ์ ๋ํ์ฌ ์์ธํ๊ฒ ์๊ฐ๋๋ฆฌ๊ฒ ์ต๋๋ค. Shape Laplacian์ ๊ตฌ์ฑ ์์์ธ Cotangent Laplacian Matrix ์ Inverse Mass Matrix ๋ฅผ ๋ฐ๋ก ์์ธกํ๋๋ก ๋คํธ์ํฌ๋ฅผ ๊ตฌ์ฑํ ํ, ๊ฐ ์ ๋ณด์ ๋ํ ์ง์ ์ ์ธ Superivsion์ ํตํ์ฌ ๋คํธ์ํฌ๋ฅผ ํ์ต์ํต๋๋ค. ์๋์ ๊ทธ๋ฆผ์ ๋ณด์๋ฉด ์ ์ ์๋ฏ์ด, ์ ์ ํ๋ ์์ํฌ๋ ํฌ๊ฒ ์ธ ๊ฐ์ง์ ๋ชจ๋ - (1) Feature Extraction Module, (2) Cotangent Laplacian Prediction Module, (3) Inverse Mass Prediction Module - ๋ก ๊ตฌ์ฑ๋์ด์์ต๋๋ค.

Feature Extraction Module์ ์ ๋ ฅ 2D ์ด๋ฏธ์ง๋ก๋ถํฐ ๋ณต์๋ 3D Point Cloud ๋ฅผ ์ ๋ ฅ์ผ๋ก ๋ฐ์ Point Cloud Feature ๋ฅผ ์์ฑํฉ๋๋ค. ์ด ๋ ์ ์ ๋์๋๋ Per-Point Feature๋ฅผ ์๋ฏธํฉ๋๋ค. ๋ชจ๋์ ๊ตฌ์กฐ๋ก๋ Point Transformer [3] ๋ฅผ ํ์ฉํ์์ต๋๋ค.
Cotangent Laplacian Prediction Module์ 3D Point Cloud ์ Point Cloud Feature ๋ฅผ ์
๋ ฅ์ผ๋ก ๋ฐ์ ์ ๋ํ Cotangent Laplacian Matrix ๋ฅผ ์์ธกํฉ๋๋ค. Cotangent Laplacian์ ์ ์์ ๋ฐ๋ผ ์ Symmetricํ๊ณ ๋งค์ฐ Sparseํ ํน์ฑ์ ๊ฐ์ง๊ณ ์๋๋ฐ, ์ ์ฌ์ด์ Edge ์ฐ๊ฒฐ ๊ด๊ณ๊ฐ ์์ด์ผ ์ด 0์ด ์๋ ๊ฐ์ผ๋ก ์ ์๋๊ธฐ ๋๋ฌธ์
๋๋ค. ์ ํฌ๋ Point Cloud ๋ด์ ๊ฐ Point Pair (, ) ๋ฅผ ์
๋ ฅ์ผ๋ก ๋ฐ์ ์ด์ ๋์๋๋ Laplacian Matrix์ Element () ๋ฅผ ๋ณ๋ ฌ์ ์ผ๋ก ์์ธกํ๋ ๊ตฌ์กฐ๋ฅผ ์ทจํ๋๋ฐ, Euclidean Distance๊ฐ ๋จผ Point Pair ๋ผ๋ฆฌ๋ ์ฐ๊ฒฐ ๊ด๊ณ๊ฐ ์์ ํ๋ฅ ์ด ์ ๊ธฐ ๋๋ฌธ์ ์ด๋ค์ 1์ฐจ์ ์ผ๋ก ๊ฑธ๋ฌ์ฃผ๋ ์ญํ ์ ํฉ๋๋ค. ๋
ผ๋ฌธ์์ KNN-Based Point Pair Sampling (KPS)
์ผ๋ก ์ง์นญํ๋ ๋ถ๋ถ์ธ๋ฐ, ๊ฐ ํฌ์ธํธ๋ค์ ๋ํ์ฌ ๊ฐ์ ๊ฐ๊น์ด ์ ๋ค์ ๋ํด์๋ง Point Pair๋ฅผ ๊ตฌ์ฑํ๋ ๊ธฐ๋ฒ์
๋๋ค. ์ด๋ฌํ Sampling ๊ธฐ๋ฒ์ ์ฐ์ง ์์ ๊ฒฝ์ฐ Imbalanced Regression Problem์ด ์ผ์ด๋ ๋คํธ์ํฌ ํ์ต์ด ์ ๋์ง ์๋ ํ์์ด ์์์ต๋๋ค.
๋ค์์ KNN-Based Point Pair Sampling (KPS)
์ ํตํด ์ ํ๋ ๊ฐ Point Pair Candidate (, ) ์ ๋ํ์ฌ Symmetric Feature Aggregation
์ ์ํํด์ค๋๋ค:
์ ์์์์ ๋ฐ ๋ก๋ Symmetric Function์ ์ฌ์ฉํ๋๋ฐ, ์ด๋ ๋์ค์ ์์ธก๋ Cotangent Laplacian Matrix์ Symmetry๋ฅผ ๋ณด์ฅํ๊ธฐ ์ํจ์ ๋๋ค. ํด๋น ํจ์๋ ๊ฐ๊ฐ Absolute Difference์ Element-Wise Multiplication์ผ๋ก ๊ตฌํ๋์์ต๋๋ค. ์ด๋ ๊ฒ ์์ฑ๋ Point Pair Feature ์ ๋์๋๋ Cotangent Laplacian Element ๋ ๋ค์๊ณผ ๊ฐ์ด ์์ธก๋ฉ๋๋ค:
์ Real-Valued Scalar๋ฅผ ์ถ๋ ฅํ๋ ํจ์์ด๋ฉฐ ๋ ์ด Non-Zero ๊ฐ์ผ์ง์ ๋ํ ํ๋ฅ ์ ๋ชจ๋ธ๋งํ๋ Weight ์ถ๋ ฅ ํจ์์ ๋๋ค. ๋ ํจ์๋ MLP๋ก ๊ตฌํ๋์์ผ๋ฉฐ, ์ต์ข ๊ฐ์ ๋ ์ถ๋ ฅ ๊ฐ์ ๊ณฑ์ผ๋ก์ ํํ๋ฉ๋๋ค.
Inverse Mass Prediction Module์ 3D Point Cloud ์ Point Cloud Feature ๋ฅผ ์ ๋ ฅ์ผ๋ก ๋ฐ์ ์ ๋ํ Inverse Mass Matrix ๋ฅผ ์์ธกํฉ๋๋ค. Inverse Mass์ ์ ์์ ๋ฐ๋ผ ์ Diagonal ํ๋ฉฐ, ๋ฒ์งธ Digonal Element๋ ์ Volume๊ณผ ๊ด๊ณ๋ ์ ๋ณด๋ฅผ ๋ด๊ณ ์์ต๋๋ค. ๋ฐ๋ผ์ ๋ด์ ๊ฐ ํฌ์ธํธ ์ ๋์๋๋ Per-Point Feature ๋ฅผ Concatenate ์์ผ์ค ํ MLP์ ํต๊ณผ์ํค๋ ๋ฐฉ์์ ํตํด Inverse Mass Matrix ๋ด์ Element๋ฅผ ์์ธกํฉ๋๋ค.
๋ณธ Shape Laplacian ์์ธก ๋คํธ์ํฌ๋ , , ์์ธก ๊ฐ์ ๋ํ L1-Loss ๊ธฐ๋ฐ์ Ground Truth Supervision์ ํตํด ํ์ต๋ฉ๋๋ค. ์์ธํ Loss ๊ณ์ฐ ์ ๋ณด๋ ๋ ผ๋ฌธ ๋ณธ๋ฌธ์ ์ฐธ์กฐํด์ฃผ์๋ฉด ๊ฐ์ฌํ๊ฒ ์ต๋๋ค.
4. Experiment & Result
์ ์ํ 3D-Aware Image Deformation ๊ธฐ๋ฒ์ ํจ๊ณผ์ฑ์ ๊ฒ์ฆํ๊ธฐ ์ํ์ฌ ํฌ๊ฒ ๋ ์ข ๋ฅ์ ์คํ์ ์งํํ์์ต๋๋ค. ์ฒซ ๋ฒ์งธ๋ก๋ ์ ํฌ๊ฐ ๋ชจ๋ธ๋งํ Deformation์ ํ๋ฆฌํฐ๋ฅผ ์ ๋์ ์ผ๋ก ํ๊ฐํ๊ธฐ ์ํด 3D Point Cloud Deformation ์คํ์ ์งํํ์์ต๋๋ค. ๋ ๋ฒ์งธ๋ก๋ ์ ํฌ์ ๋ชฉํ ๊ธฐ๋ฅ์ธ 3D-Aware Image Deformation ๊ฒฐ๊ณผ๋ฅผ ํ์ธํ๊ธฐ ์ํ ์ ์ฑ์ ํ๊ฐ๋ฅผ ์งํํ์์ต๋๋ค. ๋์ฑ ๋ค์ํ ์คํ ๊ฒฐ๊ณผ (์. Partial Point Cloud Deformation, Ablation Study) ๋ ๋ ผ๋ฌธ ๋ณธ๋ฌธ์์ ํ์ธํด์ฃผ์๋ฉด ๊ฐ์ฌํ๊ฒ ์ต๋๋ค.
Experimental setup
Dataset
DFAUST [4]: ์ ๋์ ํ๊ฐ์ ์ฌ์ฉ๋ 3D Human Point Cloud ๋ฐ์ดํฐ์ ์ ๋๋ค.
RenderPeople [5], Mixamo [6]: ์ ์ฑ์ ํ๊ฐ์ ์ฌ์ฉ๋ 3D Human [5] ๋ฐ 3D Character [6] Dataset์ ๋๋ค. ์ ํฌ์ ๋ชฉ์ ์ Image Deformation์ ๊ฒฐ๊ณผ๋ฅผ ํ์ธํ๋ ๊ฒ์ด๋ฏ๋ก, ํด๋น 3D Model๋ค์ ๋ ๋๋งํ์ฌ ์์ฑํ ์์๋ค์ ์คํ์ ์ฌ์ฉํ์์ต๋๋ค.
Baselines
์ ํฌ์ ํต์ฌ ์์ด๋์ด๋ Mesh Reconstruction ๊ฒฐ๊ณผ๋ก๋ถํฐ ๋ถ์ ํํ Shape Laplacian์ด ๊ณ์ฐ๋๋ฏ๋ก ํด๋น ์ ๋ณด๋ฅผ ํ์ต ๊ธฐ๋ฐ์ ๊ธฐ๋ฒ์ ํตํด ๋ณด๋ค ์ ํํ๊ฒ ์์ธกํ์๋ ๊ฒ์ด์์ต๋๋ค. ๋ฐ๋ผ์, Mesh Reconstruction ๊ธฐ๋ฒ์ ์ฌ์ฉํ์ฌ Shape Laplacian์ ์ป์ ํ Deformation Weight์ ๊ณ์ฐํ๋ ์ํฉ์ ๋ฒ ์ด์ค๋ผ์ธ์ผ๋ก ์ค์ ํ์์ต๋๋ค. ์ ํฌ ์คํ์์ ๊ณ ๋ ค๋ Mesh Reconstruction ๊ธฐ๋ฒ๋ค์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
Screened Poisson Surface Reconstruction (PSR) [7],
Algebraic Point Set Surfaces (APSS) [8],
Ball-Pivoting Algorithm (BPA) [9],
DeepSDF [10],
Deep Geometric Prior (DGP) [11],
Meshing Point Clouds with IntrinsicExtrinsic Ratio (MIER) [12].
๋ํ, ๊ธฐ์กด์ Point Cloud Laplacian ๊ธฐ๋ฒ์ ์ด์ฉํ์ฌ ์ ๋ ฅ Point Cloud๋ก๋ถํฐ Shape Laplacian์ ๊ทผ์ฌ ๊ฐ์ ๋ฐ๋ก ๊ณ์ฐํ๋ ๊ธฐ๋ฒ๋ค๋ ๊ณ ๋ คํ์์ต๋๋ค:
PCD Laplace (PCDLap) [13],
Nonmanifold Laplacians (NMLap) [14].
Training Setup
๊ฐ ๋ฐ์ดํฐ๋ณ๋ก ์คํ์ ์ฌ์ฉํ ์ธํ ์ด ๋ค๋ฅด๋ฏ๋ก, ์์ธํ ์ฌํญ์ ๋ ผ๋ฌธ ๋ณธ๋ฌธ ๋ฐ Supplementary๋ฅผ ์ฐธ๊ณ ํด์ฃผ์๋ฉด ๊ฐ์ฌํ๊ฒ ์ต๋๋ค.
Evaluation Metric
์ ํฌ์ ์ ๋์ ํ๊ฐ์๋ ๋ค์๊ณผ ๊ฐ์ ๋ฉํธ๋ฆญ์ด ์ฌ์ฉ๋์์ต๋๋ค:
์์ธก ๋ฐ ์ ๋ต Deformation Weights ๊ฐ์ L1 Distance (Weight L1),
์์ธก ๋ฐ ์ ๋ต Deformed Shape ๊ฐ์ Chamfer Distance (Shape CD),
์์ธก ๋ฐ ์ ๋ต Deformed Shape ๊ฐ์ Hausdorff Distance (Shape HD).
Result
3D Point Cloud Deformation
์๋์ ํ๋ DFAUST [4] ๋ฐ์ดํฐ์ ์ ๋ํ ์ ๋์ ๋น๊ต ํ๊ฐ ๊ฒฐ๊ณผ๋ฅผ ๋ํ๋ธ ๊ฒ์ ๋๋ค. ์ ํฌ๊ฐ ์ ์ํ ๊ธฐ๋ฒ์ด ๋ค๋ฅธ Mesh Reconstruction ๋ฒ ์ด์ค๋ผ์ธ ๊ธฐ๋ฒ๋ค์ ์ฌ์ฉํ์ ๋ ๋ณด๋ค ๋ ๋์ Shape Deformation ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ด๋ ๊ฒ์ ์ ์ ์์ต๋๋ค.

์์ ๊ฒฐ๊ณผ์ ๋ํ ์ ์ฑ์ ๊ฒฐ๊ณผ (์๋ ๊ทธ๋ฆผ) ๋ํ ์ ํฌ ๊ธฐ๋ฒ์ด ๋์ฑ ์์ฐ์ค๋ฌ์ด Shape Deformation์ ๋ชจ๋ธ๋งํ ์ ์์์ ๋ณด์ฌ์ค๋๋ค.

3D-Aware Image Deformation
๋ณธ ๋์์์ ์ ํฌ์ 3D-Aware Image Deformation ๊ธฐ๋ฒ์ ์ด์ฉํด์ ์์ฑํ ๋ชจ์ ๋์์์ ๋๋ค. Mesh Reconstruction ๋ฒ ์ด์ค๋ผ์ธ ๊ธฐ๋ฒ๋ค๋ณด๋ค ๋์ฑ ์์ฐ์ค๋ฌ์ด Image Deformation์ ์์ฑํ ์ ์์์ ๋ณด์ฌ์ค๋๋ค.

Interactive Demo๋ ์ฒดํํด๋ณด์๊ธฐ๋ฅผ ๋ฐ๋๋๋ค. ์ฌ์ฉ์๊ฐ ์ง๊ด์ ์ธ Deformation Handle (Keypoint)๋ฅผ ์ด์ฉํ์ฌ ์์์ ๋ณํํ ์ ์์ต๋๋ค.
5. Conclusion
๋ณธ ์ฐ๊ตฌ์์๋ Shape Laplacian์ ํ์ตํจ์ผ๋ก์จ ๋ณด๋ค ์์ฐ์ค๋ฌ์ด 3D-Aware Deformation์ ๊ฐ๋ฅํ๊ฒํ๋ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์์ต๋๋ค. ์ ํฌ๊ฐ ์๊ธฐ๋ก๋ ์ด๊ฐ ๋ด๋ด๋ท ๊ธฐ๋ฐ ๊ธฐ๋ฒ์ด Shape Lapacian ์์ธก์ ํจ๊ณผ์ ์ผ ์ ์์์ ์ฒ์์ผ๋ก ๋ณด์ธ ์ฐ๊ตฌ๋ผ๊ณ ์๊ณ ์์ต๋๋ค. ๋ณธ ํ๋ ์์ํฌ๋ฅผ ๋ฐ์ ์ํค๊ธฐ ์ํ ๋์ฑ ๋ค์ํ ์์ด๋์ด๊ฐ ๋ง์๋ฐ, ๊ธฐํ๊ฐ ๋๋ค๋ฉด ํด๋น ๋ฐฉํฅ์ผ๋ก ๋์ฑ ์ฐ๊ตฌํด๋ณด๊ณ ์ถ์ต๋๋ค.
Take-Home Message (์ค๋์ ๊ตํ)
์ ๊ฐ ๊ฐ์ธ์ ์ผ๋ก ์ด ํ๋ก์ ํธ๋ฅผ ํตํด ๋ฐฐ์ด ๊ตํ์ "๋๊น์ง ํฌ๊ธฐํ์ง ์๊ณ ์ง๋ ์ ๊ฐ์ง๋ฉฐ ์ฐ๊ตฌ ๋ฌธ์ ๋ฅผ ํ์"๋ ๊ฒ์ ๋๋ค. ๋ณธ ํ๋ ์์ํฌ ๊ฐ๋ฐ ๋จ๊ณ์์ ์์ํ Challenge๋ค์ด ๋ง์์๊ณ , ๊ทธ ๊ณผ์ ์ค ์๋ ์งํํ๋ ค๋ ์ฐ๊ตฌ ๋ฐฉํฅ์ผ๋ก๋ถํฐ ํฌ๊ฒ ๋ฐ๋์ด ๋ง๋ฌด๋ฆฌ๋ ๋ถ๋ถ๋ ์์ต๋๋ค. ๊ทธ๋๋ ๋์ํ๋ ์๋ฃจ์ ์ ์ฐพ์๋ด๊ณ ๋ป ๊น๊ฒ ํ๋ก์ ํธ๋ฅผ ๋ง๋ฌด๋ฆฌํ ์ ์์ด์ ๊ฐ์ธ์ ์ผ๋ก๋ ๋งค์ฐ ๊ธฐ์ต์ ๋จ๋ ์ฐ๊ตฌ ๊ฒฝํ์ด ๋์์ต๋๋ค. ๊ทธ ๊ณผ์ ์ค ํฐ ๋์๊ณผ ์กฐ์ธ์ ์ฃผ์ ๋ ์ง๋ ๊ต์๋๊ป ๊น์ ๊ฐ์ฌ๋ฅผ ๋๋ฆฝ๋๋ค.
Author / Reviewer information
Author
์ด์งํ (Jihyun Lee)
KAIST CS
I am a first-year Ph.D. student in Computer Vision and Learning Lab at KAIST advised by Prof. Tae-Kyun Kim. I am also currently co-advised by Prof. Minhyuk Sung. My research interests lie in machine learning for 3D computer vision and graphics - especially on humans.
Reviewer
Korean name (English name): Affiliation / Contact information
Korean name (English name): Affiliation / Contact information
...
Reference & Additional materials
Citation of related work
Alec Jacobson, Ilya Baran, Jovan Popovic, and Olga Sorkine. Bounded biharmonic weights for real-time deformation. In SIGGRAPH, 2011.
Shunsuke Saito, Zeng Huang, Ryota Natsume, Shigeo Morishima, Angjoo Kanazawa, and Hao Li. PIFu: Pixel-aligned implicit function for high-resolution clothed human digitization. In ICCV, 2019.
Hengshuang Zhao, Li Jiang, Jiaya Jia, Philip HS Torr, and Vladlen Koltun. Point transformer. In ICCV, 2021.
Federica Bogo, Javier Romero, Gerard Pons-Moll, and Michael J. Black. Dynamic FAUST: Registering human bodies in motion. In CVPR, 2017.
Renderpeople GmbH. RenderPeople. https://renderpeople.com/.
Adobe Systems Inc. Mixamo. https://www.mixamo.com.
Michael Kazhdan and Hugues Hoppe. Screened poisson surface reconstruction. ACM TOG, 2013.
Gael Guennebaud and Markus Gross. Algebraic point set surfaces. In SIGGRAPH, 2007.
Fausto Bernardini, Joshua Mittleman, Holly Rushmeier, Claudio Silva, and Gabriel Taubin. The ball-pivoting algorithm for surface reconstruction. IEEE TVCG, 1999.
Jeong Joon Park, Peter Florence, Julian Straub, Richard Newcombe, and Steven Lovegrove. DeepSDF: Learning continuous signed distance functions for shape representation. In CVPR, 2019.
Francis Williams, Teseo Schneider, Claudio Silva, Denis Zorin, Joan Bruna, and Daniele Panozzo. Deep geometric prior for surface reconstruction. In CVPR, 2019.
Minghua Liu, Xiaoshuai Zhang, and Hao Su. Meshing point clouds with predicted intrinsic-extrinsic ratio guidance. In ECCV, 2020.
Mikhail Belkin, Jian Sun, and Yusu Wang. Constructing laplace operator from point clouds in rd. In Proc. Annu. ACM-SIAM Symp. Discrete Algorithms, pages 1031โ1040. SIAM, 2009.
Nicholas Sharp and Keenan Crane. A laplacian for nonmanifold triangle meshes. In SGP, 2020.
Last updated
Was this helpful?