Chaining a U-Net With a Residual U-Net for Retinal Blood Vessels Segmentation [Kor]
CURU-kor
1. Problem definition
์ค์ง ๋ง๋ง์์๋ง ์ฌํ๊ด๊ณ(cardiovascular system)๋ฅผ ๋น์นจ์ต์ ์ผ๋ก ๊ด์ฐฐ ๊ฐ๋ฅํ๋ฐ
์ด๋ฅผ ํตํด ์ฌํ๊ด ์งํ์ ๋ฐ๋ฌ๊ณผ ๋ฏธ์ธํ๊ด์ ํํ๋ณํ์ ๊ฐ์ ์ ๋ณด๋ฅผ ์ป์ ์ ์๋ค.
๋ ์ด๋ฅผ ์๊ณผ ์ง๋จ์ ์ค์ํ ์งํ์ธ๋ฐ
๋ณธ ์ฐ๊ตฌ์์๋, U-Net(+ Residual U-net) ๋ชจ๋ธ์ ํ์ฉํด ๋ง๋ง ์ด๋ฏธ์ง๋ก๋ถํฐ ํ๊ด์ ํด๋นํ๋ ํฝ์ ๋ค์ ๊ตฌ๋ถํ๋ค.(Image Segmentation)
์ด๋ก ๋ถํฐ ํ๊ด๋ค์ ํํํ์ ๋ฐ์ดํฐ๋ฅผ ํ๋ํ๋ค.
โ ๊ธฐ์กด ๋ฐฉ๋ฒ๋ค์ ๋นํด ํ๋ จ์๊ฐ๊ณผ ์ฑ๋ฅ ์ฌ์ด์ ํธ๋ ์ด๋ ์คํ๋ฅผ ์ต์ํ ์ํค๋ ๋ฐฉํฅ์ผ๋ก ์งํํ์


U-Net : Biomedical ๋ถ์ผ์์ ์ด๋ฏธ์ง ๋ถํ (Image Segmentation)์ ๋ชฉ์ ์ผ๋ก ์ ์๋ End-to-End ๋ฐฉ์์ Fully-Convolutional Network ๊ธฐ๋ฐ ๋ชจ๋ธ
Link: U-net
2. Motivation
Related work
๋ง๋ง ํ๊ด ๋ถํ ์ ์ํ ๋ง์ ๋ฐฉ๋ฒ๋ค์ด ์ ์๋์๊ณ , ํ์ฌ๋ ๋๋ถ๋ถ CNN์ ๊ธฐ๋ฐ์ผ๋ก ๊ตฌ์ฑ๋์ด ์๋ค.
[Cai et al., 2016] ์ฐ๋ฆฌ๊ฐ ์ ์๊ณ ์๋ VGG net๋ํ CNN์ ๊ธฐ๋ฐ์ผ๋ก ํ๊ณ ์๋ค.
[Dasgupta et al., 2017] CNN๊ณผ ๊ตฌ์กฐํ๋ ์์ธก(structured prediction)์ ๊ฒฐํฉํ์ฌ ๋ค์ค ๋ ์ด๋ธ ์ถ๋ก ์์ (multi-label inference task)์ ์ํํจ.
[Alom et al., 2018] ์๋ฅ ๋ธ๋ก(residual blocks)์ ๋์ ํ๊ณ recurrent residual Convolution Layer๋ก ๋ณด์ํ์๋ค.
[Zhuang et al., 2019] ๋ ๊ฐ์ U-net์ ์์ ์๋ฅ ๋ธ๋ก(residual blocks)์ ๊ฒฝ๋ก๋ฅผ ์ฆ๊ฐ์์ผฐ๋ค.
[Khanal et al., 2019] ๋ชจํธํ ํฝ์ ์ ๋ํด ํ๋ฒ ๋ ์ถ์๋ ๋คํธ์ํฌ๋ฅผ ์ฌ์ฉํ์ฌ ๋ฐฐ๊ฒฝ ํฝ์ ๊ณผ ํ๊ด ์ฌ์ด์ ๊ท ํ์ ์ ์ก๊ธฐ ์ํด ํ๋ฅ ์ ๊ฐ์ค์น(stochastic weights)๋ฅผ ์ฌ์ฉํ๋ค.
Idea
๋ณธ ์ฐ๊ตฌ๋ U-Net1 ๊ณผ U-Net2 with residual blocks๋ฅผ ์๋ก ์ฐ๊ฒฐ์ํจ ๊ตฌ์กฐ๋ฅผ ์ ์ํ๋ค.
์ฒซ ๋ฒ์งธ ๋ถ๋ถ(U-Net1)์ ํน์ง ์ถ์ถ์ ์ํํ๊ณ
๋ ๋ฒ์งธ ๋ถ๋ถ(U-Net2 with residual blocks)์ ์๋ฅ ๋ธ๋ก(residual block)์ผ๋ก ๋ถํฐ ์๋ก์ด ํน์ง์ ๊ฐ์งํ๊ณ ๋ชจํธํ ํฝ์ ์ ๊ฐ์งํ๋ค.


3. Method
๋ณธ ์ฐ๊ตฌ์ ์ํฌํ๋ก์ฐ(work flow)๋ ์๋์ ๊ฐ๋ค.
์ด๋ฏธ์งํ๋
๋ง๋ง ์ด๋ฏธ์ง๋ฅผ ์์ง
์ ์ฒ๋ฆฌ(pre-processing)
ํน์ง ์ถ์ถ(feature extraction), ํน์ ํจํด highliting, ์ ๊ทํ ๋ฑ์ ์งํ
์ด ์ค์์ CNN architecture์ ์ ์ฉํ ํน์ฑ(characteristics)๋ค์ ์ ํ
์ฑ๋ฅ ํ๊ฐ ๋ฐ ๊ฐ์ค์น ์กฐ์
์ต์์ ๊ฒฐ๊ณผ๋ฅผ ์ํด ํด๋น ๊ณผ์ ์ ์ง์์ ์ผ๋ก ์งํ
๊ฒฐ๊ณผํด์
1. Pre-Processing
์ ์ฒ๋ฆฌ๋ฅผ ํตํด ์ด๋ฏธ์ง์ ํ์ง์ ํฅ์์ํฌ ์ ์๋๋ฐ, ์ด๋ CNN์ด ํน์ ํน์ฑ ํ์ง์ ๋งค์ฐ ์ค์ํ ๋จ๊ณ์ด๋ค.
Step1
RGB์ด๋ฏธ์ง๋ฅผ ํ๋ฐฑ์ด๋ฏธ์ง๋ก ๋ณํํด์ค๋ค. ์ด๋ ํ๊ด๊ณผ ๋ฐฐ๊ฒฝ(background)์ ๋๋น๋ฅผ ๋์ฌ ๊ตฌ๋ถ์์ผ์ค๋ค.
๊ด๋ จ์์ ์๋์ ๊ฐ๋ค
์ฌ๊ธฐ์, R G B๋ ๊ฐ๊ฐ ์ด๋ฏธ์ง์ ์ฑ๋์ด๋ค. ์ ์์์๋, G(Green)์ ๊ฐ์ฅ ๊ฐ์กฐ์์ผฐ๋ค. ๋
น์์ด ๊ฐ์ฅ ๋
ธ์ด์ฆ๊ฐ ์ ๊ณ ์ด๋ฏธ์ง์ ๋ํ
์ผํ ๋ถ๋ถ ๊น์ง ํฌํจํ๋ค๊ณ ํ๋ค.
Step2
๋ฐ์ดํฐ ์ ๊ทํ(normalization) ๋จ๊ณ์ด๋ค. ์ด ๋จ๊ณ๋ ๋ถ๋ฅ ์๊ณ ๋ฆฌ์ฆ๊ณผ ํนํ ์ญ์ ํ(backpropagation) ์ ๊ฒฝ๋ง ๊ตฌ์กฐ์ ๋งค์ฐ ์ ์ฉํ๋ค. ๊ฐ ํ๋ จ ๋ฐ์ดํฐ(trainig data)๋ก ๋ถํฐ ์ถ์ถ๋ ๊ฐ๋ค์ ์ ๊ทํํ๋ค๋ฉด ํ๋ จ์๋ ํฅ์์ ๊ธฐ๋ํ ์ ์๋ค.
๋ณธ ์ฐ๊ตฌ์์๋ 2๊ฐ์ง์ ์ ๊ทํ ๋ฐฉ๋ฒ์ด ์ฌ์ฉ๋์๋ค. ํ๊ธฐ ๋ 2๊ฐ์ง ๋ฐฉ๋ฒ์ด ๊ฐ์ฅ ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉ๋๋ ๋ฐฉ๋ฒ์ด๋ผ๊ณ ํ๋ค.
์ต์-์ต๋ ์ ๊ทํ(Min-Max normalization)
๋ฐ์ดํฐ๋ฅผ ์ ๊ทํํ๋ ๊ฐ์ฅ ์ผ๋ฐ์ ์ธ ๋ฐฉ๋ฒ์ด๋ค. ๋ชจ๋ feature์ ๋ํด ๊ฐ๊ฐ์ ์ต์๊ฐ 0, ์ต๋๊ฐ 1๋ก, ๊ทธ๋ฆฌ๊ณ ๋ค๋ฅธ ๊ฐ๋ค์ 0๊ณผ 1 ์ฌ์ด์ ๊ฐ์ผ๋ก ๋ณํํ๋ ๊ฑฐ๋ค. ์๋ฅผ ๋ค์ด ์ด๋ค ํน์ฑ์ ์ต์๊ฐ์ด 20์ด๊ณ ์ต๋๊ฐ์ด 40์ธ ๊ฒฝ์ฐ, 30์ ๋ฑ ์ค๊ฐ์ด๋ฏ๋ก 0.5๋ก ๋ณํ๋๋ค. ์ด๋ ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์ ํ๋ณํํ๊ณ ์๋ ๊ฐ์ ๋ณด์กดํ ์ ์๋ค.
๋ง์ฝ v๋ผ๋ ๊ฐ์ ๋ํด ์ต์-์ต๋ ์ ๊ทํ๋ฅผ ํ๋ค๋ฉด ์๋์ ๊ฐ์ ์์์ ์ฌ์ฉํ ์ ์๋ค.

vโฒ: ๋ ์ ๊ทํ๋ ๊ฐ
v: ์๋ ๊ฐ
A: ์์ฑ ๊ฐ (์ฌ๊ธฐ์๋ ๊ฐ ์ฑ๋์ ๋ฐ๊ธฐ์ด๋ค. 0์ด๋ฉด ๊ฐ์ฅ ์ด๋ก๊ณ , 255๋ ๊ฐ์ฅ๋ฐ๋ค)
MAXA: ์ ๋ ฅ ๋ฐ์ดํฐ(์ด๋ฏธ์ง)๋ด์์ ๊ฐ์ฅ ์์ ๋ฐ๊ธฐ ๊ฐ
MINA: ์ ๋ ฅ ๋ฐ์ดํฐ(์ด๋ฏธ์ง)๋ด์์ ๊ฐ์ฅ ํฐ ๋ฐ๊ธฐ ๊ฐ
Z-์ ์ ์ ๊ทํ(Z-Score Normalization)
Z-์ ์ ์ ๊ทํ๋ ์ด์์น(outlier) ๋ฌธ์ ๋ฅผ ํผํ๋ ๋ฐ์ดํฐ ์ ๊ทํ ์ ๋ต์ด๋ค. ๋ง์ฝ feature์ ๊ฐ์ด ํ๊ท ๊ณผ ์ผ์นํ๋ฉด 0์ผ๋ก ์ ๊ทํ๋๊ฒ ์ง๋ง, ํ๊ท ๋ณด๋ค ์์ผ๋ฉด ์์, ํ๊ท ๋ณด๋ค ํฌ๋ฉด ์์๋ก ๋ํ๋๋ค. ์ด ๋ ๊ณ์ฐ๋๋ ์์์ ์์์ ํฌ๊ธฐ๋ ๊ทธ feature์ ํ์คํธ์ฐจ์ ์ํด ๊ฒฐ์ ๋๋ ๊ฒ์ด๋ค. ๊ทธ๋์ ๋ง์ฝ ๋ฐ์ดํฐ์ ํ์คํธ์ฐจ๊ฐ ํฌ๋ฉด(๊ฐ์ด ๋๊ฒ ํผ์ ธ์์ผ๋ฉด) ์ ๊ทํ๋๋ ๊ฐ์ด 0์ ๊ฐ๊น์์ง๋ค. ์ต๋-์ต์ ์ ๊ทํ์ ๋นํด ์ด์์น(outlier)์ ํจ๊ณผ์ ์ผ๋ก ์ฒ๋ฆฌํ ์ ์๋ค.

ฯA: ํ์คํธ์ฐจ
Aโฒ: A์ ํ๊ท ๊ฐ
Step3
์ธ ๋ฒ์งธ ๋จ๊ณ๋ ํ๋ฐฑ ๋ง๋ง ์ด๋ฏธ์ง์ ์ธ๋ถ ์ฌํญ์ ๊ท ์ผํ๊ฒ ๊ฐ์ ํ๋ ํจ๊ณผ์ ์ธ ๋ฐฉ๋ฒ์ธ "๋๋น ์ ํ ์ ์ ํ์คํ ๊ทธ๋จ ๊ท ๋ฑํ(Contrast Limited Adaptive Histogram Equalization, CLAHE)"๋ฅผ ์ ์ฉํ๋ ๊ฒ์ด๋ค.
์ด๋ฏธ์ง์ ํ์คํ ๊ทธ๋จ์ด ํน์ ์์ญ์ ๋๋ฌด ์ง์ค๋์ด ์์ผ๋ฉด contrast๊ฐ ๋ฎ์ ์ข์ ์ด๋ฏธ์ง๋ผ๊ณ ํ ์ ์์
์ ์ฒด ์์ญ์ ๊ณจ๊ณ ๋ฃจ ๋ถํฌ๊ฐ ๋์ด ์์ ๋ ์ข์ ์ด๋ฏธ์ง๋ผ๊ณ ํ ์ ์๋๋ฐ, ํน์ ์์ญ์ ์ง์ค๋์ด ์๋ ๋ถํฌ๋ฅผ ๊ณจ๊ณ ๋ฃจ ๋ถํฌํ๋๋ก ํ๋ ์์ ์ Histogram Equalization ์ด๋ผ๊ณ ํจ
๊ธฐ์กด ํ์คํ ๊ทธ๋จ ๊ท ์ผํ ์์ ์ ์ ์ฒด ํฝ์ ์ ๋ํด ์งํํด ์ํ๋ ๊ฒฐ๊ณผ๋ฅผ ์ป๊ธฐ ํ๋ ๋ฐ๋ฉด, CLAHE๋ ์ด๋ฏธ์ง๋ฅผ ์ผ์ ํ ํฌ๊ธฐ๋ฅผ ์์ ๋ธ๋ก์ผ๋ก ๊ตฌ๋ถํ์ฌ ๊ท ์ผํ๋ฅผ ์งํํ๊ธฐ ๋๋ฌธ์ ์ข์ ํ์ง์ ์ด๋ฏธ์ง๋ฅผ ์ป์ ์ ์๋ค.
Link: CLAHE
Step4
๋ง์ง๋ง ๋จ๊ณ๋ ๊ฐ๋ง ๊ฐ์ ํตํด ๋ฐ๊ธฐ๋ฅผ ์กฐ์ ํ๋ ๊ฒ์ด๋ค. ์ด๋ ๋ฐ๊ธฐ๊ฐ ํ๊ณณ์ ์ง์ค๋์ด ํน์ง ์ถ์ถ์ ์ฅ์ ๊ฐ ๋๋ ๊ฒ์ ๋ฐฉ์งํด์ค๋ค.
์ ์ฒ๋ฆฌ๋ฅผ ๊ฑฐ์ณ ํ๋ํ ์ด๋ฏธ์ง๋ ์๋์ ๊ฐ๋ค

์ ์ฒ๋ฆฌํ ์ด๋ฏธ์ง๋ก ๋ถํฐ ํจ์น(patches)๋ฅผ ์ถ์ถํ์ฌ ๋ ํฐ ๊ท๋ชจ์ ๋ฐ์ดํฐ ์ธํธ๋ฅผ ํ๋ํ๊ณ ๊ตฌ์ฑ๋ ์ ๊ฒฝ๋ง ํ๋ จ์ ์ด์ฉํ๋ค. ๋ ์ด ํจ์น(patches)์ ์ฌ๋ฌ๊ฐ์ง ๋ณํ(flipping)์ ์ฃผ์ด ๊ฐ์ฉ ๋ฐ์ดํฐ๋ฅผ ์ถ๊ฐ ํ๋ณดํ๋ค.
2. Architecture
๋ณธ ์ฐ๊ตฌ์์๋ ์ด์ค ์ฐ๊ฒฐ๋ U-Net์ ์ฌ์ฉ๋์๊ณ , ๋ ๋ฒ์งธ ๋ถ๋ถ์ ์๋ฅ ๋คํธ์ํฌ(residual network)๊ฐ ์ฌ์ฉ๋์๋ค.
U-Net์ ์ด๋ฏธ์ง์ ์ ๋ฐ์ ์ธ ์ปจํ ์คํธ ์ ๋ณด๋ฅผ ์ป๊ธฐ ์ํ ๋คํธ์ํฌ์ ์ ํํ ์ง์ญํ(Localization)๋ฅผ ์ํ ๋คํธ์ํฌ๊ฐ ๋์นญ ํํ๋ก ๊ตฌ์ฑ๋์ด ์๋ค.
U-Net:
The Contracting Path
3x3 convolutions์ ๋ ์ฐจ๋ก์ฉ ๋ฐ๋ณต (ํจ๋ฉ ์์)
ํ์ฑํ ํจ์๋ ReLU
2x2 max-pooling (stride: 2)
Down-sampling ๋ง๋ค ์ฑ๋์ ์๋ฅผ 2๋ฐฐ๋ก ๋๋ฆผ
Expanding Path๋ Contracting Path์ ๋ฐ๋์ ์ฐ์ฐ์ผ๋ก ํน์ง๋งต์ ํ์ฅํ๋ค.
The Expanding Path
2x2 convolution (โup-convolutionโ)
3x3 convolutions์ ๋ ์ฐจ๋ก์ฉ ๋ฐ๋ณต (ํจ๋ฉ ์์)
Up-Conv๋ฅผ ํตํ Up-sampling ๋ง๋ค ์ฑ๋์ ์๋ฅผ ๋ฐ์ผ๋ก ์ค์
ํ์ฑํ ํจ์๋ ReLU
Up-Conv ๋ ํน์ง๋งต์ Contracting path์ ํ ๋๋ฆฌ๊ฐ Cropped๋ ํน์ง๋งต๊ณผ concatenation ํจ
๋ง์ง๋ง ๋ ์ด์ด์ 1x1 convolution ์ฐ์ฐ ์์ ๊ฐ์ ๊ตฌ์ฑ์ผ๋ก ์ด 23-Layers Fully Convolutional Networks ๊ตฌ์กฐ์ด๋ค. ์ฃผ๋ชฉํด์ผ ํ๋ ์ ์ ์ต์ข ์ถ๋ ฅ์ธ Segmentation map์ ํฌ๊ธฐ๋ Input Image ํฌ๊ธฐ๋ณด๋ค ์๋ค๋ ๊ฒ์ด๋ค. Convolution ์ฐ์ฐ์์ ํจ๋ฉ์ ์ฌ์ฉํ์ง ์์๊ธฐ ๋๋ฌธ์ด๋ค.
์๋ฅ ๋ธ๋ก(Residual block):
์ดํ(Degradation) ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์๋ฅ๋ธ๋ก๋ ์ ์๋์๋ค.
์ฌ๊ธฐ์ FM(x)์ F(x)๋ก ํํ๋๋ ์
๋ ฅ ํ์์ ๋ ๊ฐ์ ์ปจ๋ณผ๋ฃจ์
๋ ์ด์ด๋ฅผ ์ ์ฉํ๋ ๊ฒ์์ ์์๋๋ ํ์ ๋งต์ด๋ฉฐ, ์ด ๋ณํ์ ์๋ ์
๋ ฅ x๊ฐ ์ถ๊ฐ๋์๋ค. ์๋ ํ์ ๋งต์ ์ถ๊ฐํ๋ฉด ๋ชจ๋ธ์ ๋ํ๋๋ ์ดํ ๋ฌธ์ ๊ฐ ์ํ๋๋ค. ์๋๋ ๋ณธ ์์
์ ์ฌ์ฉ๋ ํ๋ก์ธ์ค์ด๋ค.

U-Net2 with Residual blocks:
U-Net ๋คํธ์ํฌ์ ์ถ๋ ฅ๊ณผ ๋ ๋ฒ์งธ ๋คํธ์ํฌ์ ์ ๋ ฅ์ ๊ตฌ์ฑํ๋ค. ๊ฐ ์์ค์ ์ฑ๋ ์์ ์ด๋ฏธ์ง ํฌ๊ธฐ๋ ์ ์ ๋ฐ์ ๋์ฝ๋ฉ ๋ถ๋ถ๊ณผ ๋์ผํ๊ฒ ์ ์ง๋์๋ค. ํ์ง๋ง Contracting๊ณผ Expanding ๋ชจ๋ ์๋ก์ด ์์ค์์ ์๋ฅ ๋ธ๋ญ์ด ์ถ๊ฐ๋์๋ค. ๊ทธ๋ฆฌ๊ณ ๋ง์ง๋ง Expanding์์ ์ด์ง ๋ถ๋ฅ ์์ ์ด ์ํ๋๋ฏ๋ก, 1x1 ์ปจ๋ณผ๋ฃจ์ ์ ์ ์ฉํ์๋ค.

ํด๋น ์ด๋ฏธ์ง์ ํฝ์ ์ ๋๋ถ๋ถ ๋ฐฐ๊ฒฝ์ด๊ณ ์์๋ง์ด ํ๊ด ๊ตฌ์กฐ๋ฅผ ๋ํ๋ธ๋ค(ํด๋์ค ๋ถ๊ท ํ). ์ด ๋๋ฌธ์ ์์คํจ์๊ฐ ์ฌ์ฉ๋๊ณ ๋ฐฉ์ ์์ ์๋์ ๊ฐ๋ค.

์ด ํจ์๋ ๋ถ๋ฅ๊ฐ ์๋ชป๋์๊ฑฐ๋ ๋ถ๋ถ๋ช
ํ ๋ ๋์ ์์ค ๊ฐ์ ์ฃผ๊ณ ์์ธก์ด ๋ชจํ์ ์์๊ณผ ์ผ์นํ ๋ ๋ฎ์ ์์ค ๊ฐ์ ๋ถ์ฌํ์ฌ ๋ฐ์ดํฐ์ ์ ์ฒด ํ๋ฅ ์ ์ต๋ํ ํ๋ค. ๋ก๊ทธ๋ ํจ๋ํฐ๋ฅผ ์ํํ๊ณ , ํ๋ฅ ์ด ๋ฎ์์๋ก ๋ก๊ทธ๊ฐ์ ์ฆ๊ฐํ๋ค. ํ๋ฅ ๋ค์ 0๊ณผ 1 ์ฌ์ด์ ๊ฐ์ ๊ฐ์ง๋ค. ๊ทธ๋ฆฌ๊ณ ๊ฐ ํด๋์ค์ ๊ฐ์ค์น ๋ถ์ฌํ๋ค.

์ฌ๊ธฐ์ ๋ฌด๊ฒ w๋ 1๊ณผ ฮฑ ๊ฐ ์ฌ์ด์์ ๋ฌด์์๋ก ๋ณํํ๋ฉฐ, s๋ ์คํ ์ด๋ค. ์ด๋ฌํ ๋์ ๊ฐ์ค์น ๋ณํ๋ ๋คํธ์ํฌ๊ฐ ์ง์ญ ์ต์๊ฐ์ผ๋ก ๋จ์ด์ง๋ ๊ฒ์ ๋ฐฉ์งํ๋ค. ๋ก๊ทธ ํ๋ฅ ์ ์ป๊ธฐ ์ํด LogSoftmax ํจ์๊ฐ ์ ๊ฒฝ๋ง ๋ง์ง๋ง ๋ ์ด์ด์ ์ ์ฉ๋๋ค.
4. Experiment & Result
Dataset
DRIVE
Each image resolution is 584*565 pixels with eight bits per color channel (3 channels).
20 images for training set
20 images for testing set
CHASEDB
Each image resolution is 999*960 pixels with eight bits per color channel (3 channels).
Evaluation metric
๋ง๋ง ์ด๋ฏธ์ง๋ ํด๋์ค์ ๋ถ๊ท ํ์ ๋ณด์ฌ์ฃผ๋ฏ๋ก ์ ์ ํ metric์ ์ ํํด์ผ ํ๋ค. ๋ณธ ๋ ผ๋ฌธ์์๋ Recall, precision, F1-score, accurarcy๋ฅผ ์ฑํํ์๋ค.
Recall: tells us how many relevant samples are selected.

Precision: tells us how many predicted samples are relevant.

F1-Score: is the harmonic mean between recall and precision.

Accuracy: measures how many observations, both positive and negative, were correctly classified.

Results
1. ์ ๋ฐ์ ์ฑ๋ฅ

์๊ธฐ๋ ์ธก์ ์งํ๋ค์ ๋ฐํ์ผ๋ก, ์ ํ ์ฐ๊ตฌ๋ค๊ณผ ์ฑ๋ฅ์ ๋น๊ตํจ
F1-Score์ ๋์ ์์น๋์ Precision ๊ณผ Recall ๋ชจ๋ ๊ณจ๊ณ ๋ฃจ ๋์ ๊ฐ์ ๊ฐ์ง -ํ๊ด ๋ถ๋ฅ์ ์ ํฉํจ
Accuracy์์๋ ๊ฐ์ฅ ๋์ ์์น๋ฅผ ๋ณด์ฌ์ฃผ์๊ณ , F1-Score์ ๋ํด์ 2๋ฒ์งธ๋ก ๋์ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ์ค
๋ณธ ์ฐ๊ตฌ๋ ๋๋ถ๋ถ์ ๊ฒฝ์ฐ ground truth์ ์ผ์นํ์๊ณ , FP, FN ๋ํ ์ ๋ค๊ณ ๋ณผ์ ์๋ค.
2. ์์์๊ฐ

๋ณธ ์ํคํ ์ณ๋ Khanal et al. ์ ๋นํด ๋ง์ ์๊ฐ์ ๋จ์ถ์์ผฐ๋ค
DRIVE ๋ฐ์ดํฐ ์ ์ ๋ํด์๋ ์ฝ 1์๊ฐ
CHASEDB ๋ฐ์ดํฐ ์ ์ ๋ํด์๋ ์ฝ 10์๊ฐ
3. ๋ถํ (segmentation)๊ณผ ๊ตฌ์กฐ ์ ์ฌ๋ ์ง์(The structural similarity index, SSIM)
Drive ๋ฐ์ดํฐ์
๊ณผ CHASEDB ๋ฐ์ดํฐ์
์ ๋ถํ (segmentation)๊ฒฐ๊ณผ
๊ตฌ์กฐ ์ ์ฌ๋ ์ง์(The structural similarity index, SSIM) ์ ๋ถํ (segmentation) ํ๋ก์ธ์ค๋ฅผ ํ๊ฐํ๊ธฐ์ํด ๋์
ํจ, U-Net1 ๋ง ์๋ ์ฒซ ๋ฒ์งธ ๋จ๊ณ์ ์๋ฅ ๋ธ๋ก์ด ์ถ๊ฐ๋ ๋ ๋ฒ์งธ ๋จ๊ณ(U-Net2 with residual block)๋ฅผ ๋น๊ตํ๊ธฐ ์ํจ.

๊ตฌ์กฐ ์ ์ฌ๋ ์ง์๋ gtound truth์ ํ ์คํธ ์ด๋ฏธ์ง๋ค ๊ฐ์ viewing distance์ edge information๋ฅผ ๋ถ์ํ๋ค. ์ด๋ ์ด๋ฏธ์ง ํ์ง ์ ํ๋ฅผ ์์นํํ์ฌ ์ธก์ ํ๋ค.(์ด๋ฏธ์ง ์์ถ ๊ฐ์ ๊ณณ์์ ์ฌ์ฉ) ์ด๋ 0 ~ 1 ์ ๊ฐ์ ๊ฐ์ง๊ณ , ๋์์๋ก ์ข๋ค. ๊ทธ๋ฆผ 6์ U-Net1๊ณผ ground truth๋ฅผ ๋น๊ตํ ๊ฒ์ด๊ณ , ๊ทธ๋ฆผ 7์ ์ ์ฒด ์ํคํ ์ณ(U-Net1 + U-Net2 with residual block)๊ณผ ground truth์ ๋น๊ตํ๊ฒ์ด๋ค. ํ์๊ฐ ๋ ๋์ ์์น๋ฅผ ๊ฐ์ง๋ค.
4. ๋ถํ (segmentation) ์ฑ๋ฅ์ ์ํฅ์ ์ฃผ๋ ์์
Chunk(๋ฉ์ด๋ฆฌ์ง ํ๊ด)

ํ๋์ ๋๊ทธ๋ผ๋ฏธ์น ๋ถ๋ถ์ ๋ณด๋ฉด, ํ๊ด๋ค์ด ๋น๊ต์ ๋ญ์ณ์๋ ๊ฒ์ ๋ณผ์ ์๋ค. ์ด๋ฏธ์ง ๋ถํ (segmentation)์์ ์ค์ํ ๋ฌธ์ ์ธ๋ฐ, ์๋ ์ ๊ตฌ๋ถํ ๊ฒ์ ๋ณผ ์ ์๋ค.
๋ณ๋ณ ๋ถ์๋ฅผ ์ ํผํด๊ฐ๋์ง
DRIVE ๋ฐ์ดํฐ์
์๋ 7๊ฐ์ ๋ณ๋ณ์ด ํฌํจ๋ ์ด๋ฏธ์ง๊ฐ ์๋๋ฐ, ์ด๋ฅผ ํ๊ด์ผ๋ก ์ฐฉ๊ฐํ๊ณ ๋ถํ (segmentation)์ ํ ์ ์๋ค. ์ ์ฌ์ง์ ๋ณด๋ฉด, ๋ณ๋ณ๋ถ์(c)๋ฅผ ํผํด ์ ์ํ ๋๊ฒ์ผ๋ก ๋ณด์ธ๋ค.
โ ์์นํ๋ ์งํ๊ฐ ์์์ผ๋ฉด ์ข๊ฒ ๋ค.
5. Conclusion
๋ณธ ์ฐ๊ตฌ์ ๋ ธ๋ฒจํฐ๋ ํฌ๊ฒ 2๊ฐ์ง๋ก ๋ณผ ์ ์๋ค.
์ฒซ ๋ฒ์งธ, ๊ธฐ์กด U-Net ๋คํธ์ํฌ์ ์๋ฅ ๋ธ๋ญ์ ์ถ๊ฐํ ๊ฒ์ด๋ค. ์ด๋ ์ด๋ฏธ์ง์ ์ดํ(degradation)์ ์ํํ๋๋ฐ ํฐ ๊ธฐ์ฌ๋ฅผ ํ๋ค.
๋ ๋ฒ์งธ, ์์ U-Net์์ ์ป์ ์ ๋ณด๋ฅผ ๋ค์ U-Net(U-Net with residual blocks)์ ์๋ฅ ๋ธ๋ญ๊ณผ ์ฐ๊ฒฐ์์ผ ์ ๋ณด์์ค์ ์ต์ํ ํ์๋ค.
๋ณธ ์ฐ๊ตฌ๋ ์ฑ๋ฅ๊ณผ ํ๋ จ์๊ฐ ๋๋ค ์ก์๋ค.
์ ํ ์ฐ๊ตฌ์ ๋น์ทํ ์์ค์ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ์ง๋ง
ํ๋ จ์๊ฐ์ ํฌ๊ฒ ๋จ์ถ ์์ผฐ๋ค๋ ๊ฒ์ ์์๋ฅผ ๋ ์ ์๋ค.
์ด๋ฏธ์ง ์ ์ฒ๋ฆฌ ๊ณผ์
๊ทธ๋ ์ด ์ค์ผ์ผ๋ก ๋ณํ, ์ ๊ทํ, CLAHE, ๊ฐ๋ง๊ฐ ์กฐ์ ์์ ์ผ๋ก ํ์ง ์ข์ ์ ๋ ฅ ์ด๋ฏธ์ง๋ก ๋ง๋ค์๊ณ
์๋ณธ ์ด๋ฏธ์ง๋ฅผ ํจ์น(patch)์์ ํ์ฌ ๋ถ์กฑํ๋ ๋ฐ์ดํฐ๋ค์ ์ฆ๊ฐํ์ฌ ํ๋ณดํจ
Take home message (์ค๋์ ๊ตํ)
์ ํ๋ ๋์ ์ด๋ฏธ์ง ๋ถํ ์ ์ํด์๋ ๋ง์ ์๊ฐ๊ณผ ๋ ธ๋ ฅ์ด ํ์ํ๋ค. ๋ณธ ๋ ผ๋ฌธ ์์๋ ๊ธฐ์กด์ ์ ์๋ architecture๋ค์ ์ ํ์ฉํ์๊ณ , ์ด๋ฅผ ํตํด ์งง์ ํ๋ จ์๊ฐ์ผ๋ก ๊ฒฐ๊ณผ๋ฅผ ๋์ถํ ์ ์์๋ค. ๋ํ ์ด๋ฏธ์ง ์ ์ฒ๋ฆฌ๋ฅผ ํตํด ๋์ ํ์ง์ in-put ์ด๋ฏธ์ง๋ฅผ ํ๋ํ ์ ์์๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก ํ๋ จ์๊ฐ๊ณผ ์ฑ๋ฅ ์ฌ์ด์ ํธ๋ ์ด๋ ์คํ๋ฅผ ์ต์ํํ ์ ์์๋ ๊ฒ์ผ๋ก ๋ณด์ธ๋ค.
Author
Korean Name (English name)
Reviewer
TBD
Reference & Additional materials
[Original Paper] G. Alfonso Francia, C. Pedraza, M. Aceves and S. Tovar-Arriaga, "Chaining a U-Net With a Residual U-Net for Retinal Blood Vessels Segmentation," in IEEE Access, vol. 8, pp. 38493-38500, 2020
[Blog] https://medium.com/@msmapark2/u-net-%EB%85%BC%EB%AC%B8-%EB%A6%AC%EB%B7%B0-u-net-convolutional-networks-for-biomedical-image-segmentation-456d6901b28a
Last updated
Was this helpful?