์ต๊ทผ ์ฐ๊ตฌ์ ๋ฐ๋ฅด๋ฉด ์ ๋ ฅ ๋ ์ด์ด์ ์ถ๋ ฅ ๋ ์ด์ด ์ฌ์ด shorter connections๋ฅผ ํฌํจํ CNN์ ๋ ๊น๊ณ , ๋ ์ ํํ๋ฉฐ, ํ์ต ํจ์จ ๋ฐ์ด๋ ์ ์์์ด ๋ฐํ์ง
DenseNet์ ์ด ํต์ฐฐ์ ๋ฐํ์ผ๋ก ๋ชจ๋ ๋ ์ด์ด๋ฅผ feed-forward ๋ฐฉ์์ผ๋ก ์๋ก ์ง์ ์ฐ๊ฒฐํ๋ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง
<aside> ๐ก
์ ํต์ ์ธ CNN์ L๊ฐ์ layer โ L๊ฐ์ connections๋ง ์กด์ฌ
DenseNet์ ์ด L(L + 1) / 2๊ฐ์ ์ง์ ์ฐ๊ฒฐ์ ๊ฐ์ง
๊ฐ ๋ ์ด์ด๋ ์ด์ ์ ๋ชจ๋ ๋ ์ด์ด์ feature map์ ์ ๋ ฅ์ผ๋ก ์ฌ์ฉ,
์์ ์ ์ถ๋ ฅ๋ ์ดํ ๋ชจ๋ ๋ ์ด์ด์ ์ ๋ ฅ์ผ๋ก ์ ๋ฌ
</aside>
์ฅ์
๊ธฐ์ธ๊ธฐ ์์ค ๋ฌธ์ (vanishing gradient) ์ํ
ํน์ง ์ ๋ฌ(feature propagation)์ ๊ฐํ
ํน์ง ์ฌ์ฌ์ฉ(feature reuse)์ ์ ๋
์ ์ฒด ํ๋ผ๋ฏธํฐ ์๋ฅผ ํฌ๊ฒ ์ค์
ํ๊ฐ
4๊ฐ์ ๋ํ์ ์ธ ๊ฐ์ฒด ์ธ์ ๋ฒค์น๋งํฌ(CIFAT-10, CIFAT-100, SVHN, ImageNet)์์ ํ๊ฐ
DenseNet์ ๋๋ถ๋ถ์ ๋ฒค์น๋งํฌ์์ SOTA ๋ฌ์ฑ
๋ ์ ์ ์ฐ์ฐ๋์ผ๋ก ๋์ ์ฑ๋ฅ ๋ฌ์ฑ
์ฝ๋์ ์ฌ์ ํ์ต๋ ๋ชจ๋ธ : https://github.com/liuzhuang13/DenseNet

(๊ทธ๋ฆผ 1)
์ด์ CNN์ depth ๊น์ด์ง์๋ก vanishing gradient ๋ฌธ์ ๋ฐ์
์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด
ResNet, HighwayNetwork
identity connection์ผ๋ก ์ ํธ๋ฅผ ๋ค์ ๋ ์ด์ด๋ก ์ง์ ์ ๋ฌ
Stochastic Depth
ํ์ต ์ค ๋ ์ด์ด๋ฅผ ๋ฌด์์๋ก ์๋ต(drop)ํด ์ ๋ณด ๋ฐ ๊ธฐ์ธ๊ธฐ ๋ ์ ํ๋ฅด๋๋ก
FractalNet
์ฌ๋ฌ ๊ฐ์ ๋ณ๋ ฌ ๋ ์ด์ด ์ํ์ค๋ฅผ ๋ฐ๋ณต์ ์ผ๋ก ์กฐํฉํด ์ด๋ก ์ ์ผ๋ก ๊น์ ๋คํธ์ํฌ๋ฅผ ๋ง๋ค๋ฉด์๋ ๋์์ ์งง์ ๊ฒฝ๋ก(short paths)๋ฅผ ๋ง์ด ์ ์งํ๋ ๊ตฌ์กฐ ์ ์
๋ชจ๋ ์ด๊ธฐ ๋ ์ด์ด์์ ํ๋ฐ๋ถ ๋ ์ด์ด๋ก ์ด์ด์ง๋ short paths๋ฅผ ๋ง๋ ๋ค๋ ๊ณตํต์
dense connectivity ๊ตฌ์กฐ๋ ๊ธฐ์กด CNN๋ณด๋ค ๋ ์ ์ params ์ฌ์ฉ
์ค๋ณต๋ feature map์ ๋ฐ๋ณตํด์ ํ์ตํ ํ์๊ฐ ์๊ธฐ ๋๋ฌธ
Traditional feed-forward architectures
๊ฐ layer๋ ์ผ์ข ์ state๋ฅผ ๊ฐ๊ณ ์์ผ๋ฉฐ ์ด๋ฅผ ๋ค์ layer๋ก ์ ๋ฌ
์ด ๊ณผ์ ์์ ์ผ๋ถ ์ ๋ณด๋ ๋ณ๊ฒฝ๋์ง๋ง ์ค์ ์ ๋ณด๋ ์ ์ง๋์ด์ผ ํจ
ResNet
์ ๋ณด ์ ์ง(preservation)๋ฅผ ๋ช ์์ ์ธ identity ์ฐ๊ฒฐ์ ํตํด ๊ตฌํ
์ดํ ResNet ๋ณํ ๊ตฌ์กฐ ๋ชจ๋ธ
๋ง์ layers๊ฐ ์ค์ ๋ก๋ ๊ธฐ์ฌ๊ฐ ์ ์ผ๋ฉฐ ํ์ต ์ค ๋ฌด์์๋ก ์๋ตํด๋ ๋ฌธ์ ๊ฐ ์๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค
The state of ResNets similar(ResNet์ ์ํ ํ๋ฆ)๊ฐ unrolled RNN์ฒ๋ผ ๋์ํ๊ฒ ํ์ง๋ง ๊ฐ layer๊ฐ ๊ณ ์ ์ weights๋ฅผ ๊ฐ์ง๋ฏ๋ก params๋ ํจ์ฌ ๋ ๋ง์