-
๋ณธ ๊ธ์ '๋ชจ๋๋ฅผ ์ํ ๋ฅ๋ฌ๋ ์์ฆ 2'์ 'pytorch๋ก ์์ํ๋ ๋ฅ ๋ฌ๋ ์ ๋ฌธ'์ ๋ณด๋ฉฐ ๊ณต๋ถํ ๋ด์ฉ์ ์ ๋ฆฌํ ๊ธ์ ๋๋ค.
ํ์์ ์๊ฒฌ์ด ์์ฌ ๋ค์ด๊ฐ ๋ถ์ ํํ ๋ด์ฉ์ด ์กด์ฌํ ์ ์์ต๋๋ค.
๊ฒฝ์ฌํ๊ฐ๋ฒ์ ๊ฐ์ฅ ๊ธฐ๋ณธ์ ์ธ ์ตํฐ๋ง์ด์ ์๊ณ ๋ฆฌ์ฆ(์ต์ ํ ์๊ณ ๋ฆฌ์ฆ)์ด๋ค.
๋น์ฉํจ์์ ๊ฐ์ ์ต์๋ก ํ๋ W์ b๋ฅผ ์ฐพ๋ ๋ฐฉ๋ฒ์ ์ฐ์ธ๋ค.
์ฌ๊ธฐ์ W์ cost์ ๊ด๊ณ๋ฅผ ๊ทธ๋ํ๋ก ํํํ๋ฉด ๋ค์๊ณผ ๊ฐ๋ค.
cost๊ฐ ์์ ์๋ก ๋ ์ ํฉํ w๋ผ๊ณ ํ ์ ์๋ค. ๊ทธ๋ ๋ค๋ฉด ๊ธฐ์ธ๊ธฐ๊ฐ ์๋ ๋ณผ๋กํ ๊ณณ์ ์์ด์ผ ์ข๋ค๊ณ ํ ์ ์๋ค.
ํ์ต์ ์์ํ ๋, ์ปดํจํฐ๋ ์์์ ์ด๊ธฐ๊ฐ W๋ฅผ ์ ํ๊ณ , ๋งจ ์๋ ๋ณผ๋กํ ๋ถ๋ถ์ ํฅํด ์ ์ฐจ W์ ๊ฐ์ ์์ ํด ๋๊ฐ๋ค.
์ด๋ฅผ ๊ฐ๋ฅํ๊ฒ ํ๋ ๊ฒ์ด ๋ฐ๋ก '๊ฒฝ์ฌํ๊ฐ๋ฒ'์ธ๋ฐ, ๊ฒฝ์ฌ ํ๊ฐ๋ฒ์ ์ ์ ์์์ ๊ธฐ์ธ๊ธฐ์ ๊ฐ๋ ์ ์ฌ์ฉํ๋ค.
์ด๋ก์ ์ ์ W๊ฐ ์์์ ๊ฐ์ ๊ฐ์ง๊ฒ ๋๋ ๋ค ๊ฐ์ง์ ๊ฒฝ์ฐ์ ๋ํด์, ๊ทธ๋ํ ์์ผ๋ก ์ ์ ์ ๊ธฐ์ธ๊ธฐ๋ฅผ ๋ณด์ฌ์ค๋ค. ๊ธฐ์ธ๊ธฐ๋ฅผ ์ดํด๋ณด๋ฉด, ์ ์ ๋ณผ๋กํ ๊ณณ์ผ๋ก ๋ค๊ฐ๊ฐ ์๋ก ๊ธฐ์ธ๊ธฐ๊ฐ 0์ด ๋จ์ ์ ์ ์๋ค.
์ฆ, Cost๊ฐ ์ต์๊ฐ ๋๋ ์ง์ = ์ ์ ์ ๊ธฐ์ธ๊ธฐ๊ฐ 0 = ๋ฏธ๋ถ๊ฐ์ด 0 ์ด ๋๋ค.
์ฝ๊ฒ ๋งํด์ cost function์ ๋ฏธ๋ถํด์ ์ ์ ์ ๊ธฐ์ธ๊ธฐ๋ฅผ ๊ตฌํ๊ณ , ๊ทธ ๊ธฐ์ธ๊ธฐ์ ํน์ ์ซ์๋ฅผ ๊ณฑํ ๊ฐ์ ๋นผ์ ์๋ก์ด W๋ก ์ฌ์ฉํ๋ค.
์์ ๊ทธ๋ฆผ์ ๋ณด๋ฉด, ๊ฐ์ฅ ํฐ ๊ธฐ์ธ๊ธฐ๊ฐ ์์์ด๊ธฐ ๋๋ฌธ์, ๊ธฐ์ธ๊ธฐ๊ฐ 0์ด ๋๋ ค๋ฉด ๊ฐ์ํด์ผํ๋ค. ๋ฐ๋๋ก ๊ธฐ์ธ๊ธฐ๊ฐ ์์์ผ ๋๋ ์ฆ๊ฐํด์ผ ํ ๊ฒ์ด๋ค.
์์ ์์์ ์ ์ ์ ๊ธฐ์ธ๊ธฐ๊ฐ ์์๊ฑฐ๋, ์์์ผ ๋ ๋ชจ๋ ์ ์ ์ ๊ธฐ์ธ๊ธฐ๊ฐ 0์ธ ๋ฐฉํฅ์ผ๋ก W์ ๊ฐ์ ์กฐ์ ํ๋ค.
(์ฐธ๊ณ ๋ก := ๊ธฐํธ๋ ์ค๋ฅธ์ชฝ ์์์ ๊ณ์ฐ ๊ฐ์ ์ผ์ชฝ ๊ธฐํธ์ ๋์ ํจ์ ๋ปํ๋ค.)
์ ์์์ ํ์ต๋ฅ α๋ W์ ๊ฐ์ ๋ณ๊ฒฝํ ๋, ์ผ๋ง๋ ํฌ๊ฒ ๋ณ๊ฒฝํ ์ง๋ฅผ ๊ฒฐ์ ํ๋ค. ๋๋ฌด ํฐ ๊ฐ์ ์ค๋ค๋ฉด ๋ฐ์ฐ์ ํ ์ ์๊ธฐ ๋๋ฌธ์ ์ ์ ํ ๊ฐ์ ์ฐพ๋๊ฒ ์ค์ํ๋ค.
์ ๋ฆฌํ์๋ฉด,
๊ธฐ์ธ๊ธฐ = ๋ฐฉํฅ
ํ์ต๋ฅ α = ๋ฐ์๊ตญ ํฌ๊ธฐ
๋ผ๊ณ ํ ์ ์๋ค.
<Reference>
https://deeplearningzerotoall.github.io/season2/lec_pytorch.html
'๐STUDY > ๐ฅPytorch ML&DL' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
05. Logistic Regression (0) 2020.02.28 04-2. Loading Data(Mini batch and data load) (0) 2020.02.24 04-1. Multivariable Linear regression (0) 2020.02.24 02. Linear Regression (0) 2020.02.21 01. PyTorch ๊ธฐ์ด (0) 2020.02.13 ๋๊ธ