๋”ฅ๋Ÿฌ๋‹(Deep Learning)์ด๋ž€?

๋จธ์‹ ๋Ÿฌ๋‹์˜ ํ•œ ๋ถ„์•ผ

์—ฐ์†๋œ ์ธต(Layer)์—์„œ ์ ์ง„์ ์œผ๋กœ ํ•™์Šต์„ ํ•˜๋Š” ๊ฒƒ์— ๊ฐ•์ ์ด ์žˆ์œผ๋ฉฐ, ๊ธฐ๊ณ„ ํ•™์Šต์˜ ์ƒˆ๋กœ์šด ๋ฐฉ์‹
* ๋”ฅ(Deep) : '์—ฐ์†๋œ ์ธต์œผ๋กœ ํ•™์Šตํ•œ๋‹ค' (์ธต์˜ ์ˆซ์ž = ๋ชจ๋ธ์˜ ๊นŠ์ด)

 

 

 

 

 

ํผ์…‰ํŠธ๋ก (Perceptron)

์ดˆ๊ธฐ ํ˜•ํƒœ์˜ ์ธ๊ณต ์‹ ๊ฒฝ๋ง
๋‹ค์ˆ˜์˜ ์ž…๋ ฅ์œผ๋กœ๋ถ€ํ„ฐ ํ•˜๋‚˜์˜ ๊ฒฐ๊ณผ๋ฅผ ๋‚ด๋ณด๋‚ด๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜

ํผ์…‰ํŠธ๋ก ์€ ์‹ค์ œ ๋‡Œ๋ฅผ ๊ตฌ์„ฑํ•˜๋Š” ์‹ ๊ฒฝ ์„ธํฌ ๋‰ด๋Ÿฐ์˜ ๋™์ž‘๊ณผ ์œ ์‚ฌ (๋‰ด๋Ÿฐ์€ ๊ฐ€์ง€๋Œ๊ธฐ์—์„œ ์‹ ํ˜ธ๋ฅผ ๋ฐ›์•„๋“ค์ด๊ณ , ์ด ์‹ ํ˜ธ๊ฐ€ ์ผ์ •์น˜ ์ด์ƒ์˜ ํฌ๊ธฐ๋ฅผ ๊ฐ€์ง€๋ฉด ์ถ•์‚ญ๋Œ๊ธฐ๋ฅผ ํ†ตํ•ด์„œ ์‹ ํ˜ธ๋ฅผ ์ „๋‹ฌ)
์‹ ๊ฒฝ ์„ธํฌ ๋‰ด๋Ÿฐ์˜ ์ž…๋ ฅ ์‹ ํ˜ธ์™€ ์ถœ๋ ฅ ์‹ ํ˜ธ๊ฐ€ ํผ์…‰ํŠธ๋ก ์—์„œ ๊ฐ๊ฐ ์ž…๋ ฅ๊ฐ’๊ณผ ์ถœ๋ ฅ๊ฐ’์— ํ•ด๋‹น

1. ๋‹จ์ธต ํผ์…‰ํŠธ๋ก (Single-Layer Perceptron)


๊ฐ’์„ ๋ณด๋‚ด๋Š” ๋‹จ๊ณ„๊ณผ ๊ฐ’์„ ๋ฐ›์•„์„œ ์ถœ๋ ฅํ•˜๋Š” ๋‘ ๋‹จ๊ณ„
๊ฐ ๋‹จ๊ณ„๋ฅผ ๋ณดํ†ต ์ธต(layer), ๋‘ ๊ฐœ์˜ ์ธต์„ ์ž…๋ ฅ์ธต(input layer)๊ณผ ์ถœ๋ ฅ์ธต(output layer)

AND ๊ฒŒ์ดํŠธ, NAND ๊ฒŒ์ดํŠธ, OR ๊ฒŒ์ดํŠธ๋ฅผ ๊ตฌํ˜„ํ•  ์ˆ˜ ์žˆ์œผ๋‚˜ XOR ๊ฒŒ์ดํŠธ๋Š” ๊ตฌํ˜„ ๋ถˆ๊ฐ€
XOR ๊ฒŒ์ดํŠธ : ์ž…๋ ฅ๊ฐ’ ๋‘ ๊ฐœ๊ฐ€ ์„œ๋กœ ๋‹ค๋ฅธ ๊ฐ’์„ ๊ฐ–๊ณ  ์žˆ์„๋•Œ์—๋งŒ ์ถœ๋ ฅ๊ฐ’์ด 1์ด ๋˜๊ณ , ์ž…๋ ฅ๊ฐ’ ๋‘ ๊ฐœ๊ฐ€ ์„œ๋กœ ๊ฐ™์€ ๊ฐ’์„ ๊ฐ€์ง€๋ฉด ์ถœ๋ ฅ๊ฐ’์ด 0์ด ๋˜๋Š” ๊ฒŒ์ดํŠธ
* ๊ฒŒ์ดํŠธ(gate) : ์ปดํ“จํ„ฐ๋Š” ๋‘ ๊ฐœ์˜ ๊ฐ’ 0๊ณผ 1์„ ์ž…๋ ฅํ•ด ํ•˜๋‚˜์˜ ๊ฐ’์„ ์ถœ๋ ฅํ•˜๋Š” ํšŒ๋กœ๊ฐ€ ๋ชจ์—ฌ ๋งŒ๋“ค์–ด์ง€๋Š”๋ฐ, ์ด ํšŒ๋กœ๊ฐ€ ๊ฒŒ์ดํŠธ

 

2. ๋‹ค์ธต ํผ์…‰ํŠธ๋ก (MultiLayer Perceptron, MLP)


๊ธฐ์กด์˜ AND, NAND, OR ๊ฒŒ์ดํŠธ๋ฅผ ์กฐํ•ฉํ•ด XOR ๊ฒŒ์ดํŠธ๋ฅผ ์ƒ์„ฑ ๊ฐ€๋Šฅ
๋‹จ์ธต ํผ์…‰ํŠธ๋ก ์€ ์ž…๋ ฅ์ธต๊ณผ ์ถœ๋ ฅ์ธต๋งŒ ์กด์žฌํ•˜์ง€๋งŒ, ๋‹ค์ธต ํผ์…‰ํŠธ๋ก ์€ ์ค‘๊ฐ„์— ์€๋‹‰์ธต(hidden layer)์„ ์ถ”๊ฐ€
* XOR ๋ฌธ์ œ, ๊ธฐํƒ€ ๋ณต์žกํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ๋‹ค์ธต ํผ์…‰ํŠธ๋ก ์€ ์ค‘๊ฐ„์— ์ˆ˜๋งŽ์€ ์€๋‹‰์ธต์„ ์ถ”๊ฐ€ํ•  ์ˆ˜ ์žˆ์Œ

 

 

 

 

 

์‹ ๊ฒฝ๋ง์˜ ์ข…๋ฅ˜

1. ํ”ผ๋“œ ํฌ์›Œ๋“œ ์‹ ๊ฒฝ๋ง(FFNN)

๋‹ค์ธต ํผ์…‰ํŠธ๋ก (MLP)๊ณผ ๊ฐ™์ด ์˜ค์ง ์ž…๋ ฅ์ธต์—์„œ ์ถœ๋ ฅ์ธต ๋ฐฉํ–ฅ์œผ๋กœ ์—ฐ์‚ฐ์ด ์ „๊ฐœ๋˜๋Š” ์‹ ๊ฒฝ๋ง

 

 

2. ์ธ๊ณต์‹ ๊ฒฝ๋ง (Artificial Neural Network, ANN)

์ƒ๋ฌผํ•™์  Neural Network vs Artificial Neural Network

์‚ฌ๋žŒ์˜ ์‹ ๊ฒฝ๋ง ์›๋ฆฌ์™€ ๊ตฌ์กฐ๋ฅผ ๋ชจ๋ฐฉํ•˜์—ฌ ๋งŒ๋“  ๊ธฐ๊ณ„ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜

๋‡Œ์—์„œ ๋‰ด๋Ÿฐ๋“ค์ด ์–ด๋–ค ์‹ ํ˜ธ, ์ž๊ทน ๋“ฑ์„ ๋ฐ›๊ณ , ๊ทธ ์ž๊ทน์ด ์–ด๋– ํ•œ ์ž„๊ณ„๊ฐ’(threshold)์„ ๋„˜์–ด์„œ๋ฉด ๊ฒฐ๊ณผ ์‹ ํ˜ธ๋ฅผ ์ „๋‹ฌํ•˜๋Š” ๊ณผ์ •์—์„œ ์ฐฉ์•ˆ (์ž๊ทน/์‹ ํ˜ธ๋Š” Input Data, ์ž„๊ณ„๊ฐ’์€ ๊ฐ€์ค‘์น˜(weight), ์ž๊ทน์— ์˜ํ•ด ์–ด๋–ค ํ–‰๋™์„ ํ•˜๋Š” ๊ฒƒ์€ Output๋ฐ์ดํ„ฐ)

 

 

๋‹จ์ธต ANN

hidden = output

 

- ๋‹จ์ธต layer : hidden node ์ˆ˜ = ์ถœ๋ ฅ ์ˆ˜

 

๋‹ค์ธต ANN

hidden ≠ output

 

* Hyper parameter : hidden layer & node

 

Weight ์ฐจ์› : 2์ฐจ์›

Weight ํ–‰ = ์ž…๋ ฅ node(์ด์ „ layer ์ถœ๋ ฅ ์ˆ˜)

Weight ์—ด = ์ถœ๋ ฅ node(๋‹ค์Œ layer ์ž…๋ ฅ ์ˆ˜)

 

Bias ์ฐจ์› : 1์ฐจ์›

์ถœ๋ ฅ node(๋‹ค์Œ layer ์ž…๋ ฅ)

* layer node ์ˆ˜ : ์ž…๋ ฅ์ธต๊ณผ ๊ฐ€๊นŒ์šธ ์ˆ˜๋ก ๋งŽ๊ฒŒ, ์ถœ๋ ฅ์ธต๊ณผ ๊ฐ€๊นŒ์šธ ์ˆ˜๋ก ์ ๊ฒŒ ์ง€์ •

 

ANN์˜ ๋ฌธ์ œ์ 
1. ํ•™์Šต๊ณผ์ •์—์„œ ํŒŒ๋ผ๋ฏธํ„ฐ์˜ ์ตœ์ ๊ฐ’์„ ์ฐพ๊ธฐ ์–ด๋ ต๋‹ค.
ํ™œ์„ฑํ•จ์ˆ˜์˜ ์‚ฌ์šฉ์€ ๊ธฐ์šธ๊ธฐ ๊ฐ’์— ์˜ํ•ด weight๊ฐ€ ๊ฒฐ์ •๋˜์—ˆ๋Š”๋ฐ ์ด๋Ÿฐ gradient๊ฐ’์ด ๋’ค๋กœ ๊ฐˆ์ˆ˜๋ก ์ ์  ์ž‘์•„์ ธ 0์— ์ˆ˜๋ ดํ•˜๋Š” ์˜ค๋ฅ˜ ์ƒ์„ฑ, ๋ถ€๋ถ„ ์—๋Ÿฌ๋ฅผ ์ตœ์ € ์—๋Ÿฌ๋กœ ์ธ์‹ํ•ด ํ•™์Šต ์ค‘๋‹จ ๋“ฑ

โ€‹2. Overfitting์— ๋”ฐ๋ฅธ ๋ฌธ์ œ. ํ•™์Šต์‹œ๊ฐ„์ด ๋„ˆ๋ฌด ๋А๋ฆฌ๋‹ค.
๋งŽ์€ ์€๋‹‰์ธต์€ ์ •ํ™•๋„ ์ƒ์Šน๊ณผ ์—ฐ์‚ฐ๋Ÿ‰ ์ƒ์Šน ์œ ๋ฐœ. (ํ˜„์žฌ๋Š” ๊ทธ๋ž˜ํ”ฝ ์นด๋“œ์˜ ๋ฐœ์ „์œผ๋กœ ์—ฐ์‚ฐ๋Ÿ‰ ๊ฐ๋‹น, ์‚ฌ์ „ํ›ˆ๋ จ์œผ๋กœ ์˜ค๋ฒ„ํ”ผํŒ…์œผ๋กœ ์‚ฌ์ „ ๋ฐฉ์ง€ ๊ฐ€๋Šฅ

 

 

 

 

 

์ˆœ์ „ํŒŒ

์ธ๊ณต ์‹ ๊ฒฝ๋ง์—์„œ ์ž…๋ ฅ์ธต์—์„œ ์ถœ๋ ฅ์ธต ๋ฐฉํ–ฅ์œผ๋กœ ์—ฐ์‚ฐ์„ ์ง„ํ–‰ํ•˜๋Š” ๊ณผ์ •

์ž…๋ ฅ์ธต์—์„œ ์ถœ๋ ฅ์ธต ๋ฐฉํ–ฅ์œผ๋กœ ์˜ˆ์ธก๊ฐ’์˜ ์—ฐ์‚ฐ์ด ์ง„ํ–‰๋˜๋Š” ๊ณผ์ •

 

 

ํ–‰๋ ฌ๊ณฑ์œผ๋กœ ์ˆœ์ „ํŒŒ ์ดํ•ดํ•˜๊ธฐ

์ž…๋ ฅ์˜ ์ฐจ์›์ด 3, ์ถœ๋ ฅ์˜ ์ฐจ์›์ด 2 (์‹ ๊ฒฝ๋ง์˜ ์šฉ์–ด๋กœ๋Š” ์ž…๋ ฅ์ธต์˜ ๋‰ด๋Ÿฐ์ด 3๊ฐœ, ์ถœ๋ ฅ์ธต์˜ ๋‰ด๋Ÿฐ์ด 2๊ฐœ)

ํ™”์‚ดํ‘œ ๊ฐ๊ฐ์€ ๊ฐ€์ค‘์น˜ w๋ฅผ ์˜๋ฏธ(3๊ฐœ์˜ ๋‰ด๋Ÿฐ๊ณผ 2๊ฐœ์˜ ๋‰ด๋Ÿฐ ์‚ฌ์ด์—๋Š” ์ด 6๊ฐœ์˜ ํ™”์‚ดํ‘œ๊ฐ€ ์กด์žฌํ•˜๋Š”๋ฐ, ์ด๋Š” '์‹ ๊ฒฝ๋ง์—์„œ ๊ฐ€์ค‘์น˜ w์˜ ๊ฐœ์ˆ˜๊ฐ€ 6๊ฐœ'์ž„์„ ์˜๋ฏธ. ํ–‰๋ ฌ๊ณฑ ๊ด€์ ์—์„œ๋Š” '3์ฐจ์› ๋ฒกํ„ฐ์—์„œ 2์ฐจ์› ๋ฒกํ„ฐ๊ฐ€ ๋˜๊ธฐ ์œ„ํ•ด์„œ 3 × 2 ํ–‰๋ ฌ์„ ๊ณฑํ–ˆ๋‹ค')

 

 

๋ณ‘๋ ฌ ์—ฐ์‚ฐ

4๊ฐœ์˜ ์ƒ˜ํ”Œ์„ ํ•˜๋‚˜์˜ ํ–‰๋ ฌ  X ๋กœ ์ •์˜ํ•˜๊ณ , ์ธ๊ณต ์‹ ๊ฒฝ๋ง์˜ ์ˆœ์ „ํŒŒ๋ฅผ ํ–‰๋ ฌ๊ณฑ์œผ๋กœ ํ‘œํ˜„

์ธ๊ณต ์‹ ๊ฒฝ๋ง์˜ 4๊ฐœ์˜ ์ƒ˜ํ”Œ์„ ๋™์‹œ์— ์ฒ˜๋ฆฌํ•˜๊ณ  ์žˆ์ง€๋งŒ, ์—ฌ๊ธฐ์„œ ํ•™์Šต๊ฐ€๋Šฅํ•œ ๋งค๊ฐœ๋ณ€์ˆ˜์˜ ์ˆ˜๋Š” ์—ฌ์ „ํžˆ 8๊ฐœ

๋ฐฐ์น˜ ์—ฐ์‚ฐ :  ์ธ๊ณต ์‹ ๊ฒฝ๋ง์ด ๋‹ค์ˆ˜์˜ ์ƒ˜ํ”Œ์„ ๋™์‹œ์— ์ฒ˜๋ฆฌํ•˜๋Š” ๊ฒƒ

 

 

 

 

 

 

์—ญ์ „ํŒŒ(Backpropagation)

๋”ฅ๋Ÿฌ๋‹ ํ”„๋ ˆ์ž„์›Œํฌ ํ•„์ˆ˜ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ

์ถœ๋ ฅ์—์„œ ์ƒ๊ธด ์˜ค์ฐจ(error)๋ฅผ ์ž…๋ ฅ ์ชฝ(์—ญ๋ฐฉํ–ฅ)์œผ๋กœ ์ „ํŒŒ์‹œ์ผœ ์ˆœ์ฐจ์ ์œผ๋กœ ํŽธ๋ฏธ๋ถ„์„ ์ˆ˜ํ–‰ํ•˜์—ฌ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์— ์ตœ์ ํ™”๋œ weight๊ฐ’์„ ์–ป๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜

์ธ๊ณต ์‹ ๊ฒฝ๋ง์˜ ํ•™์Šต์€ ์˜ค์ฐจ๋ฅผ ์ตœ์†Œํ™”ํ•˜๋Š” ๊ฐ€์ค‘์น˜๋ฅผ ์ฐพ๋Š” ๋ชฉ์ ์œผ๋กœ ์ˆœ์ „ํŒŒ์™€ ์—ญ์ „ํŒŒ๋ฅผ ๋ฐ˜๋ณตํ•˜๋Š” ๊ฒƒ

 

์—ญ์ „ํŒŒ ๋‹จ๊ณ„

1. Hidden vs Output ๊ฐ€์ค‘์น˜ ์ˆ˜์ •

์€๋‹‰์ธต๊ณผ ์ถœ๋ ฅ์ธต ์‚ฌ์ด ๊ฐ€์ค‘์น˜ ์ˆ˜์ • : output ์˜ค์ฐจ, output, hidden ์ด์šฉ

 

2. Input vs Hidden ๊ฐ€์ค‘์น˜ ์ˆ˜์ •

1) hidden ์˜ค์ฐจ = hidden ๊ฐ€์ค‘์น˜(wo) ์ „์น˜ํ–‰๋ ฌ * output ์˜ค์ฐจ

* ์ž…๋ ฅ์ธต๊ณผ ์€๋‹‰์ธต ์‚ฌ์ด์˜ ๊ฐ€์ค‘์น˜๋ฅผ ์ˆ˜์ •ํ•˜๊ธฐ ์œ„ํ•ด์„œ ์€๋‹‰์ธต ์˜ค์ฐจ ํ•„์š”

 

2) Input vs Hidden ๊ฐ€์ค‘์น˜ ์ˆ˜์ • : hidden ์˜ค์ฐจ์™€ hidden output, input ์ด์šฉ

 

 

 

 

 

 

Deep Learning ์œ ํ˜•

์‹ฌ์ธต ์‹ ๊ฒฝ๋ง(DNN : Deep Neural Network)

Nerual Network vs DNN

์ž…๋ ฅ์ธต(input layer)๊ณผ ์ถœ๋ ฅ์ธต(output layer) ์‚ฌ์ด์— ์—ฌ๋Ÿฌ ๊ฐœ(2๊ฐœ ์ด์ƒ)์˜ ์€๋‹‰์ธต(hidden layer)

์ค‘๊ฐ„์ธต์˜ ๋‹ค์ธตํ™”๋กœ ๋‰ด๋Ÿฐ ์ฒ˜๋ฆฌ์™€ ์ „๋‹ฌ, ์‚ฐ์ถœ๋˜๋Š” ํŠน์ง• ๊ฐ’์ด ๋Š˜์–ด๋‚จ → ์ •ํ™•๋„ ํ–ฅ์ƒ

ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๊ฐ€ ๋„ˆ๋ฌด ๋งŽ์•„์ง → ์—ฐ์‚ฐ ๋งŽ์•„์ง, ๊ณผ์ ํ•ฉ

์™„์ „์—ฐ๊ฒฐ ๊ณ„์ธต(Fully Connected NN)

 

 

์‹ฌ์ธต ์‹ ๋ขฐ ์‹ ๊ฒฝ๋ง (DBN : Deep Belief Network)

๋‹ค์ค‘๊ณ„์ธต์œผ๋กœ ์ด๋ฃจ์–ด์ง„ ์‹ฌ์ธต ์‹ ๊ฒฝ๋ง

Dropout : ๊ณผ์ ํ•ฉ ๋ฌธ์ œ ํ•ด๊ฒฐ์„ ์œ„ํ•œ ๋ฌด์ž‘์œ„ ๋„คํŠธ์›Œํฌ ์‚ญ์ œ

์ œํ•œ๋œ ๋ณผ์ธ ๋งŒ ๋จธ์‹ (Restricted Boltzmann Machine: RBM) : ๊ฐ€์ค‘์น˜ ๊ฐฑ์‹  ์•Œ๊ณ ๋ฆฌ์ฆ˜

 

 

ํ•ฉ์„ฑ๊ณฑ ์‹ ๊ฒฝ๋ง (Convolution Neural Network, CNN)

์ด๋ฏธ์ง€ ์ž…๋ ฅ → ์–ด๋–ค ์ด๋ฏธ์ง€์ธ์ง€ ํŒ๋ณ„ํ•˜๋Š” Classification๋ชจ๋ธ

๊ธฐ๊ณ„ํ•™์Šต์—์„œ ์ด๋ฏธ์ง€์˜ ์ •๋ณด๋ฅผ ๋‰ด๋Ÿฐ์— ์ „๋‹ฌํ•  ๋•Œ, ์ด๋ฏธ์ง€์˜ ์ผ๋ถ€ ๋ฒ”์œ„๋กœ ์ขํ˜€์„œ ๋ถ„์„ํ•˜๊ณ  ๊ทธ ๋ฒ”์œ„๋ฅผ ์กฐ๊ธˆ์”ฉ ์ž˜๋ผ๋‚ด๋ฉฐ ๋ถ„์„์„ ๋ฐ˜๋ณตํ•˜๋Š” ๋ฐฉ์‹ (ํŠน์ง•์„ ์ถ”์ถœํ•˜์—ฌ ํŠน์ง•์˜ ํŒจํ„ด ํŒŒ์•…)

ํ™œ์šฉ ๋ถ„์•ผ : ์ •๋ณด์ถ”์ถœ, ๋ฌธ์žฅ๋ถ„๋ฅ˜, ์–ผ๊ตด์ธ์‹

 

- Convolution Layer : ๊ฐ ์„ฑ๋ถ„์˜ ์ธ์ ‘ ์„ฑ๋ถ„๋“ค์„ ์กฐ์‚ฌํ•ด ํŠน์ง•์„ ํŒŒ์•…ํ•˜๊ณ  ํŒŒ์•…ํ•œ ํŠน์ง•์„ ํ•œ์žฅ์œผ๋กœ ๋„์ถœ์‹œํ‚ค๋Š” ๊ณผ์ •์—์„œ ๋„์ถœ๋œ ์žฅ

- Pooling : Convolution ๊ณผ์ •์„ ๊ฑฐ์นœ ๋ ˆ์ด์–ด์˜ ์‚ฌ์ด์ฆˆ๋ฅผ ์ค„์—ฌ์ฃผ๋Š” ๊ณผ์ •. ๋ฐ์ดํ„ฐ์˜ ์‚ฌ์ด์ฆˆ๋ฅผ ์ค„์ด๊ณ , ๋…ธ์ด์ฆˆ๋ฅผ ์ƒ์‡„, ๋ฏธ์„ธํ•œ ๋ถ€๋ถ„์—์„œ ์ผ๊ด€์ ์ธ ํŠน์ง•์„ ์ œ๊ณต

 

 

์ˆœํ™˜์‹ ๊ฒฝ๋ง (Recurrent Neural Network, RNN)

๋ฐ˜๋ณต์ ์ด๊ณ  ์ˆœ์ฐจ์ ์ธ ๋ฐ์ดํ„ฐ(Sequential data)ํ•™์Šต์— ํŠนํ™”๋œ ์ธ๊ณต์‹ ๊ฒฝ๋ง์˜ ํ•œ ์ข…๋ฅ˜

๋‚ด๋ถ€์˜ ์ˆœํ™˜๊ตฌ์กฐ๊ฐ€ ๋“ค์–ด์žˆ๋Š”๋ฐ, ์ˆœํ™˜๊ตฌ์กฐ๋ฅผ ์ด์šฉํ•˜์—ฌ ๊ณผ๊ฑฐ์˜ ํ•™์Šต์„ Weight๋ฅผ ํ†ตํ•ด ํ˜„์žฌ ํ•™์Šต์— ๋ฐ˜์˜ํ•œ๋‹ค

์‹œ๊ณ„์—ด ๋ถ„์„์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ๋งŒ๋“ค์–ด ์ค€ ๋™์  ๋ฐ์ดํ„ฐ์™€ ํ˜ธํ™˜๋˜๋Š” ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ

ํ˜„์žฌ์˜ ํ•™์Šต๊ณผ ๊ณผ๊ฑฐ์˜ ํ•™์Šต์˜ ์—ฐ๊ฒฐ์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜๊ณ  ์‹œ๊ฐ„์— ์ข…์†๋œ๋‹ค๋Š” ํŠน์ง•

* ๋™์  ๋ฐ์ดํ„ฐ : ์ž์—ฐ์–ด ๋Œ€ํ™”, ๋™์˜์ƒ, ์Œ์„ฑ, ์‹œ๊ณ„์—ด์˜ ํ†ต๊ณ„ ๋ฐ์ดํ„ฐ์™€ ๋กœ๊ทธ ๋ฐ์ดํ„ฐ

ํ™œ์šฉ ๋ถ„์•ผ : ์ตœ๊ทผ ์ž์—ฐ์–ด ๋Œ€ํ™” ๋“ฑ์˜ ๋ถ„์•ผ, ์Œ์„ฑ ์›จ์ด๋ธŒ ํผ, ํ…์ŠคํŠธ ์•ž ๋’ค ์„ฑ๋ถ„ ํŒŒ์•…

 

 

 

 

 

๋”ฅ๋Ÿฌ๋‹ ๋ ˆ์ด์–ด (Fully Connected Layers)

์ด๋ฏธ์ง€ ์ธ์‹๊ณผ ์ปดํ“จํ„ฐ ๋น„์ „ ๊ณผ์ œ๋ฅผ ์ „๋ฌธ์œผ๋กœ ํ•˜๋Š” ์‹ ๊ฒฝ๋ง์˜ ์ผ์ข…

์ธ์ ‘ํ•œ ๊ณ„์ธต์˜ ๋ชจ๋“  ๋‰ด๋Ÿฐ๊ณผ ๊ฒฐํ•ฉ

์—„์ฒญ๋‚œ ์ˆ˜์˜ ์—ฐ๊ฒฐ๊ณผ ๋„คํŠธ์›Œํฌ ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ํ•„์š”๋กœ ํ•จ

 

Affine ๊ณ„์ธต : layer ๊ฐ„์˜ ๋ชจ๋“  ๋…ธ๋“œ(๋‰ด๋Ÿฐ) ์™„์ „ ์—ฐ๊ฒฐ ๊ณ„์ธต

4๊ฐœ ์™„์ „์—ฐ๊ฒฐ ์‹ ๊ฒฝ๋ง

Affine ๊ณ„์ธต ๋’ค์— ํ™œ์„ฑํ™” ํ•จ์ˆ˜ ReLU ๊ณ„์ธต(or Sigmoid) ์—ฐ๊ฒฐ

๋งˆ์ง€๋ง‰ 4๋ฒˆ์งธ ๊ณ„์ธต์€ Affine ๊ณ„์ธต๊ณผ Softmax ๊ณ„์ธต์—์„œ ํ™•๋ฅ ๊ฐ’์œผ๋กœ ์ตœ์ข… ์ถœ๋ ฅ

 

3๊ฐœ ์™„์ „์—ฐ๊ฒฐ ์‹ ๊ฒฝ๋ง

์ ์ˆ˜ : ์ •๊ทœํ™”ํ•˜์ง€ ์•Š์€ ์ถœ๋ ฅ ๊ฒฐ๊ณผ(Affine ๊ณ„์ธต) -> ๋น„์œจ์ฒ™๋„(ํšŒ๊ท€๋ถ„์„)

ํ™•๋ฅ  : ์ž…๋ ฅ๊ฐ’์„ ์ •๊ทœํ™”(์ถœ๋ ฅ์˜ ํ•ฉ 1)ํ•œ ์ถœ๋ ฅ ๊ฒฐ๊ณผ(Softmax ๊ณ„์ธต) -> 0~1์‚ฌ์ด

 

 

 

 

 

 

 

 

 

 

 

์ฐธ๊ณ  https://wikidocs.net/150781

+ Recent posts