๋ก์ง์คํฑ ํ๊ท๋ถ์(Logistic regression analysis) = ๋ก์ง๋ถ์(Logit analysis)
ํ๊ท๋ถ์์ ๊ธฐ๋ฐ์ผ๋ก ํ ๋ถ๋ฅ๋ถ์ ๋ชจํ
๋ ๊ฐ์ ๊ฐ๋ง์ ๊ฐ์ง๋ ์ข ์๋ณ์์ ๋ ๋ฆฝ๋ณ์๋ค ๊ฐ์ ์ธ๊ณผ๊ด๊ณ๋ฅผ ๋ก์ง์คํฑ ํจ์๋ฅผ ์ด์ฉํ์ฌ ์ถ์
01. Sigmoid Function
02. ๋ก์ง๋ณํ
03. ์ดํญ ๋ก์ง์คํฑ ํ๊ท
04. ๋คํญ ๋ก์ง์คํฑ ํ๊ท
05. ์ค๋ถ๋ฅํ (confusion matrix)
์์ธก์น | |||
Positive | Negative | ||
๊ด์ธก์น (์ค์ ๊ฐ) |
POS | TP (์ฐธ ๊ธ์ ) | FN (๊ฑฐ์ง ๋ถ์ ) |
NEG | FP (๊ฑฐ์ง ๊ธ์ ) | TN (์ฐธ ๋ถ์ ) |
์ ๋ถ๋ฅ์จ(Accuracy) = (TP+TN) / ์ ์ฒด๊ด์ธก์น = ๋ถ๋ฅ์ ํ๋, ์ ํ๋
์ค๋ถ๋ฅ์จ(Inaccuracy) = ( FN+FP) / ์ ์ฒด๊ด์ธก์น
์ ํ๋ฅ (Precision) = TP / (TP + FP)
์ฌํ์จ(Recall) = TP / (TP + FN)
F ์ธก์ ์น(F measure) =2 x ((Precision x Recall) / (Precision + Recall))
6. ROC ๊ทธ๋ํ (ํ๊ฐ๋๊ตฌ)
ROC(Receiver Operation Characteristic Curve) ๊ณก์ & AUC๊ฐ
ROC ๊ณก์ : FPR๊ณผ TPR์ ๋ณํ๋ฅผ ๋ณด๋๋ฐ ์ด์ฉ, 2์ง ๋ถ๋ฅ๋ชจ๋ธ ์ฑ๋ฅ ํ๊ฐ
AUC(Area Under Curve=์์ธก๋ ฅ)๊ฐ์ ROC ๊ณก์ ๋ฉด์ ์ ๊ตฌํ ๊ฒ์ผ๋ก 1์ ๊ฐ๊น์ธ์๋ก ์ฑ๋ฅ์ด ์ข๋ค.
AUC ์์น๊ฐ ์ปค์ง๋ ค๋ฉด FPR์ด ์์ ์ํ์์ ์ผ๋ง๋ ํฐ TPR์ ์ป๋๊ฐ?
๊ฐ์ด๋ฐ ์ง์ ์์ ๋ฉ์ด์ง๊ณ ์ผ์ชฝ ์๋จ ๋ชจ์๋ฆฌ์ ๊ณก์ ์ด ์ง์ฌ๊ฐํ์ ๊ฐ๊น์ธ ์๋ก ์ข์ AUC ์ฑ๋ฅ ์์น๋ฅผ ์ป๋๋ค.
• TPR(True Positive Rate) : ์ค์ ์์ฑ์ ์์ฑ์ผ๋ก ์์ธกํ ๋น์จ = TP / TP + FN
• FNR(False Negative Rate) : ์ค์ ์์ฑ์ ์์ฑ์ผ๋ก ์์ธกํ ๋น์จ = FN / TP + FN
• TNR(True Negative Rate) : ์ค์ ์์ฑ์ ์์ฑ์ผ๋ก ์์ธกํ ๋น์จ = TN / FP + TN
• FPR(False Positive Rate) : ์ค์ ์์ฑ์ ์์ฑ์ผ๋ก ์์ธกํ ๋น์จ = FP / FP + TN
• ๋ฏผ๊ฐ๋(Sensitivity) = TPR
• ํน์ด๋(Specificity) = TNR
• FPR = 1 – ํน์ด๋
* ์ผ์ชฝ ์ ๋น ๊ณต๊ฐ์ด ์ค๋ถ๋ฅ์จ
* ํผ๋ํ๋ ฌ
P(์์ฑ) N(์์ฑ)
P(์์ฑ) TP FN
N(์์ฑ) FP TN
* ๊ด์ธก์น/์์ธก์น, ์์ฑ/์์ฑ ์์น ๋ณ๊ฒฝ ๊ฐ๋ฅ
2. ์์ฑ/์์ฑ ๋น์จ
๋ฏผ๊ฐ๋ = ์ง์์ฑ๋น์จ(TPR) : ์์ฑ(๊ฐ์ผ) -> ์์ฑ ์์ธก๋น์จ = TP / (TP/FN)
1-๋ฏผ๊ฐ๋ = ์์์ฑ๋น์จ(FNR) : ์์ฑ-> ์์ฑ ์์ธก๋น์จ = FN / (TP+FN)
ํน์ด๋ = ์ง์์ฑ๋น์จ(TNR) : ์์ฑ(๋น๊ฐ์ผ) -> ์์ฑ ์์ธก๋น์จ = TN / (TN+FP)
1-ํน์ด๋ = ์์์ฑ๋น์จ(FPR) : ์์ฑ -> ์์ฑ ์์ธก๋น์จ = FN / (TN+FP)
3. 1์ข
์ค๋ฅ / 2์ข
์ค๋ฅ
1์ข
์ค๋ฅ(α) : ๊ท๋ฌด๊ฐ์ค์ด T์ง๋ง -> ๊ท๋ฌด๊ฐ์ค ๊ธฐ๊ฐ = ์์์ฑ๋น์จ(FPR)
2์ข
์ค๋ฅ(β) : ๊ท๋ฌด๊ฐ์ค์ ๊ธฐ๊ฐํด์ผํ๋๋ฐ -> ์ฑํ = ์์์ฑ๋น์จ(FNR)
๊ฐ์ : ๋ถ์ ์ ์ธ ํํ๋ก ๊ฐ์ค์ ์ธ์
4. ROC Curve
๋ฏผ๊ฐ๋(y์ถ) vs ์์์ฑ๋น์จ(FPR) = 1-ํน์ด๋(x)
ํด์๋ฐฉ๋ฒ : ์์์ฑ๋น์จ์ด ์๊ณ , ๋ฏผ๊ฐ๋๊ฐ ํด์๋ก ์ข์ ๋ชจํ์ด๋ค.
5. TP์ FP์ ๋น์จ
TP๋น์จ = TP / N
FP๋น์จ = FP / N
'๋ฐ์ดํฐ๋ถ์๊ฐ ๊ณผ์ > R' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
DAY25. R ๊ตฐ์ง๋ถ์ (0) | 2021.10.21 |
---|---|
DAY24. R ๋ถ๋ฅ๋ถ์ (0) | 2021.10.19 |
DAY22. R ๊ธฐ๊ณํ์ต์ด๋ก , ์ ํํ๊ท๋ถ์ (0) | 2021.10.15 |
DAY21. ์ฃผ์ฑ๋ถ๋ถ์, ์์ธ๋ถ์ (0) | 2021.10.14 |
DAY20. R ์๊ด๋ถ์, ๊ณต๋ถ์ฐ (0) | 2021.10.13 |