외로운 Nova의 작업실
머신러닝 용어 정리 본문
지도 학습 : 정답을 알려주면서 진행되는 학습
비지도 학습 : 정답이 없이 진행되는 학습
분류 : 분리된 값을 예측
회귀 : 연속되는 값을 예측
과대적합 : 데이터에서 특징을 필요이상으로 추출한 경우 발생하는 편향적 문제
과소적합 : 데이터에서 특징을 활용하지 못한 경우 발생하는 분산적 문제
혼동 행렬 : 모델의 성능을 평가할때 사용되는 지표로 x축은 예측값, y축은 실제값
(잘한,못한)(O,X) | 실제 답 | 예측값 |
TP(잘한 O) | O | O |
TN(잘한 X) | X | X |
FP(못한 O) | X | O |
FN(못한 X) | O | X |
정확도 = TP+TN / 전체 예측수
정밀도 = TP / (TP+FP), 정밀도가 낮으면 이상한놈도 O라고 한것.
재현율 = TP / (TP+FN), 재현율이 낮으면 맞은놈을 X라고 한것.
F1 = 2 * 재현율 * 정밀도 / (재현율 * 정밀도), 재현율과 정밀도 사이의 값
k-폴드 교차 검증 : 검증데이터를 n번의 검증과정을 통해 학습 데이터의 모든 데이터를 한번씩 검증데이터로 사용해서 n개의 검증 결과를 평균낸 값을 검증 성능 평가 지표로 사용하는 방법
'AI > machine-learning' 카테고리의 다른 글
앙상블 기법 (0) | 2023.11.03 |
---|---|
지도 학습 - 나이브 베이즈 (0) | 2023.11.02 |
지도 학습 - 의사결정 트리 (1) | 2023.10.31 |
지도학습 - SVM 서포트 벡터 머신 이론 및 실습 (0) | 2023.10.08 |
지도 학습 - knn 알고리즘 이론 및 실습 (1) | 2023.10.07 |
Comments