-
AI 모델 개발 – ROC & P-R Curve 완전 정리카테고리 없음 2025. 8. 31. 13:41
목적: ROC Curve와 Precision-Recall Curve 개념을 비교·이해하고, 해석법·시험 포인트까지 쉽게 정리.
0) 핵심 한눈에 보기
- ROC Curve: 민감도(Recall, TPR) vs 위양성율(FPR) 곡선.
- P-R Curve: 정밀도(Precision) vs 재현율(Recall) 곡선.
- 시험 포인트: 클래스 불균형 상황에선 PR Curve가 더 적합.
1) 기본 지표 복습
TP: 실제 양성 맞춤.
FP: 실제 음성인데 양성으로 예측.
TN: 실제 음성 맞춤.
FN: 실제 양성인데 음성으로 예측.
Precision (정밀도) = TP / (TP + FP) → 양성 예측 중 얼마나 맞췄나.
Recall (재현율, 민감도, TPR) = TP / (TP + FN) → 실제 양성 중 얼마나 잡았나.
FPR (위양성율) = FP / (FP + TN).
2) ROC Curve
- x축 = FPR, y축 = TPR.
- 해석: 커브가 왼쪽 위로 갈수록 성능↑.
- AUC (Area Under Curve): 1에 가까울수록 좋음.
- 장점: 클래스 불균형이 심하지 않을 때 성능 직관적으로 비교 가능.
3) Precision-Recall Curve
x축 = Recall, y축 = Precision.
해석: 곡선이 오른쪽 위로 갈수록 성능↑.
PR-AUC: 1에 가까울수록 좋음.
장점: 클래스 불균형(양성 적음) 상황에서 더 유용.
- 이유: ROC는 다수 클래스 영향으로 지나치게 좋게 보일 수 있음.
4) 직관적 비유
- ROC Curve: “병원 검사” – 건강인(TN)이 많아도 전체 평가에 영향.
- PR Curve: “희귀병 진단” – 양성 적을 때, 진짜 양성 예측 정확성이 중요.
5) 언제 무엇을 쓸까?
- 데이터 균형: ROC.
- 불균형(희귀 이벤트 탐지): PR Curve.
- 시험 문제에서는 “불균형 데이터” 단어가 나오면 → PR Curve.
6) 시험장 포인트
- ROC = TPR vs FPR.
- PR = Precision vs Recall.
- AUC 값 비교 문제 자주 출제.
- 불균형 → PR Curve 적합.
- 곡선 모양 해석 가능해야 함.
7) 실전 체크리스트
- TP/FP/TN/FN 구분할 수 있는가?
- Precision, Recall, FPR 정의 말할 수 있는가?
- ROC와 PR 곡선 축 차이를 설명할 수 있는가?
- AUC 의미 이해했는가?
- 데이터 불균형 상황에서 PR Curve를 선택할 수 있는가?
8) 미니 연습(정답은 접어서)
- ROC Curve의 x축, y축은 각각 무엇인가?
- PR Curve가 ROC보다 적합한 상황은?
- Precision과 Recall의 trade-off는 어떻게 발생하는가?
정답 보기
1) x축=FPR, y축=TPR(Recall). 2) 클래스 불균형(양성 적음) 상황. 3) 임계값을 낮추면 Recall↑ Precision↓, 임계값을 높이면 Precision↑ Recall↓.