ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • AI 모델 개발 – ROC & P-R Curve 완전 정리
    카테고리 없음 2025. 8. 31. 13:41

    목적: ROC CurvePrecision-Recall Curve 개념을 비교·이해하고, 해석법·시험 포인트까지 쉽게 정리.


    0) 핵심 한눈에 보기

    • ROC Curve: 민감도(Recall, TPR) vs 위양성율(FPR) 곡선.
    • P-R Curve: 정밀도(Precision) vs 재현율(Recall) 곡선.
    • 시험 포인트: 클래스 불균형 상황에선 PR Curve가 더 적합.

    1) 기본 지표 복습

    • TP: 실제 양성 맞춤.

    • FP: 실제 음성인데 양성으로 예측.

    • TN: 실제 음성 맞춤.

    • FN: 실제 양성인데 음성으로 예측.

    • Precision (정밀도) = TP / (TP + FP) → 양성 예측 중 얼마나 맞췄나.

    • Recall (재현율, 민감도, TPR) = TP / (TP + FN) → 실제 양성 중 얼마나 잡았나.

    • FPR (위양성율) = FP / (FP + TN).


    2) ROC Curve

    • x축 = FPR, y축 = TPR.
    • 해석: 커브가 왼쪽 위로 갈수록 성능↑.
    • AUC (Area Under Curve): 1에 가까울수록 좋음.
    • 장점: 클래스 불균형이 심하지 않을 때 성능 직관적으로 비교 가능.

    3) Precision-Recall Curve

    • x축 = Recall, y축 = Precision.

    • 해석: 곡선이 오른쪽 위로 갈수록 성능↑.

    • PR-AUC: 1에 가까울수록 좋음.

    • 장점: 클래스 불균형(양성 적음) 상황에서 더 유용.

      • 이유: ROC는 다수 클래스 영향으로 지나치게 좋게 보일 수 있음.

    4) 직관적 비유

    • ROC Curve: “병원 검사” – 건강인(TN)이 많아도 전체 평가에 영향.
    • PR Curve: “희귀병 진단” – 양성 적을 때, 진짜 양성 예측 정확성이 중요.

    5) 언제 무엇을 쓸까?

    • 데이터 균형: ROC.
    • 불균형(희귀 이벤트 탐지): PR Curve.
    • 시험 문제에서는 “불균형 데이터” 단어가 나오면 → PR Curve.

    6) 시험장 포인트

    • ROC = TPR vs FPR.
    • PR = Precision vs Recall.
    • AUC 값 비교 문제 자주 출제.
    • 불균형 → PR Curve 적합.
    • 곡선 모양 해석 가능해야 함.

    7) 실전 체크리스트

    • TP/FP/TN/FN 구분할 수 있는가?
    • Precision, Recall, FPR 정의 말할 수 있는가?
    • ROC와 PR 곡선 축 차이를 설명할 수 있는가?
    • AUC 의미 이해했는가?
    • 데이터 불균형 상황에서 PR Curve를 선택할 수 있는가?

    8) 미니 연습(정답은 접어서)

    1. ROC Curve의 x축, y축은 각각 무엇인가?
    2. PR Curve가 ROC보다 적합한 상황은?
    3. Precision과 Recall의 trade-off는 어떻게 발생하는가?
    정답 보기 1) x축=FPR, y축=TPR(Recall). 2) 클래스 불균형(양성 적음) 상황. 3) 임계값을 낮추면 Recall↑ Precision↓, 임계값을 높이면 Precision↑ Recall↓.
Designed by Tistory.