컴퓨터 비전과 관련된 용어 정리
업데이트:
본 글은 AI 분야 중 컴퓨터 비전 에 관련된 공부를 하다가 기억해야할 용어들에 대해 기록하는 곳입니다. 해당 분야의 코드 및 트렌드에 대해선 컴퓨터 비전을 구경할 예정입니다.
A
B
C
오차 행렬(confusion matrix)
오차 행렬 |
이진 분류의 예측 오류들을 보여주는 지표이다.
D
E
F
-
False Positive(FP)
예측 결과는 Positive인데 정답 클래스가 Negative라서 틀린 경우 (False는 예측과 결과가 다름을 뜻한다. Positive는 예측의 종류다.)
-
False Negative(FN)
예측 결과는 Negative인데 정답 클래스가 Positive라서 틀린 경우 (False는 예측과 결과가 다름을 뜻한다. Negative는 예측의 종류다.)
G
H
I
IoU(Intersection over Union)
이미지를 입력으로 object detection을 해서 bounding box 혹은 segmentation을 얻었을 때, 정답과 영역을 비교하며 비율을 낼 수 있는데, 이것을 IoU라고 보면 된다. 식은 다음과 같다.
\[IoU = \frac{영역의\;교집합}{영역의\;합집합}\]예를 들어, 아래 사진을 보자.
IoU |
정답 box는 초록색, 예측은 빨간색으로 나타난다. 이 때, 합집합은 두 영역의 모든 영역을 얘기하고, 교집합은 파란색 부분을 생각하면 된다. 두 bounding box가 일치한다면 교집합과 합집합이 일치하게 되므로 IoU는 최대 값을 얻게 된다.
J
K
L
M
O
P
-
정밀도(Precision)
예측한 것들이 Positive인 모든 경우 중 정답이 Positive로 일치하는 데이터의 비율을 의미함. 식은 다음과 같다.
\[Precision = \frac{TP}{TP+FP}\]예를 들어, 100개의 데이터의 예측이 positive인데 그 중 80개만 정답이 Positive인 경우, 정밀도는 80/100 = 0.8이 된다.
정밀도는 Positive 예측 성능을 더욱 정밀하게 측정하기 위한 평가 지표이다.
Q
R
재현율(Recall)
실제 정답들이 Positive인 경우 중, 예측과 정답이 Positive로 일치하는 데이터의 비율을 의미함. 식은 다음과 같다.
\[Recall = \frac{TP}{TP+FN}\]예를 들어, 암을 갖고 있는 환자의 수가 100명일 때 암이라고 예측하는 경우가 20, 아니라고 예측하는 경우가 80이면 재현율은 20/100 = 0.2가 된다. 위 예시에서 재현율이 왜 중요한지 알 수 있다. 암에 걸린 환자들이 있는데, 데이터를 통해 아니라고 예측하는 경우가 80%나 된다면 그 환자들은 다들 큰일이 나지 않겠는가! 따라서 정답을 postive라고 예측해야하는 문제에 대해선 재현율을 지표로 사용하면 좋다.
S
T
-
True Positive(TP)
예측 결과는 Positive인데 정답 클래스가 Positive라서 같은 경우 (True는 예측과 결과가 같음을 뜻한다. Positive는 예측의 종류다.)
-
True Negative(TN)
예측 결과는 Negative인데 정답 클래스가 Negative라서 같은 경우 (True는 예측과 결과가 같음을 뜻한다. Negative는 예측의 종류다.)