Page 78 - 인공지능 수학 교과서
P. 78
벡터 a=(1, 0)과 세 벡터 b=(2, 0), c=(2, 1), d=(0, 2)이 각각 이루는 각의 크
기와 코사인 유사도를 그림과 표로 나타내면 다음과 같다.
y ▶ 두 벡터 a, b가 이루는 y A B
각의 크기를 벡터 두 벡터 사이의 각 코사인 유사도
A(aÁ, aª) D(0, 2)
x°(0°lex°le90°)라 할 a와 b 0° 1
때 x°가 0°에 가까울수록
AB³=bø-a ø
C(2, 1)
a ø Ca, b의 값은 1에 가 d ø a와 c 약 26.6° 25
B(bÁ, bª)
까워지고, x°가 90°에 가 c ø 5
b ø 까울수록 Ca, b의 값 a ø b ø x a와 d 90° 0
x
O 은 0에 가까워진다. O A(1, 0) B(2, 0)
▶ 유클리디안 유사도는 0 이 코사인 유사도를 이용한 감성 분석
상의 모든 실수값을 가지
앞에서 살펴본 영화 댓글 X와 긍정과 부정의 표현 P, N의 텍스트 자료를 나타내는
는 반면 코사인 유사도는
0 이상 1 이하의 값을 가 벡터 p=(1, 1, 1, 1, 0, 0, 0, 0), n=(0, 0, 0, 0, 1, 1, 1, 1), x=(1, 2, 0, 0, 1, 1, 2, 1)
진다.
에 대하여 코사인 유사도에 따른 감성 분석을 해 보자.
댓글 X에 대한 코사인 유사도 C p, x 와 C n, x 를 각각 구하면 다음과 같다.
A B
긍정 표현 P와 댓글 X의 코사인 유사도 부정 표현 N과 댓글 X의 코사인 유사도
pbullx 3 3 nbullx 5
Cp, x = = = ≒0.43 Cn, x = = ≒0.72
|p||x| 4 12 4 |n||x| 4 12
C p, x <C n, x 이다. 따라서 이 영화 댓글 X는 긍정 표현보다 부정 표현에 더
가깝다고 볼 수 있다.
예제 1
세 벡터 a=(1, 2), b=(2, 1), c=(2, 4)에 대하여 코사인 유사도를 구하시오.
(1) C (a, b) (2) C (a, c)
풀이
1×2+2×1 1×2+2×4
(1) C a, b = =;5$; (2) C a, c = =1
1^2+2^2 2^2+1^2 1^2+2^2 2^2+4^2
답 (1) ;5$; (2) 1
문제 3 벡터 a, b 가 a=(1, 3, 0), b=(1, 2, sqrt5)일 때, 코사인 유사도 C (a, b)의 값
을 구하시오.
76 Ⅲ. 분류와 예측