Page 74 - 인공지능 수학 교과서
P. 74
긍정 단어와 부정 단어에 대한 영화 댓글 X의 자카드 유사도는 각각 다음과 같이 구
할 수 있다.
P X N X
좋다 없음 좋다
귀엽고 괜찮은 최악 괜찮은
잘한다 재밌게 않는 아깝다 않는 재밌게
멋있다 짱 지루한 부족한 지루한 짱
예쁘다 선호 별로 아쉽다 별로 선호
최고 부담 최고
싫다
▶ 근삿값은 참값에 가까운
값을 뜻하고 ≒로 나타낸 n(P\capX) 6 n(N\capX) 3
J(P, X)= = ≒0.46 J(N, X)= = ≒0.19
다. 근삿값의 대표적인 예 n(P∪X) 13 n(N∪X) 16
로 측정값이 있다.
여기서 새로운 댓글 X에 담긴 감정이 긍정인지, 중립인지, 부정인지 판단하는 기준
은 다음과 같다.
▶ k 의 값은 양수이다. J(P, X)-J(N, X)≥k ⇨ 긍정
-k<J(P, X)-J(N, X)<k ⇨ 중립
J(P, X)-J(N, X)≤-k ⇨ 부정
일반적으로 양수 k의 값은 0.25를 적용하며 상황에 따라 적절히 조절하여 사용한다.
따라서 댓글 X에 대해 감성 분석을 하면
J(P, X)-J(N, X)=0.46-0.19=0.27
으로 그 값이 0.25보다 크므로 댓글 X에 담긴 감정은 ‘긍정’인 것으로 판단한다.
문제 1 인공지능 스피커에 입력된 질문 X의 단어들의 집합 X와 인공지능 스피커에 미리
저장된 두 질문 A, B의 단어들의 집합 A, B가 각각 다음과 같다.
입력된 질문의 단어 저장된 두 질문의 단어
A={ 내일, 아침, 7시, 깨워 }
X={ 내일, 날씨, 어때 }
B={ 내일, 날씨, 알려 }
이때 자카드 유사도 J(A, X)와 J(B, X)의 값을 각각 구하고, 질문 X가 질문 A,
B 중 어느 것과 더 유사한지 판단하시오.
72 Ⅲ. 분류와 예측