Page 78 - 인공지능 수학 교과서
P. 78

벡터 a=(1, 0)과 세 벡터 b=(2, 0), c=(2, 1), d=(0, 2)이 각각 이루는 각의 크
                                 기와 코사인 유사도를 그림과 표로 나타내면 다음과 같다.


  y         ▶ 두 벡터 a, b가 이루는     y                           A                                            B
              각의 크기를                                               벡터        두 벡터 사이의 각        코사인 유사도
       A(aÁ, aª)                    D(0, 2)
               x°(0°lex°le90°)라 할                                  a와 b          0°               1
                                                                    
              때 x°가 0°에 가까울수록
           AB³=bø-a ø
                                                 C(2, 1)
    a ø       Ca, b의 값은 1에 가  d ø                              a와 c        약 26.6°           25
                                                                    
               B(bÁ, bª)
              까워지고, x°가 90°에 가            c ø                                                      5
         b ø  까울수록 Ca, b의 값         a ø   b ø   x              a와 d          90°              0
                                                                    
                   x
 O            은 0에 가까워진다.         O       A(1, 0) B(2, 0)
            ▶ 유클리디안 유사도는 0 이        코사인 유사도를 이용한 감성 분석
              상의 모든 실수값을 가지
                                   앞에서 살펴본 영화 댓글 X와 긍정과 부정의 표현 P, N의 텍스트 자료를 나타내는
              는 반면 코사인 유사도는
              0 이상 1 이하의 값을 가    벡터 p=(1, 1, 1, 1, 0, 0, 0, 0), n=(0, 0, 0, 0, 1, 1, 1, 1), x=(1, 2, 0, 0, 1, 1, 2, 1)
              진다.
                                 에 대하여 코사인 유사도에 따른 감성 분석을 해 보자.
                                                                  
                                   댓글 X에 대한 코사인 유사도 C    p, x 와 C  n, x 를 각각 구하면 다음과 같다.
                                 A                                                                          B
                                         긍정 표현 P와 댓글 X의 코사인 유사도               부정 표현 N과 댓글 X의 코사인 유사도


                                               pbullx   3     3                      nbullx   5
                                                
                                                                                         
                                         
                                           
                                                                                   
                                      Cp, x  =    =       =    ≒0.43        Cn, x  =    =        ≒0.72
                                                                                 
                                               |p||x|  4 12  4                    |n||x|  4 12
                                                
                                   C   p, x <C  n, x 이다. 따라서 이 영화 댓글 X는 긍정 표현보다 부정 표현에 더
                                                    
                                                 
                                       
                                          
                                 가깝다고 볼 수 있다.
                                    예제 1

                                    세 벡터 a=(1, 2),  b=(2, 1),  c=(2, 4)에 대하여 코사인 유사도를 구하시오.
                                                                       
                                          
                                    (1) C  (a, b)               (2) C  (a, c)

                                    풀이
                                                 1×2+2×1                           1×2+2×4
                                    (1) C  a, b  =       =;5$;         (2) C  a, c  =   =1
                                                                           
                                                                             
                                                1^2+2^2 2^2+1^2            1^2+2^2 2^2+4^2
                                                                                               답   (1) ;5$;   (2) 1






                                    문제 3    벡터 a,  b 가  a=(1, 3, 0), b=(1, 2, sqrt5)일 때, 코사인 유사도  C  (a,  b)의 값
                                                 
                                           을 구하시오.

            76    Ⅲ.  분류와 예측
   73   74   75   76   77   78   79   80   81   82   83