Page 42 - 인공지능 수학 교과서
P. 42

▶ 문장 A와 B의 단어들을        단어 ‘컴퓨터’의 임베딩 벡터 c=(1.6, 1.3)에 대하여 세 벡터 c, m, n 을 각각 좌표
              대표하는  벡터는  각각
                                 평면 위에 나타낸 점을 C, M, N이라 할 때,
                
                    
                          
                      
              m=OM, n=ON이다.
                                                                        2
                                                                              .
                                             CM = ^  . 1 6- 1 +^h 2  . 1 3-  . 0 9h = 052
                                                                          2
                                                                                .
                                             CN   = ^  . 1 6-  . 1 5 +^h 2  . 1 3-  . 1 4h = 002
                                 CN<  CM이므로 단어 ‘컴퓨터’는 문장 B에 더 가깝다고 할 수 있다.

                                   일반적으로 텍스트 자료의 단어 임베딩 벡터들에서 평균을 이용한 벡터를 구하면
                                 주어진 자료를 대표하는 벡터를 정할 수 있다. 이렇게 정한 벡터와 새로운 단어를 나

                                 타내는 벡터를 좌표평면 위에 표시하여 두 점 사이의 거리를 계산하여 비교하면 문장

                                 이나 단어들 사이의 유사한 정도를 알 수 있다.




                                    문제 5    다음 표는 두 문장 A, B의 단어를 각각 임베딩 벡터로 나타낸 것이다. 새로운 단어

                                           ‘에너지’의 임베딩 벡터가 c =(1, 0.9)일 때, 단어 ‘에너지’가 두 문장 A, B 중
                                                                  
                                           어느 문장에 더 가까운지 판정하시오.

                                      문장 A의 단어            화력                 방사능                태평양

                                       임베딩 벡터         a_1=(0.6, 0.9)     a_2=(1.3, 0.5)     a_3=(1.1, 1)


                                      문장 B의 단어           음료수                 마트                 칼로리
                                       임베딩 벡터         b_1=(0.8, 1.6)     b_2=(1.3, 1.5)     b_3=(1.5, 0.8)







             인공지능              튜링 테스트
              이야기

                      1950년 영국의 수학자 앨런 튜링                                          1단계  컴퓨터 화면을 통해 질문자와 답변자
                                                                       답변자 A:
                                                                                       들이 대화. 질문자는 누가 사람인지
                    은 ‘기계’와 ‘생각한다’라는 것을 정의                             나는 사람이야!
                                                                                       아닌지 모르는 상태
                    하는 문제의 어려움을 지적하며 기                                             2단계  정해진 질문에 대한 대답을 주고받음.
                                                                                   3단계  답변자가 사람인지 아닌지 질문자가
                    계가 생각하는지를 판별하는 ‘모방                                                 지목하지 못할 경우 ‘기계에 지능이 있
                                                                                       다.’ 판정
                    게임(Imitation game)’을 제안했고
                    이 게임이 나중에 앨런 튜링의 이름                              답변자 B:
                                                                     나도 사람인데?      A: 나는 사람이야!        질문자
                    을 따서 튜링 테스트로 불리게 된다.                                            B: 나도 사람인데?
                      지금까지 완벽하게 튜링 테스트를

                    통과한 기계는 없다.




            40    Ⅱ.  자료의 표현
   37   38   39   40   41   42   43   44   45   46   47