Page 42 - 인공지능 수학 교과서
P. 42
▶ 문장 A와 B의 단어들을 단어 ‘컴퓨터’의 임베딩 벡터 c=(1.6, 1.3)에 대하여 세 벡터 c, m, n 을 각각 좌표
대표하는 벡터는 각각
평면 위에 나타낸 점을 C, M, N이라 할 때,
m=OM, n=ON이다.
2
.
CM = ^ . 1 6- 1 +^h 2 . 1 3- . 0 9h = 052
2
.
CN = ^ . 1 6- . 1 5 +^h 2 . 1 3- . 1 4h = 002
CN< CM이므로 단어 ‘컴퓨터’는 문장 B에 더 가깝다고 할 수 있다.
일반적으로 텍스트 자료의 단어 임베딩 벡터들에서 평균을 이용한 벡터를 구하면
주어진 자료를 대표하는 벡터를 정할 수 있다. 이렇게 정한 벡터와 새로운 단어를 나
타내는 벡터를 좌표평면 위에 표시하여 두 점 사이의 거리를 계산하여 비교하면 문장
이나 단어들 사이의 유사한 정도를 알 수 있다.
문제 5 다음 표는 두 문장 A, B의 단어를 각각 임베딩 벡터로 나타낸 것이다. 새로운 단어
‘에너지’의 임베딩 벡터가 c =(1, 0.9)일 때, 단어 ‘에너지’가 두 문장 A, B 중
어느 문장에 더 가까운지 판정하시오.
문장 A의 단어 화력 방사능 태평양
임베딩 벡터 a_1=(0.6, 0.9) a_2=(1.3, 0.5) a_3=(1.1, 1)
문장 B의 단어 음료수 마트 칼로리
임베딩 벡터 b_1=(0.8, 1.6) b_2=(1.3, 1.5) b_3=(1.5, 0.8)
인공지능 튜링 테스트
이야기
1950년 영국의 수학자 앨런 튜링 1단계 컴퓨터 화면을 통해 질문자와 답변자
답변자 A:
들이 대화. 질문자는 누가 사람인지
은 ‘기계’와 ‘생각한다’라는 것을 정의 나는 사람이야!
아닌지 모르는 상태
하는 문제의 어려움을 지적하며 기 2단계 정해진 질문에 대한 대답을 주고받음.
3단계 답변자가 사람인지 아닌지 질문자가
계가 생각하는지를 판별하는 ‘모방 지목하지 못할 경우 ‘기계에 지능이 있
다.’ 판정
게임(Imitation game)’을 제안했고
이 게임이 나중에 앨런 튜링의 이름 답변자 B:
나도 사람인데? A: 나는 사람이야! 질문자
을 따서 튜링 테스트로 불리게 된다. B: 나도 사람인데?
지금까지 완벽하게 튜링 테스트를
통과한 기계는 없다.
40 Ⅱ. 자료의 표현