Page 87 - 인공지능 수학 교과서
P. 87
이제 MNIST 데이터 셋과 행렬의 해밍 거리를 활용하여 이미지 분류를 어떻게 하
는지 알아보자.
손 글씨 숫자 중 0, 1, 7을 흰색과 검은색으로 이루어진 픽셀 이미지로 표현하면 각
각 다음과 같다고 하자.
세 개의 이미지의 픽셀에 검은색은 0, 흰색은 1의 숫자를 부여하여 행렬 A, B, C로
나타내면 다음과 같이 표현할 수 있다.
1 1 0 0 0 0 1 1 1 1 1 0 0 1 1 1 1 1 0 0 0 0 1 1
1 0 0 0 0 0 0 1 1 1 1 0 0 1 1 1 1 0 0 0 0 0 0 1
1 0 0 1 1 0 0 1 1 1 1 0 0 1 1 1 1 0 0 1 1 0 0 1
1 0 0 1 1 0 0 1 1 1 1 0 0 1 1 1 1 0 0 1 1 0 0 1
1 0 0 1 1 0 0 1 1 1 1 0 0 1 1 1 1 1 1 1 1 0 0 1
1 0 0 1 1 0 0 1 1 1 1 0 0 1 1 1 1 1 1 1 1 0 0 1
1 0 0 0 0 0 0 1 1 1 1 0 0 1 1 1 1 1 1 1 1 0 0 1
1 1 0 0 0 0 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 0 0 1
8×8 행렬 A, B, C의 해밍 거리를 구해 보면, 행렬 A와 B의 해밍 거리는 36이고
행렬 A와 C의 해밍 거리는 12이다. 따라서 행렬 A는 행렬 B보다 행렬 C와 더 유사
하다고 할 수 있다.
이와 같은 방법으로 새로운 손 글씨 숫자가 입력될 때 MNIST 데이터 셋의 숫자와
의 유사도를 이용하여 어떤 숫자인지 판별할 수 있게 된다.
인공지능 ILSVRC(이미지넷 이미지 인식 대회)
이야기
오류 비율
ILSVRC는 이미지 자료를 처리하는 인공지능 기술의
발전에 기여를 한 대회이다. 이미지넷은 2만 2천 종류의
사물을 찍은 1천 4백만 장 정도의 고화질 사진으로 구성된
데이터베이스이다.
매년 개최되는 ILSVRC에서는 새로 개발된 인공지능
알고리즘들이 이미지넷에 있는 사진을 학습하고 주어진 사 (년)
진의 내용물을 정확히 맞히는 시합을 통해 성능을 겨룬다. 연도별 인공지능의 오류 비율
2011년까지는 인공지능이 사진을 맞힐 때 오류의 비율이 30%에 달했지만 2012년 등장한 알렉스넷은 이 오
류 비율을 15%까지 줄이는 획기적인 성과를 보였다. 알렉스넷은 합성곱 신경망(CNN)을 이미지 분류에 사용
한 첫 번째 모델이다. 2015년 이후 이 대회에서 우승한 모델들은 인간보다 훨씬 더 정확하게 사진을 분석하고
분류하고 있다.
1. 자료의 분류 85