Page 87 - 인공지능 수학 교과서
P. 87

이제 MNIST 데이터 셋과 행렬의 해밍 거리를 활용하여 이미지 분류를 어떻게 하
               는지 알아보자.

                 손 글씨 숫자 중 0, 1, 7을 흰색과 검은색으로 이루어진 픽셀 이미지로 표현하면 각

               각 다음과 같다고 하자.









                 세 개의 이미지의 픽셀에 검은색은 0, 흰색은 1의 숫자를 부여하여 행렬 A, B, C로

               나타내면 다음과 같이 표현할 수 있다.

                          1 1 0 0 0 0 1 1        1 1 1 0 0 1 1 1       1 1 0 0 0 0 1 1
                          1 0 0 0 0 0 0 1        1 1 1 0 0 1 1 1       1 0 0 0 0 0 0 1
                          1 0 0 1 1 0 0 1        1 1 1 0 0 1 1 1       1 0 0 1 1 0 0 1
                          1 0 0 1 1 0 0 1        1 1 1 0 0 1 1 1       1 0 0 1 1 0 0 1
                          1 0 0 1 1 0 0 1        1 1 1 0 0 1 1 1       1 1 1 1 1 0 0 1
                          1 0 0 1 1 0 0 1        1 1 1 0 0 1 1 1       1 1 1 1 1 0 0 1
                          1 0 0 0 0 0 0 1        1 1 1 0 0 1 1 1       1 1 1 1 1 0 0 1
                          1 1 0 0 0 0 1 1        1 1 1 0 0 1 1 1       1 1 1 1 1 0 0 1


                 8×8 행렬 A, B, C의 해밍 거리를 구해 보면, 행렬 A와 B의 해밍 거리는 36이고
               행렬 A와 C의 해밍 거리는 12이다. 따라서 행렬 A는 행렬 B보다 행렬 C와 더 유사

               하다고 할 수 있다.
                 이와 같은 방법으로 새로운 손 글씨 숫자가 입력될 때 MNIST 데이터 셋의 숫자와

               의 유사도를 이용하여 어떤 숫자인지 판별할 수 있게 된다.




                인공지능              ILSVRC(이미지넷 이미지 인식 대회)
                 이야기
                                                                           오류 비율
                         ILSVRC는 이미지 자료를 처리하는 인공지능 기술의
                       발전에 기여를 한 대회이다. 이미지넷은 2만 2천 종류의
                       사물을 찍은 1천 4백만 장 정도의 고화질 사진으로 구성된
                       데이터베이스이다.

                         매년 개최되는 ILSVRC에서는 새로 개발된 인공지능
                       알고리즘들이 이미지넷에 있는 사진을 학습하고 주어진 사                                                         (년)
                       진의 내용물을 정확히 맞히는 시합을 통해 성능을 겨룬다.                               연도별 인공지능의 오류 비율
                         2011년까지는 인공지능이 사진을 맞힐 때 오류의 비율이 30%에 달했지만 2012년 등장한 알렉스넷은 이 오

                       류 비율을 15%까지 줄이는 획기적인 성과를 보였다. 알렉스넷은 합성곱 신경망(CNN)을 이미지 분류에 사용
                       한 첫 번째 모델이다. 2015년 이후 이 대회에서 우승한 모델들은 인간보다 훨씬 더 정확하게 사진을 분석하고
                       분류하고 있다.



                                                                                                 1. 자료의 분류   85
   82   83   84   85   86   87   88   89   90   91   92