Page 96 - 인공지능 수학 교과서
P. 96

인공지능은 어떻게 사건을 예측할까?


            광고 메일(스팸 메일)           요즘 사용하는 이메일 서비스에는 도착한 메일이 광고
            온라인에서 이용자의 의도와
                                 메일이라고 판단되면 자동으로 광고 메일함으로 보내는
            관계없이 임의로 보내는 각
            종 홍보ㆍ상업성 전자 메일을      기능이 있다. 여기에는 인공지능이 메일을 분석하고 메일
            말한다.
                                 의 유형을 예측하여 분류하는 알고리즘이 사용된다. 인공
                                 지능은 어떤 근거로 받은 메일의 유형을 예측하고 분류

                                 할까?
                                   현재까지 받은 메일 10개에 포함된 주요 단어와 메일의 유형이 [표 Ⅲ-1]과 같이

                                 제시되어 있다고 하자.

                                      [표 Ⅲ-1]
                                      A                                BA                              B
                                         구분      주요 단어         구분        구분       주요 단어         구분
                                          1      할인, 가격        일반          6      구매, 연체        일반
                                          2      당첨, 기회        광고          7      가격, 기회        일반

                                          3      가격, 구매        일반          8      할인, 구매        광고
                                          4      구매, 기회        일반          9      할인, 당첨        광고

                                          5      구매, 할인        광고         10      연체, 구매        일반

                                   ‘할인’ 단어가 포함된 새로운 메일을 받을 때 인공지능은 이 메일을 광고 메일로 판

                                 단할 수도 있고 일반 메일로 판단할 수도 있다. 각각의 가능성에 대한 확률을 구할 수

                                 있다면 인공지능은 확률이 큰 쪽을 결과로 판단하고 예측할 것이다.
                                   [표 Ⅲ-1]의 10개의 메일을 ‘할인’ 단어 포함 여부로 분류하면 [표 Ⅲ-2]와 같다.

                                               [표 Ⅲ-2]
                                               A                                                B
                     할인                              구분          일반 메일      광고 메일         계
                                                   ‘할인’ 포함         1           3          4
                                                  ‘할인’ 미포함         5           1          6
              일반 메일       광고 메일                       계            6           4          10


                                   새로 받은 메일에 ‘할인’ 단어가 포함될 때, 이 메일이 광고 메일일 가능성과 일반

                                 메일일 가능성을 알아보자.
                                   [표 Ⅲ-2]에서 ‘할인’ 단어를 포함한 4개의 메일 중에서 광고 메일이 3개, 일반 메
                                 일이 1개이다. 따라서 새로 받은 메일에 ‘할인’ 단어가 포함될 때, 이 메일이 광고 메일

                                 일 확률은 ;4#; 이고, 일반 메일일 확률은 ;4!; 이다.

                                   이때 ;4!;  < ;4#; 이므로 인공지능은 ‘할인’ 단어를 포함한 새 메일을 받으면 광고 메일이

                                 라고 예측하고 분류한다.


            94    Ⅲ.  분류와 예측
   91   92   93   94   95   96   97   98   99   100   101