Page 72 - 인공지능 수학 교과서
P. 72

텍스트 자료에서 감성을 알아내는 방법은 무엇일까?

                                   영화 리뷰는 영화를 감상한 의견을 표현한 비정형 텍스트 자료이다. 사람들의 태도,

                                 의견, 성향과 같은 주관적인 텍스트 자료에서 긍정, 부정, 중립과 같은 감정을 파악하는

                                 기술을 감성 분석이라고 한다.
                                   [표 Ⅲ-1]은 영화를 평한 댓글 문장에 담긴 감정을 사람이 긍정, 중립, 부정으로 분류

                                 해 본 것이다.
                                 [표 Ⅲ-1]
                                 A                                                                          B
                                                         영화 댓글                                   감정
                                   (“정말 재밌게 본 영화. 스토리도 연출도 짱 정말 최고로 좋다!”)                        긍정
                                   (“배우들의 연기가 좋다. 괜찮은 내용, 두 번 봐도 좋다.”)                           긍정

                                   (“지루한 내용이지만, 배우들은 멋있다.”)                                      중립
                                   (“내가 선호하는 장르지만 뭔가 부족하다.”)                                     중립
                                   (“정말 돈 아깝다. 인생 최악의 영화다. 별로다.”)                                부정
                                   (“연기도 부담스럽고 지루한 내용이다.”)                                       부정


              인공지능은 단어 가방          감성 분석을 하기 위해서는 긍정, 부정, 중립에 해당하는 단어에 각각 어떤 것들이
             (bag of words)에 긍정과
                                 있는지 알아야 한다. 인공지능은 [표 Ⅲ-1]의 영화 댓글과 같은 여러 자료를 바탕으로
             부정에 해당하는 단어들을
             미리 학습해서 모아 놓아요.     긍정 단어 가방과 부정 단어 가방을 미리 준비한다.







                                                                                      않는
                                              귀엽고    재밌게                                      없음

                                                                                지루한
                                                           멋있다                          부족한
                                                 짱                                                부담
                                       잘한다
            감성 분석 절차
               감성 정보가 많이                              예쁘다                    최악    아쉽다     싫다
                                                             괜찮은
              들어 있는 영화 댓글,               최고                                                       별로
               쇼핑몰 댓글 등의                        좋다
               새로운 자료 수집                               선호                             아깝다



               문장에서 단어 분리                         긍정 단어 가방                              부정 단어 가방


               단어를 집합으로 표현         새로운 문장이 입력되면 단어들을 분리하고 긍정 단어 가방과 부정 단어 가방에 포
               단어를 벡터로 표현        함된 단어들과 비교하여 문장에 포함된 감정을 판정한다. 이때 텍스트 자료들 사이의
                                 유사한 정도를 수치화하여 나타낸 것을 유사도(similarity)라고 한다.
                 미리 준비된
             단어 가방과의 유사도를          유사도는 서로 다른 두 문장이 얼마나 비슷한지 혹은 얼마나 다른지를 나타내는
              구하여 감성 분석을 함.
                                 정도이다.


            70    Ⅲ.  분류와 예측
   67   68   69   70   71   72   73   74   75   76   77