Page 36 - 인공지능 수학 교과서
P. 36

텍스트 자료의 처리와 시각화



                        수와 수학 기호로 표현된 텍스트 자료를 처리하는 수학 원리를 이해하고 자료를 시각화할 수 있다.





                       생각 열기
                연말에는 많은 기관들이 올해의 단어, 화제의 단어를 선정하고 발표한

              다. 온라인 사전   은 2020년 올해의 단어로 ‘팬데믹(pandemic, 감염병
              이 세계적으로 유행하는 현상)’을 선정하였고, 영국의 사전 출판사 △△는
              ‘록다운(lockdown, 폐쇄)’을 선정하였다.    기업에서도 2020년 화제가
              되었던 단어들을 발표하였는데, 그림은 이를 시각화한 자료이다.








                ?     온라인에서 가장 많이 검색되고 사용된 단어는 어떻게 찾아낼 수 있을까?





                                   요즘은 누리 소통망 서비스(SNS)에 올라온 게시물들을 이용하여 선거 결과를 예측
                                 하거나 뉴스·기사들을 보면서 국민의 여론을 유추하기도 한다. 또한 포털 사이트에서

                                 찾고자 하는 정보를 검색하면 해당 정보뿐만 아니라 이와 관련된 기사나 게시물을 함께
                                 볼 수 있다. 이런 기능들은 컴퓨터가 텍스트 자료를 수와 수학 기호로 처리하여 텍스

                                 트 자료 안에 포함되어 있는 정보를 인식하고 가공하면서 가능해졌다.
                                   인공지능이 수와 수학 기호로 표시된 텍스트 자료에서 어떻게 주제어를 찾고, 문장

                                 의 의미를 파악하며 어떻게 문서 간 유사성을 파악하여 시각화하는지 알아보자.


                                 텍스트 자료                      자료의 처리                       정보 추출 및 시각화




















                                                          텍스트 자료의 처리와 시각화


            34    Ⅱ.  자료의 표현
   31   32   33   34   35   36   37   38   39   40   41