Page 32 - 인공지능 수학 교과서
P. 32

단어의 빈도수를 벡터로 표현하면 텍스트 자료에서 사용된 단어들이 얼마나 반복적
                                 으로 사용되었는지 한눈에 알 수 있다. 따라서 문서에서 사용된 주요 단어나 주제어를

                                 쉽게 찾을 수 있고, 주요 단어나 주제어를 이용하여 문서를 분류하거나 유사한 문서를
                                 찾는 것으로 확장하여 활용할 수 있다.





            ▶ 단어의 빈도수를 벡터로          예제 1
              표현하면 성분의 크기를
              비교하여  자주  사용한         다음 표는 된장찌개, 김치찌개의 조리법에 사용되는 단어의 빈도수를 나타낸 것이다. 조리법
              단어를 확인하거나 상대
                                    A와 B가 각각 된장찌개와 김치찌개의 조리법일 때, 표를 보고 물음에 답하시오.
              빈도를 계산하는 등 여러
                                    A                                                                    B
              가지 수학적인 작업을 할            단어     돼지고기     소고기     양파      두부     김치      감자    고춧가루     된장
              수 있다.
                                      조리법 A      3       2      3       4      0       3      0       7
                                      조리법 B      3       0      2       3      8       3      3       0

                                    (1) 조리법 A와 B에서 가장 많이 사용되는 단어를 각각 하나씩 찾으시오.
                                    (2) 조리법 A와 B에서 단어별 빈도수를 성분으로 하는 벡터를 구하시오.



                                    풀이

                                    (1)  조리법 A에서는 ‘된장’, 조리법 B에서는 ‘김치’가 가장 많이 사용된다.

                                    (2)  조리법 A와    B에서 단어별 빈도수를 성분으로 하는 벡터를 각각  a,   b라 하면
                                                                                          
                                                                                        
                                                             
                                         a=(3, 2, 3, 4, 0, 3, 0, 7),  b=(3, 0, 2, 3, 8, 3, 3, 0)이다.
                                             답    (1) A: 된장, B: 김치   (2) a=(3, 2, 3, 4, 0, 3, 0, 7),  b=(3, 0, 2, 3, 8, 3, 3, 0)





                                    문제 2   주요 단어에 밑줄 친 문장 A, B를 보고 다음 물음에 답하시오.


                                      문장 A:  인공지능을 통해 면접을 보는 회사가 늘고 있다. 면접에 합격하기 위해서는 인공
                                             지능이 묻는 질문에 생각을 정확히 표현해야 한다.

                                      문장 B:  오늘 시험에서 인공지능에 대한 질문이 있었어요. 이 질문은 예상했었는데, 표현을

                                             못했어요. 너무 긴장되는 시험이었어요.


                                    (1) 문장 A, B에 등장하는 밑줄 친 단어의 빈도수를 표로 나타내시오.
                                       A                                                                   B
                                          단어    인공지능    면접    회사    합격    질문    생각   표현    시험    예상    긴장

                                         문장 A
                                         문장 B

                                    (2) 표를 보고 두 문장 A, B의 단어별 빈도수를 성분으로 하는 벡터를 각각  a,   b 라 할 때,
                                                                                                     
                                                                                                   
                                          a,   b 를 구하시오.
                                         
            30    Ⅱ.  자료의 표현
   27   28   29   30   31   32   33   34   35   36   37