Page 45 - 인공지능 수학 교과서
P. 45

문장에서 자주 사용한 단어를 쉽게 파악하도록 표현하는 방법 중 하나는 단어 구름
               을 이용하는 것이다. 단어 구름은 사용 빈도에 비례하도록 단어의 크기를 정하여 그린

               그림으로, 이를 이용하면 문장에서 어떤 단어의 사용 빈도가 높은지 쉽게 파악할 수

               있다.
                 다음은 인공지능 알파폴드에 관한 기사이다.


                     2020년 말, 딥마인드는 분자 생물학 분야에서도 과학자 수준의 분석을 갖춘 인
                    공지능을 개발했다. 유전 정보를 분석해 단백질의 3차원 구조를 예측하고 난치병

                    을 치료하는 연구에 크게 기여할 것이라는 평가다. 과학자들은 인공지능 ‘알파폴
                    드’가 분자 생물학 분야에 큰 도약을 가져올 것으로 보고 있다.
                     딥마인드는 ‘알파폴드’가 단백질 구조 예측 대회에 참가해 주어진 과제의 3분의

                    2에서 과학자 수준의 정확도를 보였다고 밝혔다.
                     알파고 이후 인공지능이 기여할 수 있는 분야를 성큼성큼 확장해 나가는 행보를
                    보여주어, 많은 뉴스에서 앞다투어 이 소식을 보도하였다.
                     영국 유럽 분자 생물학 연구소의 재넛 손튼 박사는 “염기 서열을 통한 단백질 구
                    조 예측 문제는 내 평생 동안 풀지 못할 거라고 생각한 문제”라며 “알파폴드의 접근

                    법이 인간 유전체(게놈)에 있는 수천 개 단백질의 기능을 밝히고 개인마다 다른 질
                    병을 유발하는 유전자 변이를 이해하는 데 도움이 되기를 바란다.”고 말했다.

                                                                      - 출처: 조선일보, 2020. 12. 01.




                 오른쪽은 위 기사를 단어 구름으로 표현하여 시각화한 결과이다.
                 단어 구름을 보면 딥마인드의 알파폴드가 “인간의 단백질 구조를
               예측했다.”라는 주제를 한눈에 알 수가 있다. 또한 기사를 읽지 않아

               도 알파폴드가 ‘분자 생물학’에 기여할 것이라는 사실을 쉽게 알아볼

               수 있다.
                 이처럼 주어진 자료를 여러 방법으로 시각화하는 것은 자료의 특
               징을 한눈에 파악하는 데 매우 효과적이다.










                                     원-핫 벡터에 비해 단어 임베딩 벡터를 이용할 때의 장점은 무엇인가?
                    스스로
                                      단어 임베딩 벡터들의 평균을 구하는 이유는 무엇인가?
                   정리하기
                                      텍스트를 시각화할 때의 장점은 무엇인가?




                                                                                         1. 텍스트 자료의 표현과 처리   43
   40   41   42   43   44   45   46   47   48   49   50