Page 45 - 인공지능 수학 교과서
P. 45
문장에서 자주 사용한 단어를 쉽게 파악하도록 표현하는 방법 중 하나는 단어 구름
을 이용하는 것이다. 단어 구름은 사용 빈도에 비례하도록 단어의 크기를 정하여 그린
그림으로, 이를 이용하면 문장에서 어떤 단어의 사용 빈도가 높은지 쉽게 파악할 수
있다.
다음은 인공지능 알파폴드에 관한 기사이다.
2020년 말, 딥마인드는 분자 생물학 분야에서도 과학자 수준의 분석을 갖춘 인
공지능을 개발했다. 유전 정보를 분석해 단백질의 3차원 구조를 예측하고 난치병
을 치료하는 연구에 크게 기여할 것이라는 평가다. 과학자들은 인공지능 ‘알파폴
드’가 분자 생물학 분야에 큰 도약을 가져올 것으로 보고 있다.
딥마인드는 ‘알파폴드’가 단백질 구조 예측 대회에 참가해 주어진 과제의 3분의
2에서 과학자 수준의 정확도를 보였다고 밝혔다.
알파고 이후 인공지능이 기여할 수 있는 분야를 성큼성큼 확장해 나가는 행보를
보여주어, 많은 뉴스에서 앞다투어 이 소식을 보도하였다.
영국 유럽 분자 생물학 연구소의 재넛 손튼 박사는 “염기 서열을 통한 단백질 구
조 예측 문제는 내 평생 동안 풀지 못할 거라고 생각한 문제”라며 “알파폴드의 접근
법이 인간 유전체(게놈)에 있는 수천 개 단백질의 기능을 밝히고 개인마다 다른 질
병을 유발하는 유전자 변이를 이해하는 데 도움이 되기를 바란다.”고 말했다.
- 출처: 조선일보, 2020. 12. 01.
오른쪽은 위 기사를 단어 구름으로 표현하여 시각화한 결과이다.
단어 구름을 보면 딥마인드의 알파폴드가 “인간의 단백질 구조를
예측했다.”라는 주제를 한눈에 알 수가 있다. 또한 기사를 읽지 않아
도 알파폴드가 ‘분자 생물학’에 기여할 것이라는 사실을 쉽게 알아볼
수 있다.
이처럼 주어진 자료를 여러 방법으로 시각화하는 것은 자료의 특
징을 한눈에 파악하는 데 매우 효과적이다.
원-핫 벡터에 비해 단어 임베딩 벡터를 이용할 때의 장점은 무엇인가?
스스로
단어 임베딩 벡터들의 평균을 구하는 이유는 무엇인가?
정리하기
텍스트를 시각화할 때의 장점은 무엇인가?
1. 텍스트 자료의 표현과 처리 43