Page 154 - 인공지능 수학 교과서
P. 154
정답 및 해설
➌ 자료에 따라 직선 형태의 추세선보다 곡선 형태의 C\capA={유사도, 분류, 있다}
추세선이 합리적인 예측을 하는 데 활용될 수 있다. n(C\capA) 3
J(C, A)= = =;2!;
따라서 직선 형태의 추세선뿐만 아니라 다양한 형태 n(C∪A) 5+4-3
의 추세선이 활용된다. 따라서 ;4!; <;7@; <;2!; 이고 1에 더 가까울수룩 유사
한 문장이므로 문장 1과 문장 3이 가장 유사한 문
장이다.
[2] 문장 1, 문장 2, 문장 3에 포함된 단어들의 빈도
대단원 마무리 본문 106~107쪽
수 벡터를 각각 a, b, c 라 하자.
01 1, 0
02 1, 0 단어 (코사인, 유사도, 분류, 있다, 자카드, 집합, 이용, 텍스트, 문서)
문장 1 a=(1, 1, 1, 1, 0, 0, 0, 0, 0)
03 0, 0
04 인공 신경망 문장 2 b=(0, 1, 1, 0, 1, 1, 1, 0, 0)
문장 3 c=(0, 1, 1, 1, 0, 0, 0, 1, 1)
05 확률
06 추세선 2 sqrt5
C( a, b )= =
07 총 판매량은 80이므로 D제품의 판매량은 30개이 sqrt4 sqrt5 5
고 상대도수는 다음과 같다. C( b, c )= 2 = 2
sqrt5 sqrt5 5
A B
제품 종류 A B C D 3 3sqrt5
C( c, a )= =
판매량 16 12 22 30 sqrt5 sqrt4 10
상대도수 ;8!0^;=0.2 ;8!0@;=0.15 ;8@0@;=0.275 ;8#0);=0.375 2 sqrt5 3sqrt5
따라서 < < 이고 1에 더 가까울수룩
5 5 10
따라서 판매량의 상대도수가 가장 높은 제품이 D 유사한 문장이므로 문장 1과 문장 3이 가장 유사
이므로 제품 D를 구매할 것으로 예측할 수 있다. 한 문장이다.
08 두 행렬 A, B의 해밍 거리는 6, 두 행렬 A, C의 해 10 남자 고객이 총 16명이고 이 중 제품 A를 선호하
밍 거리는 6, 두 행렬 B, C의 해밍 거리는 4이다.
는 고객이 12명이므로 그 확률은 ;1!6@; =;4#;이다.
따라서 가장 가까운 두 행렬은 B, C이다.
또 선호하지 않는 고객이 4명이므로 그 확률은
n(A\capB)
09 (1) J(A, B)= ;1¢6; =;4!; 이다. ;4#; > ;4!;이므로 제품 A를 선호하는
n(A∪B)
n(A\cap B) 고객으로 예측할 수 있다.
=
n(A)+n(B)-n(A\capB) 11 y=18.5×90+3.24=1668.24로 약 1,668명으로
문장 1, 문장 2, 문장 3의 단어의 집합을 각각 A, B, 예측할 수 있다.
C라 하자.
A={코사인, 유사도, 분류, 있다}
B={자카드, 유사도, 집합, 이용, 분류}
C={텍스트, 문서, 유사도, 분류, 있다}
A\capB={유사도, 분류}
n(A\capB) 2
J(A, B)= = =;7@;
n(A∪B) 4+5-2
B\capC={유사도, 분류}
n(B\capC) 2
J(B, C)= = =;4!;
n(B∪C) 5+5-2
152 부록