Page 102 - 인공지능 수학 교과서
P. 102

일반적으로 산점도의 두 변량 x, y 사이의 상관관계의 경향성을 나타내는 직선 또
                                 는 곡선을 추세선이라 한다. 직선 형태의 추세선은 일차함수 y=ax+b(a, b는 상수)
             우리가 배우는 예측 모델은
              주로 선형 추세선이고,
                                 의 꼴로 표시된다. 또 산점도에서 추세선은 모든 x에 대하여 예측값 f(x)와 측정값 y
               추세선을 결정하는
              방법은 다음 단원에서        의 차, 즉 오차들을 전체적으로 최소화하는 직선 또는 곡선임이 알려져 있다.
                   배워요!
                                                                                                  문제    추론
                                       생각해 보기                                                     해결
                                    다음 그림에서 A, B, C, D의 네 개의 직선 중 주어진 두 자료의 경향성을 잘 나타낸 추세선은

                                    어느 것인지 생각해 보자.
                                                           y                     A






                                                                                 B



                                                                                  C
                                                          O                         x
                                                                               D





                                     추세선을 이용하여 예측값을 어떻게 찾을까?

            체질량 지수(BMI)            어떤 보험 회사에서 인공지능을 이용하여 의료비 지출이 많은 고위험군에 속한 가
            체중을 신장의 제곱으로 나
                                 입자를 대상으로 체질량 지수와 연간 의료비 사이의 관계를 예측하는 모델을 개발하
            눈 값으로 비만 정도를 측정
            하는 지수이다. 30 이상이면
                                 려고 한다.
            건강상 심각한 문제가 발생
            할 가능성이 높다.             표는 체질량 지수가 30 이상인 성인 남성 20명의 체질량 지수와 연간 의료비를 조
                                 사하여 나타낸 것이다.

                                 A                                    B  A                                  B
                                     가입자          체질량         의료비          가입자          체질량         의료비
                                     아이디          지수          (만 원)        아이디          지수          (만 원)
                                       1           32          180           11          46          262
                                       2           33          195           12          44          240
                                       3           42          240           13          39          230
                                       4           41          270           14          38          200
                                       5           36          240           15          46          275
                                       6           35          225           16          48          300

                                       7           44          265           17          42          250
                                       8           43          252           18          40          275
                                       9           36          225           19          50          290
                                       10          37          230           20          49          305


            100    Ⅲ.  분류와 예측
   97   98   99   100   101   102   103   104   105   106   107