Page 101 - 인공지능 수학 교과서
P. 101

인공지능은 자료의 경향성을 어떻게 나타낼까?

                 두 자료의 변량을 각각 x, y라 하고, 두 변량 x, y의 순서쌍 (x, y)를 산점도로 나타

               내면 두 변량 사이의 상관관계와 자료의 경향성을 알 수 있다.                                              상관관계
                                                                                               두 변량 x, y에 대하여 x의
                 표는 어느 학급의 학생 40명의 중간고사와 기말고사의 수학 성적을 나타낸 것이다.                                 변화와 y의 변화 사이에 어
                                                                                               떤 관계가 있을 때, 이러한
                  A                B  A             B  A              B  A             B       관계를 상관관계라 하고, 두
                   번호    중간    기말    번호    중간   기말     번호   중간    기말    번호    중간    기말
                                                                                               변량 x, y 사이에는 상관관
                    1     53   48     11   35    27    21    48    57    31   66    75
                                                                                               계가 있다고 한다.
                    2     41   46     12   75    45    22    65    80    32   84    92
                    3     78   72     13   77    67    23    78    72    33   82    98
                    4     64   52     14   32    38    24    73    89    34   57    61
                    5     68   74     15   47    39    25    92    93    35   52    56
                    6     39   41     16   60    52    26    62    95    36   67    92
                    7     59   53     17   65    75    27    95    87    37   50    45
                    8     70   81     18   62    60    28    42    61    38   62    69
                    9     89   94     19   49    54    29    55    76    39   83    85
                    10    69   73     20   79    64    30    63    80    40   94    96



                 표에서 중간고사 수학 성적을 x, 기말고사 수학 성적을 y라 하고, 공학적 도구를 이
               용하여 두 변량 x, y의 순서쌍 (x, y)를 산점도로 나타내면 [그림 Ⅲ-3]과 같다. 두 변

               량 x, y 사이에는 양의 상관관계가 있음을 알 수 있다.
                                                                                               상관관계의 분류
                 또 [그림 Ⅲ-4]와 같이 산점도의 점들이 밀집되어 있는 부분을 통과하는 직선이 나
                                                                                               ① 양의 상관관계: 두 변량
                                                                                                 x, y 사이에 x의 값이 커
               타나고, 이 직선의 방정식은 일차함수 y=0.9133x+8.9204로 표시된다.
                                                                                                 짐에 따라 y의 값도 대체
                                                                                                 로 커지는 관계
                 기말고사                                  기말고사  100           y=0.9133x+8.9204    ② 음의 상관관계: 두 변량
                  100                                                                            x, y 사이에 x의 값이 커
                                                                           A
                                                         80
                   80               A                    76                                      짐에 따라 y의 값은 대체
                 ( 점수                                 ( 점수                                       로 작아지는 관계
                   60                                    60
                                                                                               ③ 상관관계가 없다: 두 변
                                                         40
                                                      )
                   40                                                                            량 x, y 사이에 x의 값
                 )
                   20                                    20                                      이 커짐에 따라 y의 값이
                                                                                                 커지는지 작아지는지 분
                   0      20    40    60    80   100     0      20    40   55 60  80   100       명하지 않은 관계
                                           중간고사(점수)                             중간고사(점수)
                              [그림 Ⅲ-3]                              [그림 Ⅲ-4]

                 한편 [그림 Ⅲ-4]의 한 점 A는 중간고사 수학 성적이 55점, 기말고사 수학 성적이

               76점이다. x=55를 일차함수 f(x)=0.9133x+8.9204에 대입하면

                                    f(55)=0.9133×55+8.9204=59.1519

               이다. 여기에서 함숫값 f(55)=59.1519를 예측값이라 하고 실제 기말고사 수학 성적

               인 76을 측정값이라 한다. 예측값과 측정값의 차이를 오차라고 한다.



                                                                                                2. 경향성과 예측   99
   96   97   98   99   100   101   102   103   104   105   106