통계와 진실 사이

박진우 수원대 교수·통계대사
기자페이지

지난 2002년 12월17일 오후 6시 정각. 공중파 방송 3사는 그날 치러진 제16대 대통령선거 결과를 예측하는 방송을 내보냈다. KBS의 경우 노무현 후보 49.1%, 이회창 후보 46.8% 등으로 근소한 차이로 노무현 후보가 당선될 것이라고 예측했다.

다음날 개표가 끝나고 최종적으로 발표된 두 후보 득표율은 노무현 후보 48.9%, 이회창 후보 46.6%! 전날 발표된 예측 결과와 비교할 때 불과 0.2% 밖에 차이가 나지 않았다. 이 결과에 대해 사람들은 놀라워하며 과학적인 여론조사의 정확성 운운하며 각종 찬사를 아끼지 않았다.

이로부터 불과 1년 정도 지난 2004년 4월15일 오후 6시 정각. 방송 3사는 역시 제17대 국회의원 선거 결과를 예측하는 방송을 내보냈다.

여당인 열린우리당은 155~182석, 야당인 한나라당은 108~118석 등을 각각 득표할 것으로 내다 봤다.

그러나 개표 결과는 예측조사와 많이 달랐다. 과연 선거여론조사는 믿을 수 있는 것인가?

통계는 진실 그 자체가 아니라 진실에 대한 추측값이다. 일부 표본을 통해 전체 집단 특성을 추측하는 것이므로 통계에는 반드시 오차가 수반된다.

그러므로 통계를 접할 때에는 이에 따른 오차도 함께 감안하는 게 필요하다. 언론이 여론조사 결과를 발표할 때 오차 한계를 함께 발표하는 건 바로 이런 이유에서이다.

초접전지역에선 후보자들의 지지율 통계가 오차의 한계 내에서 근소한 차이를 보이는 것으로 나타나는데 이 경우 어느 후보가 우세하다고 단정할 경우, 오류를 범할 가능성이 높다. 따라서 이 경우에는 여론조사 결과를 갖고 섣불리 속단해선 안된다.

통계 자체가 거짓말하는 건 아니건만 통계에 담긴 오차를 무시해 버린 채 통계를 자기 입맛대로 사용하는 사람들 때문에 통계의 신뢰성이 도전을 받게 된다.

이제 지방선거가 2주일 앞으로 다가왔다. 통계의 오차를 도외시한 채 여론조사를 통해 접전지역 당선자를 함부로 예측하는 용감한 짓(?)들이 이번에는 사라지려나.

/박진우 수원대 교수·통계대사

© 경기일보(www.kyeonggi.com), 무단전재 및 수집, 재배포금지
댓글 댓글 운영규정