통계는 집단현상을 구체적인 수치로 반영해 나타내는 숫자다. 사회집단과 자연집단을 가리지 않고 통계를 들여다보면 일정 부분 해당 집단에 대한 이해가 가능해진다.
하지만, 이 같은 통계는 늘 함정을 지닌다. 가짜 통계를 통한 집단 현상의 왜곡 위험이 언제나 도사리고 있어서다. 영국의 정치가 벤저민 디즈레일리 역시 “거짓말에는 세 가지가 있다. 그럴듯한 거짓말, 새빨간 거짓말, 그리고 통계다”라는 말로 통계의 함정을 경고했다.
통계가 거짓말 소리를 듣게 된 건 결국 통계를 만드는 이나 해석하는 이의 잘못 때문이다.
먼저 너무 적은 표본을 설정하는 경우가 그렇다. 직장동료 중 20대 직원 4명에게 민트초코를 좋아하는지 물었는데, 3명이 좋아한다고 답한 상황을 가정하자. 이때 ‘20대 75%, 민트초코 좋아해’라는 통계를 낸다면, 이는 신뢰할 수 있는 통계일까. 더 나아가 ‘20대 10명 중 7명 이상 민트초코 좋아해’라고 한다면, 실제 조사 결과이긴 하지만, 옳은 통계는 아닐 것이다.
잘못된 조사 방법 역시 그렇다. 예를 들어 직원들이 한곳에 모인 상태에서 ‘직장상사가 너무 싫은 사람’에게 손을 들라고 한다면 어떨까. 실제로 너무 싫을 수 있지만, 모두가 보는 앞에서 손을 드는 이는 그리 많지 않을 것이다. 그렇다고 이렇게 수집한 통계를 근거로 ‘우리 회사는 모두가 직장상사를 좋아한다’는 해석을 낼 수 있을까. 당연히 아니다.
우리는 이제 곧 몰아치는 통계의 함정을 만날 수밖에 없다. 선거는 통계를 활용해 현상을 진단하는 대표적인 제도이기 때문이다. 통계의 함정에 빠지지 않으려면 앞선 두 사례처럼 어떻게, 얼마나, 누구를 대상으로 조사했는지를 눈여겨볼 필요가 있다. ‘n명 중 n명 이렇다’는 한 마디에 현혹돼선 안 된다.
받아들이는 사람 만큼 조사하는 사람들의 변화도 필요하다. 그들이 공정한 시선으로 표본을 설정해 질의하지 않는 한, 우리 사회는 통계의 함정만 존재할 뿐 진정한 집단 현상의 진단을 이룰 수 없다.
김경희 인천본사 사회부장
로그인 후 이용해 주세요