당첨제비는 몇번째 뽑는 것이 유리한가?
사람들은 확률에 대해 잘 알고 있다고 생각한다. 선택의 기로에서 자신에게 확률적으로 가장 유리한 판단을 내리고 그 판단에 큰 오류가 없다고 생각하는 것이다. 하지만 확률적 판단을 내림에 있어 섣부른 접근은 금물이다. 실제 많은 사람들은 확률을 정확하게 이해하지 못하고 있으며 따라서‘합리적 선택’을 내리지 못하는 경우가 많다. 특히 여러 사안이 서로 연결되어 있는 경우에 더욱 그렇다.
[가]인간을 움직이는 키워드에 ‘도박사의 오류(gambler’s error)’라는 게 있다.‘ 그동안 계속 잃었으니 이번엔 딸 것이 확실하다’고 생각하는 것이다. 하지만 평소 승률이 50%라면 100번을 연이어 진후라도, 101번째 이길 확률은 여전히 50%다.
야구에서 3할대의 타자가 2번 연속 출루에 실패하고 3번째 타석에 섰을때 “이번엔 안타를 칠 확률이 거의 확실하니 투수가 조심해야”라고 말하는 것은, 그가 지난번 타석에서 안타를 쳤다는 이유로 “이번과 다음엔 아웃될 것이 확실하니 투수는 아무 공이나 던져도 된다”고 말하는 것과 같다.
1차 세계대전시절 ‘적의 포격으로 막 생긴 웅덩이에 뛰어들면 안전하다’는 교육을 실시했다. 탱크나 군함에서 포격을 할 경우, 포신을 고정하고 계속 쏴대는 것보다 사각착지를 목표로 발사하는 것이 효과적이라는 적의 의도를 역이용한 합리적 판단이다. 하지만 포신이 여러 개이거나, 항공기 융단폭격의 경우엔 아무런 의미가 없다.
첫 폭탄을 피한 병사가 웅덩이에 들어가 숨거나 그 자리에 그냥 있거나 다음 폭탄을 맞을 확률은 똑같다. ‘도박사의 오류’는 결국 과거의 결과가 미래의 예측과 연관이 있느냐 단절돼 있느냐의 문제다.-2007. 3. 15 한국일보 중
[나] A 백화점은 사은행사로 당첨자에게 해외여행의 특전이 주어지는 제비뽑기를 시행하기로 했다. 제비는 총 5개이며 이중 당첨제비는 1개다. A 백화점은 제비를 뽑을 5명의 고객을 선정했다. 이중 한명이 바로 당신이라면 제비를 가장 먼저 뽑을 것인가? 아니면 가장 마지막에 뽑을 것인가? 순서대로 뽑는 것인 만큼 순서에 따라 확률이 달라질 것이라 생각하기 쉽다. 다른 이가 먼저 뽑아 당첨되면 자신은 뽑을 기회조차 얻지 못하게 된다고 생각하는 사람도 있다. 또한 만일 앞에서 뽑기를 시행한 사람들이 당첨되지 않으면 자신의 당첨확률이 높아진다고 생각하는 사람도 있다. 이처럼 많은 사람들은 막상 뽑는 순간이 되면 어느 순서에 뽑는 것이 유리한지 혼돈스러워한다. 하지만 어느 순서에 뽑든 당첨될 확률은 동일하다.
[ 문제 ]
제시문들을 참고하여 제시문 [나]의 상황에서 어느 순서에 뽑든 왜 동일한 확률이 나타나는지 설명하고 사람들이 순서에 따라 확률이 달라질 것이라고 잘못 생각하는 이유가 무엇인지 설명하시오.
▲동일한 확률이 나타나는 이유
여러분이라면 몇번째 순서에 제비를 뽑겠습니까? 막상 제비를 뽑아야 하는 상황이 닥치면 이런 고민이 들겁니다. 하지만 어떤 순서에 뽑든 1/5의 확률을 가지게 될 것이라는 점은 쉽게 생각할 수 있죠. 이 경우는 다섯 명이 동시에 제비를 뽑는 경우와 크게 다르지 않기 때문이에요. 또한 제비를 뽑아야 하는 사람들이 눈을 가리고 순서대로 모두 뽑은 후 동시에 결과를 공개하는 방식이라면 동일한 확률일 것이라는 점을 쉽게 생각할 수 있지요.
순차적으로 뽑는다고 해서 자칫 달리 생각할 가능성이 있지만 고등학교 수학에서 배우는 조건부확률 개념을 생각하면 쉽게 접근할 수 있어요. 만일 여러분이 두 번째로 제비를 뽑는다고 가정해봅시다. 맨 처음 뽑은 사람이 당첨되지 않았다면 여러분은 남은 네개의 제비중 하나의 당첨제비를 고를 수 있는 만큼 1/4의 확률을 가지게 돼요. 20%의 확률에서 25%의 확률로 당첨가능성이 높아지는 거죠. 하지만 이는 맨 처음 뽑은 사람이 당첨되지 않았다는 점을 확인한 후에나 생기는 결론이죠. 맨처음 뽑은 사람이 당첨제비를 뽑았다면 여러분은 뽑을 기회조차 얻지 못하고 탈락해요. 즉 순서대로 제비를 뽑을 경우 앞에서 뽑은 결과가 어떠한지가 중요한 변수로 작용하는 거예요. 몇 번째로 뽑든 앞에서의 당첨 여부 결과를 고려해야 하고 그러한 방식으로 생각할 때 모두 동일한 확률을 가지게 된다는 점을 다음과 같이 알 수 있어요.
첫번째로 뽑는 사람의 확률은 다섯개의 제비중 하나의 당첨제비를 노리는 것이니 당연히 1/5의 확률을 갖게 되죠. 이어 두번째 제비를 뽑는 사람이 당첨되려면 처음 사람이 당첨제비를 뽑지 못한 후에 자신이 당첨제비를 뽑아야 해요. 이를 수학적으로 표현해보면 4/5×1/4=1/5이 되죠. 세 번째 사람이 당첨될 확률 역시 4/5×3/4×1/3=1/5로 동일해요. 마지막 사람도 결국 1/5의 당첨확률을 가지게 되는 거죠. 먼저 뽑거나 나중에 뽑는다고 불리하거나 유리하다고 볼 수 없어요.
▲사람들이 착각하는 이유
이처럼 조건부확률 개념을 통해 살펴보면 당첨제비의 순서는 당첨될 확률에 아무런 영향을 미치지 못한다는 점을 알 수 있어요. 조건부확률이란 사건 A가 일어났다는 제약 아래 사건 B가 일어나는 확률을 말해요. 이때 사건 A와 사건 B는 결과에 서로 연관성이 뚜렷해야 하죠. 두 사건의 연관이 없고 그 결과가 있어서 영향을 미치지 못한다면 조건부 확률로 따질 필요가 없어요.
제시문 [나]의 상황은 먼저 제비를 뽑는 사람의 결과가 이후 뽑는 사람에게 영향을 주는 만큼 애초 확률 계산시 앞에서 뽑는 사람들의 경우를 고려해야 하는 상황이에요. 그 때문에 조건부확률의 개념을 활용해 앞선 사람들이 당첨되지 않을 확률까지 고려해야 해요. 반면 제시문 [가]에 언급된 ‘도박사의 오류’는 서로 연관이 없는 전후상황을 연관이 있는 것처럼 생각해서 발생하는 오류예요.
즉 사람들이 확률을 계산할 때 오류를 범하는 이유는 대개 과거의 결과가 미래의 예측에 영향을 주는 사안인지, 단절되어 있는 사안인지를 정확히 파악하지 못하기 때문에 발생하죠. 사건 A와 사건 B가 연속적으로 발생하더라도 앞선 결과가 이후에 영향을 미치는 상황인지 아닌지를 따져 조건부확률 개념을 활용할지, 독립적으로 계산할지를 따져야 해요.
▲HIV 양성 판결을 받은 자가 HIV 보균자일 확률은?
올해 실시한 서울대 논술 모의고사의 인문계열 문제 중에서도 이러한 조건부확률 개념을 묻는 문제가 출제된 바 있어요. 조건부확률 개념을 정확하게 이해하고 있는지, 이를 생활 속에서 접목한 상황을 정확하게 해석할 수 있는지에 대한 물음이었죠.
문제는 에이즈 바이러스(HIV) 발병률이 0.1%라 전제하고 어떤 사람의 검사 결과가 양성으로 나왔을 때 이 사람이 보균자일 확률을 물었어요. 단, 이 검사는 정확하지 않아 HIV 보균자일 경우100% 양성으로 나오지만 HIV 비보균자인 경우에도 양성으로 나올 확률이 5%나 되는 경우죠. 사람들은 대개 이 사람이 보균자일 확률이 95%에 달할 것이라 착각하곤 해요. 비보균자인데 양성으로 나올 확률 5%를 전체 100%에서 단순히 빼는 방식을 택한 거죠. 하지만 이 사람이 보균자일 확률은 2% 이하에 불과해요. 왜 그런지 살펴보죠.
먼저 전제 인구가 10,000명이라고 가정해봅시다. 10,000명 중 HIV 바이러스 보균자가 될 확률이 0.1%니 HIV 보균자는 10명이겠네요. 비보균자는 9990명이구요. HIV 보균자 10명이 검사를 받으면 모두 보균자로 진단을 받을 것이고 9990명 중 5%는 비보균자이면서도 양성판정을 받을 거예요. 즉 499.5명(사람을 소수점으로 표현할 수 없으나 확률 계산을 위해 그대로 두면)은 잘못된 양성 판정을 받겠죠. 결국 10,000명 중 양성 판정을 받는 사람은 총 10+499.5=509.5명이고 문제의 어떤 사람 역시 이 중 한 사람일 거예요. 그렇다면 문제의 어떤 사람이 실제 보균자일 확률은 10/509.5≒0.0196으로 2% 이하에 불과해요. 이처럼 HIV 보균자가 전체 인구중에서 어느 정도로 나타나는지에 대한 전제를 감안하지 않을 경우 그 판단에 있어 95%와 2% 이하라는 큰 차이를 낳게 되죠./조성진 유레카논술 책임연구
로그인 후 이용해 주세요