투 바이 투 테이블

최근 고속도로를 달리다가 전광판에 이런 말이 표시되어 있는 것을 보았다. 그 것도 여러번. 그 말은 이런 것이었다. “교통사고 사망자 50% 안전띠 미착용”. 물론 나는 운전을 하고 있었고, 그 전광판의 사진을 찍는 것은 안전벨트를 매지 않는 것보다 훨씬 위험한 일이므로 사진을 보여 줄 수는 없다.

아마도 이런 데이터를 보여주는 이유는 교통사고 사망자 중 안전벨트를 안 맨 사람이 50%나 되니, 교통사고가 나도 죽지 않으려면 안전벨트를 매는 것이 좋다는 것을 강조하기 위해서일거다. 그런데 가만히 생각해보면 이 말은 그런 의미가 전혀 없다. 이 것을 표로 나타내면 이렇게 된다.

이 표를 보고 안전벨트를 매지 않으면 교통사고가 났을 때 죽을 위험이 더 높아진다고 말할 수 있을까? 우리가 교통사고 사망자 뿐만 아니라 생존자의 안전벨트 사용 여부를 안다고 가정하고 위 표에 생존자의 데이터를 한 줄 더 추가해 보자. 물론 고속도로에서 일어나는 실제 상황은 아래 표와는 다를 것이다.

위 표처럼 만약 생존자가 안전벨트를 사용한 분율이 사망자와 같다면 어떨까? 안전벨트를 매지 않는 것이 교통사고가 났을 때 사망의 위험을 높이는 것일까?

표에 한 줄을 더 붙여서 안전벨트 사용 여부에 따른 사망자의 분율을 표시해 보면 아래와 같다.

어떤가? 50:50. 안전벨트를 사용하나 사용하지 않으나 사망자의 분율은 같다. 어쩌면 실제의 데이터는 아래와 같을지도 모른다.

이 표를 바탕으로 결론을 낸다면 어떤가? 안전벨트를 매지 않는 것이 교통사고에서 살아남는데 더 도움이 될지도 모른다!

물론 마지막 표는 사실과 일치할 확률이 1% 이하일 것이 확실하다. 그러나 뒤에 우리가 만들어 붙인 자료에 따라 첫 줄의 자료와 함께 도출해 낼 수 있는 결론이 완전히 달라진다는 것은 명확하다. 즉, 처음에 덧붙인 교통사고 생존자에 대한 자료가 없다면 안전벨트를 매는 것이 교통사고 시 생존에 도움이 되는지, 사망의 위험을 높이는지 알 수 없다는 것이다.

우리는 뉴스나 고속도로의 전광판에서 이런 자료를 종종 접하게 된다. 특정 자료를 바탕으로 인과관계에 대한 결론을 이끌어 내거나 암시하는 경우에 방금 우리가 만든 것 같은 표를 만들어 보는 것이 실제 그러한 관계가 있는지 확인하는 데 도움이 된다. 만약 그 표가 처음의 표처럼 하나의 열을 가진다면, 그 뉴스나 전광판의 글이 제시하는 결론은 사실과 다를 수 있다는 것을 기억하자.