"거짓말에는 세 가지 종류가 있다. 거짓말, 새빨간 거짓말, 그리고 통계”. 영국 빅토리아 시대의 정치가 벤자민 디즈레일리의 이 말은 통계의 과학적 허구성을 꼬집을 때 자주 인용된다. 통계의 오류와 착시에 대한 지적이다. <벌거벗은 통계>의 저자 발터 크래머는 “많은 사람들이 진실을 밝히기 위해서가 아니라 자신의 주장을 뒷받침하려는 목적으로 통계를 들먹인다”고 말했다.

의도된 통계는 다양한 대푯값을 만들어낸다. 많은 사람들이 ‘평균’이라면 산술평균을 떠올리지만 통계학에서 기하평균, 중앙값, 최빈값 등 대푯값을 정하는 방식이 다양하다. 가령 노조와 사측의 임금 협상 때 사측은 임원의 연봉까지 포함된 평균값을 임금 평균으로 주장하고(산술평균), 노조는 가장 많은 수의 직원들이 받는 연봉을 평균 임금이라고 주장한다(중앙값).
:
:
:
왜곡된 수치의 함정에서 벗어나야
통계에 관한 베스트 셀러 <새빨간 거짓말, 통계>의 저자 대럴 허프는 “통계야말로 도저히 믿을 수 없는, 절대 쉽게 믿어선 안 되는 거짓말 중의 거짓말”이라고 했다. 사람들을 선동하기 위해, 혹은 혼란스럽게 하기 위해 없는 사실을 부풀리고, 있는 사실을 은폐하는 수법 등으로 혹세무민하는 가장 좋은 방법이 바로 통계라는 주장이다. 그게 가능한 이유는 자세히 들여다보지 않으면 쉽게 파악할 수 없는 트릭이 곳곳에 숨어 있는 데다 증거와 근거를 중시하는 현대사회가 너무 쉽게 신뢰를 주었기 때문이라는 설명이다.

통계는 경제뿐 아니라 정치·사회·문화 등 온갖 곳에서 널리 사용되고 있다. 그리고 사람들의 행동양태에 일정 정도 영향을 주고 있다. 독자들은 신문에 실린 주식 폭등 그래프를 보고 쌈짓돈을 만지작거리고, 유권자들은 사표방지 심리 때문에 여론조사에서 당선권으로 나타난 정당후보에게 투표를 하게 된다. ‘1인당 국민소득이 2만달러’라는 산술평균값에 현혹돼 주위의 가난한 사람들을 놓치게 된다.

<괴짜 통계학>의 저자 김진호씨는 “통계에서 과장된 수치의 음모를 판별할 수 있는 힘을 길러야 한다”고 강조했다. “보고 싶은 것만 보고 듣고 싶은 것만 들으려는 사람들의 자세가 결국은 ‘음험한’ 통계 남용 세력의 온상이 되고 있다”며 “통계의 마술보다 더 나쁜 것은 이런 왜곡된 수치를 들이대면서 평균을 강요하는 사회”라고 말했다. 숫자는 거짓말을 않지만 거짓말쟁이들은 숫자를 이용하고자 늘 궁리한다는 지적이다.
:
:
:
빠지기 쉬운 통계의 함정
승객이 이동한 100억㎞당 사망자는 철도의 경우 9명이고 비행기는 3명이다. 그렇다면 비행기가 더 안전할까? 기준을 거리가 아닌 시간으로 바꿔 놓고 보면 승객이 타고 보낸 1억 시간당 사망자는 철도 7명, 비행기 24명이다. 결국 숫자가 사람의 눈과 머릿속에서 장난을 친 셈이다.

통계엔 산술적 평균, 평균값의 함정이 존재한다. 농부 1명이 소 40마리를 가지고 있고, 농부 9명은 소 ‘0마리’를 가지고 있다면? 통계에서 나타나는 최빈값은 ‘0마리’이고 중간값도 ‘0마리’인데, 산술평균은 4마리나 된다. 산술평균 4마리는 흔히 인용되는 숫자이지만 이것이 의미있는 실체적 진실인가에는 의구심이 든다. 산술평균은 심각한 불평등을 은폐시키는 도구로 악용될 수 있기 때문이다. 1인당 국민소득의 규모로 전 세계 국가를 줄 세우기 하는 ‘국민총생산(GDP)의 신화’가 평균값의 대표적인 함정이다.

구체적인 숫자가 나열되어 있다고 확실하게 믿을 만한가? 성경에서 아담은 930살, 그의 아들 셋은 912살까지 살았다고 써 있다. <벌거벗은 통계>의 저자 발터 크래머는 “정교한 수치가 진실이라는 환상 때문에, 또한 두루뭉술하면 성의 없다고 느낄 것이라는 우려가 겹쳐져 나타난 숫자”라고 설명한다. 심지어 영국의 신학자는 천지창조의 시점을 ‘기원전 4004년 10월 21일 일요일 오전 9시’라고 정밀하게 계산해내기도 했다.

똑같은 사실도 발표자의 의도나 관점에 따라 조작될 수 있다. ‘오늘날 전기 이용이 가능한 미국 농가는 전체 농가의 4분의 3 이상입니다’. 1948년 미국의 전기회사들이 합동으로 게재한 이 신문광고는 ‘오늘날 전기 이용이 불가능한 미국 농가는 전체의 4분의 1이나 됩니다’라는 문구로 바꿀 수 있다. 더욱이 ‘이용 가능(available)’이란 애매한 표현은 도로에서 10㎞ 가량 떨어진 곳의 농가까지 포함시키기 위한 문구였다.

표본조사가 잘못될 경우 통계 자체가 완전히 틀릴 수 있다. 1936년 미국 대통령 선거에서 ‘리터러리 다이제스트’는 1000만명, 갤럽은 단지 5만명의 표본으로 조사해 다이제스트는 공화당 후보가, 갤럽은 민주당 후보가 당선될 것을 예측했다. 결과는 갤럽의 승리였고, ‘뉴딜’로 유명한 루스벨트가 대통령이 됐다. 다이제스트의 표본은 일반인들이 아니라, 정기구독자들로, 자동차·사교클럽 소속 등 친공화당 사람들이었다. 응답자의 성향도 통계의 주요한 요인이다. 영국 여성은 평생 동안 2.9명의 남자와 섹스를 하는 반면 영국 남성은 여성파트너가 11명이나 된다는 설문조사 결과. 이는 여성은 성문제와 관련해 내숭을 떨고 남자들은 자신의 남성성을 강조하기 때문이다. 양쪽 모두 축소했거나 부풀렸을 가능성이 있다.

국내에서도 이 같은 통계의 함정은 곳곳에 존재한다. 특히 4대강 사업은 그 효과를 부풀려 비용 증가를 합리화하려는 의도가 강하다. 정부는 4대강 살리기 사업이 녹색뉴딜 사업으로 지역경제 활성화를 견인할 것이라고 설명하면서 구체적으로 34만명의 일자리가 창출되고, 40조원에 이르는 생산유발 효과로 실물경기 회복에 기여할 것이라고 주장하고 있다.

그러나 정작 구체적인 경기활성화의 근거는 제시하지 못하고 있다는 지적이다. 우선 34만명의 일자리 창출과 40조원에 달한다는 생산유발 효과만 해도 정교하지 못한 연구 결과를 그대로 보여주고 있다. 정부가 4대강 살리기 사업의 생산유발 효과를 분석하면서 적용한 것은 한국은행의 ‘2006년 산업연관표’. 10억원을 투입할 때 17.3개의 일자리가 나오고, 투입 비용의 2.04배 가량 생산유발 효과가 나온다는 식으로 정부가 밝힌 본사업비와 직접연계사업비 중 순수 공사비 19조4000억원에 17.3과 2.04를 곱하면 34만명의 일자리와 40조원의 생산유발 효과가 나오게 된다는 결론이다.

그러나 전문가들 사이에선 “4대강 사업은 하천 정비 등 대규모 토목공사가 주를 이루고 있고, 토목공사는 대형 기계 장비가 투입될 수밖에 없어 일률적으로 취업유발계수를 적용하는 것은 무리”라는 지적이 끊이지 않고 있다. 결국 정부는 마스터플랜 최종안에 국책연구기관인 건설기술연구원이 진행했던 경제적 효과 산출 연구 결과를 넣지 않는 것으로 논란을 피해가려 했다.

전문가들은 통계에 대해 ▲누가 발표했는가 ▲어떤 방법으로 조사했는가 ▲숨겨진 데이터는 없는가 ▲상식적으로 말이 되는 내용인가를 주의깊게 살펴야 한다고 조언한다. 또한 그래프를 볼 때 가파른 화살표나 등락만 살펴보지 말고, 가로축과 세로축의 단위를 살펴볼 필요가 있다는 지적이다. 그래프의 세로축이 ‘0’부터 시작된 것인지 아니면 뚝 잘라내서 가파른 기울기를 의도적으로 만들어낸 것인지를 살펴봐야 한다는 것. 가로축도 마찬가지다. 가로축이 좁을수록 그래프는 가파르게 된다. 특히 주식시장에서 가파른 그래프란 주식가격의 폭등이나 폭락을 의미하는데, 투자자들을 정신적 공황상태로 몰아가는 나쁜 그래프가 된다.

<출처: weekly경향 http://weekly.khan.co.kr/khnm.html?mode=view&dept=114&art_id=201009151423451>
이올린에 북마크하기(0) 이올린에 추천하기(0)
2010/09/25 01:28 2010/09/25 01:28

Trackback Address >> http://www.hyosunny.com/trackback/352

댓글을 달아 주세요