The Difference Trend
복잡한 세상, 통계로 풀기
‘이건 내가 100% 확신하는데’라는 표현을 통계학적으로 해석하면 ‘완벽한 필연’으로서 무조건 발생함을 전제하는 경우다. '네 얘기는 1%밖에 못 믿겠다'는 것은 ‘네 얘기’는 우연일 가능성이 매우 높음으로 믿을 수 없다는 것을 강조하는 경우다.
필자의 경험으로 유추해 보건대, '철학(哲學, Philosophy)’과‘ 통계(統計, Statistics)’는 크게 두 가지 공통점이 있는 듯하다. 하나는 ‘생각만으로도 머리가 지끈지끈할 정도로 어렵게 느껴진다는’ 것이고, 다른 하나는 ‘두 학문 모두 세상을 사는 데 큰 도움이 된다는’ 것이다. 어려운데, 세상에 큰 도움이 되는 학문’이라니 아이러니컬하지 않은가! 그렇다면 ‘왜 철학과 통계는 어렵게만 느껴지고, 왜 세상을 사는데 큰 도움이 되는가?’
먼저 어렵게 느껴지는 건‘ 두 학문을 연구하는 학자와 일반인 간의 원활한소 ’통‘이 이뤄지지 않아서인것 같다. 철학 관련 도서를 펼쳐보면 ‘존재·현상·타자·능기·소기·시니피앙·변증·실증’과 같은 도대체 무슨 뜻인지도 모르는 단어와 표현들이 가득 차 있다. 통계 관련 도서도 별반 다르지 않다 '모집단·표본·표준편차(오차)·분산·변량·회귀분석·경로분석….’ 상황이 이렇다 보니 취업전선에 뛰어들어야 할 대학생들이나 당장의 생계를 걱정해야 하는 일반인들‘이 어렵게 느껴지고 취업이나 생계에 별 도움이 되지 않을 것 같은 ’이 두 학문들을 외면해 버리는 것은 당연한 결과일지도 모르겠다.
그러나 이 두 학문만큼 이 세상을 살아가는 데 필요한 지식과 지혜를 제공해 주는 학문도 그리 많지는 않은 것 같다. 철학은 세상을 이해하고 해석하는 다양한 관점과 틀을 제공해 주고, 통계는 보다 체계적이며 과학적인 방법으로 우리가 살고 있는 이 세상을 객관적이며 논리적으로 이해 ·해석할 수 있는 도구와 정보를 제공해 준다. 다시 말해 이 두 학문은 세상과 합목적적(合目的的)으로 소통할 수 있는 사고틀과 더불어 합리적 사고를 가능케 하는 과학적 도구와 재료를 제공해 준다고 볼 수 있다. 그러므로 이 두 학문은 우리의 생활과 가장 밀접한 학문으로 간주할 수 있다. 세상과 원활한 소통을 가능케 해주는 철학과 통계. 이 가운데 ‘소통의 도구’로서 통계가 갖는 의미에 대해 이야기를 나눠보자.
우연과 필연 간의 경계
사실 통계의 ‘통’자도 들어보지 못한 일반인들도 실은 늘 통계를 사용하며, 의사결정을 내려야 하는 경우에도 통계 지식을 사용하고 있다는 사실을 혹시 여러분은 알고 계신지.
세상은 수많은 ‘우연(Chance)’의 연속이다. 우연이 자주 일어나면 필연이 된다. 어떤 사건이나 사안이 반드시 일어날 필연이라고 믿는다면, 사람들은 굳건한 확신 속에서 의사를 결정하고 그 결정에 가장 부합하는 행동을 서슴없이 이행한다. 통계가 우리에게 중요한 이유는 통계가 우리 일상의 사건이나 사안에 대한 우연과 필연의 가능성을 과학적으로 결정해주며, 우리는 이 정보를 통해 미래를 보다 정확하게 예측할 수 있기 때문이다. 통계는 손실을 최소로, 반면 수익을 최대로 할 수 있는 과학적인 의사결정을 가능케 해준다.
생활 속의 통계 적용방식을 예로 들어보자. 우리는 종종 지인들에게 어떤 부탁을 해야 하는 상황에 직면한다.
이 때 부탁할 수 있는 지인이 2명 있다고 가정해 보자. A씨는 10번 부탁했을 때 9번 승낙한 분이고, B씨는 5번 부탁했을 때 1번 승낙한 분이라고 한다면 여러분은 누구에게 부탁할 것인가? 대부분은 매우 쉽게 결정을 내릴 것이다. 바로 ‘A씨’다. 이유는 간명하다. 10번을 부탁했을 때 A씨가 9번 승낙했으니 승낙 확률은 9/10=0.9, 즉 90%이다. 이 확률은 승낙이라는 사건을 일시적인 단순 우연으로 간주하기보다는 거의 필연에 가깝다는 판단을 내리게 해준다. 반면, B씨의 승낙 확률은 1/5=0.2, 즉 20%로서, B씨의 승낙 가능성은 단순한 우연에 머무르고 있다고 판단내릴 수 있다. 물론 맥락에 따라 A씨보다 B씨에게 부탁해야만 할 경우도 발생할 수 있겠지만….
일상생활에서 통계를 자주 적용하는 사례는 제품 구매에서도 쉽게 찾아볼 수 있다. ·옷라면·화장품·음료 등과 같은 일상생활용품을 구매할 때 상당수의 사람들은 매체를 통해 접하는 다양한 통계정보를 활용한다. 심지어 분기별 국가고객만족도 조사결과에 근거해 고객만족도가 지속적으로 가장 높게 나타난 특정 기업의 제품을 구매하려는 경향이 짙다는 것도 확인할 수 있다. 우연보다 필연에 가까운 통계정보를 더 신뢰함으로써 구매를 결정한다는 것이다.
볼링·골프·야구 등과 같은 스포츠에서는 선수의 경기능력을‘ 애버리지(Average)’로 평가한다. 애버리지, 즉 '평균’은 어떤 대상이나 사건의 가장 대표적인 속성을 나타내는 통계숫자이다. 따라서 평균은 우연보다 필연에 가까운 속성을 나타낸다고 볼 수 있다. 골프의 경우 애버리지가 80타일 경우 아마추어 리그에서는 준프로급 선수로 평가한다. 만일 100타 애버리지를 치는 선수가 어느 날 컨디션이 좋아 80타를 쳤다고 해서 그 선수를 80타 선수로 인정하지는 않는다. 왜냐하면 80타를 친 것은 우연에 가깝기 때문이다. 그러나 이 선수가 만일 지속적으로 80타 초중반을 계속 친다면, 그 선수는 80타 초중반을 치는 선수로 인정받을 것이다. 이 선수의 80타 초중반 경기능력은 우연이 아니라 필연에 가깝기 때문이다.
프로야구 연봉도 통계가 적용되는 대표적인 경우다. 구단과 선수 간 협상에서 최종 연봉을 결정하는 가장 중요한 기준은 아마도 그 선수의 특정 또는 일부 시즌 내 활약상보다는 프로야구 전체 시즌 내내 활약했던 평균적인 경기능력(타율·홈런·도루 등)일 것이다.
선수의 평균적인 경기능력은 우연이 아니라 필연에 가깝기 때문에 구단은 향후 그 선수의 성공 가능성을 보다 과학적으로 예측할 수 있고, 그 예측에 가장 합당한 투자를 할 것이다.
‘몇%’, 그 확률의 힘과 함정
설득을 해야 하거나 의사결정을 내려야 하는 순간에 사람들은 종종 ‘이건 내가 100% 확신하는데’, ‘이런 경우 내가 적어도 90%는 확신할 수 있어‘ ’네가 하는 얘기는 1%밖에 못 믿겠다’ 등과 같은 표현을 사용한다. 이 표현들은 무엇을 말하는 것일까?
먼저 ‘이건 내가 100% 확신하는데’라는 표현을 통계학적으로 해석하면 ‘완벽한 필연’으로서 무조건 발생함을 전제하는 경우다‘. 이런 경우 내가 적어도 90%는 확신할 수 있어'는, ‘이 경우'라는 사건이 100번 일어났을 때 내 이야기가 90번은 맞고 10번은 틀릴 수도 있다는 것을 함의한‘다네. 가 하는 얘기는 1%밖에 못 믿겠다’는 것은 99번은 틀리고 1번은 맞을 수도 있다는 것을 의미하는 것이다. 즉 '네가 하는 얘기’는 우연일 가능성이 매우 높음으로 믿을 수 없다는 것을 강조하는 경우다. 이처럼 우리는 특정한 숫·자수치를 사용해 자신이나 타인의 의견이 우연으로 또는 필연적으로 발생한다는 것을 강조하곤 한다.
그런데 통계 접목 표현과 관련해 주의 깊게 생각해야 할 점이 있다. 각 표현에서 '몇 %’라는 것은 말하는 사람이 과학적인 방법을 적용해 직접 확인 및 검증과정을 거친 것이 아니라, 각 개인의 주관적 판단 하에 지레짐작으로 추측한 숫자일 가능성이 높다는 점이다. 따라서 이 경우 말하는 사람이 '아무리 높은 퍼센트의 확신’을 갖고 주장하더라도 상대편은 말하는 사람의 확신에 대한 숫자를 곧이곧대로 믿지 않으려는 경우가 다반사일 것이다.
결국 설득에 성공하거나 가장 합리적인 의사결정을 내리기 위해서는 높은 공신력을 지닌 출처로부터 제공된 객관적 통계 수치를 제시하는 것이 관건이다.
빅데이터 시대에 생각해보는 ‘숫자의 마력’
통계자료 활용 가능성은 일상생활뿐만 아니라, 미래 부가가치 성장산업의 활로 개척으로도 이어질 전망이다.
단적인 예로 2010년대 들어 과거에 분석이 어려웠던 비정형 데이터인 '빅 데이터(Big Data)’에 대한 관심이 매우 높아지고 있다. 빅데이터 분석이 가능해지면서 기업뿐만 아니라 정부에서 큰 관심을 나타내고 있다. 실제로 채널it 방송은 지난해 3월 오바마 미 대통령이 의료·유전자·국방·교육·지질학·에너지 등 미래 주요 산업분야에 적극적으로 빅데이터를 활용하기 위해 2억 달러를 투자하여 '빅 데이터 R&D 이니셔티브’를 구축하기도 했다고 보도했다. 우리나라에서도 금융권 홍보, SNS 분석, 공공정책 수립 등에 빅데이터를 분석 및 활용함으로써 미래부가가치를 생산하려는 움직임이 나타나고 있다. 빅데이터 분석이 보다 쉽게 이뤄진다면 사회 전반에서 발생하고 있는 모든 영역에 관한 통계정보를 도출할 수 있으며, 이는 곧 기존 세상과는 또 다른 세상으로의 진입도 가능케 해줄 것으로 기대된다.
그러나 한번쯤 생각해볼 것이 있다. 통계학에서‘ 숫자가 갖는 마력’의 위험성을 종종 이야기하곤 한다. 이야기인즉, 일반인을 포함해 통계를 다루는 학자들도 숫자가 제시하는 정보에 대해 다소 맹신하는 경향이 있다는 것이다.
이는 곧 ‘숫자가 갖는 마력’을 알고 있는 사람들이 통계를 악의적 또는 사익 목적을 위해 사용할 경우 그 피해의 심각성이 치명적일 수 있다는 의미이다. 따라서 우리는 적어도 최소한의 기초적 통계지식을 지니고 있어야 할 필요성이 제기된다. '숫자의 마력’으로부터 자신을 방어하려면 말이다.
류 성 진 ㅣ 대구대 신문방송학과 교수
고려대 신문방송학과 졸업. 미국 오하이오주립대 커뮤니케이션 석·박사. 한국언론학보 편집위원, 한국소통학회 연구이사 역임. <커뮤니케이션 통계방법론(역서)> <커뮤니케이션 통계방법(저서)> 등.
'Archive > Webzine 2013' 카테고리의 다른 글
2013/11-12 : The Difference - Keyword : ‘THE STYLE’-영상으로 스타일을 이루다 (0) | 2013.12.05 |
---|---|
2013/11-12 : The Difference - Art : 꿈꾸는 자들의 초상 (0) | 2013.12.05 |
2013/09-10 : SEP/OCT 2013 HS Ad Webzine (0) | 2013.10.13 |
2013/09-10 : 다른X닮음 (0) | 2013.10.13 |
2013/09-10 : WiseBell - 太來飛賦 (0) | 2013.10.13 |