작성일 : 18-03-26 11:09
[N.Learning] 통계학의 계보
 글쓴이 : 윤정구
조회 : 3,507  

<철학으로서의 통계학>
 

 김재광교수

 아이오와 주립대 교수


1. "왜 통계학은 영국에서 시작되었을까요?" 이런 생각을 해 보셨는지요? 통계학은 지금으로부터 약 100여년 전에 Karl Pearson 과 RA Fisher 라는 두 영국인에 의해 정립되기 시작한 도구 학문입니다. 그 학문적 뿌리를 거슬러 올라가면 결국 만나는 사람은 경험주의 철학자 프란시스 베이컨입니다. 경험주의(empiricism)는 감각의 경험을 통해 얻은 증거들로부터 비롯된 지식을 강조하는 이론입니다. 감각 경험이란 결국 현실 데이터를 지칭합니다.

2. 철학사에서 중세를 벋어나 근대를 여는데는 베이컨과 데카르트의 활약이 큽니다. 베이컨은 경험주의를 창시했고 이는 귀납적 사고를 중시합니다. 반면 데카르트는 합리주의를 창시했고 이는 연역적 사고를 중시합니다. 이전 중세에는 권위와 전통에 기대어 지식을 알려고 했다고 하면 근대에서는 권위와 전통을 부정하고 오로지 경험과 이성을 통해서 새롭게 지식 체계를 세우고자 합니다. 종교의 영향력에서 벋어나 기존의 지식을 의심하고 참된 지식을 세우려는 노력에서 필요한 도구는 결국 경험(데이터)와 이성(논리)라는 것입니다.

3. 베이컨으로 시작된 경험주의는 영국에서 계속 발전되어서 존 로크, 조지 버클리, 데이비드 흄으로 발전됩니다. 그들은 모든 올바른 지식은 감각적 경험으로 유래된다는 견해를 가졌는데요 이러한 경험주의의 단점은 자칫하면 회의주의에 빠진다는 것입니다. 왜냐하면 지식이 데이터로부터 얻어진다는 것은 인정하지만 우리는 모든 데이터를 다 관측할수 없기에 그 지식을 결코 확신할수 없다는 난관에 부딪히고 따라서 그런 확신하지 못하는 지식을 얼마나 신뢰할수 있겠느냐는 문제가 생깁니다.

4. 이런 문제를 수리적인 방법으로 해결한 것이 결국 통계학입니다. 통계학은 제한된 관측으로 얻어지는 결론에 대한 확실성의 정도를 확률이라는 개념으로 설명해 냅니다. 그리고 그 확률이라는 것을 계산하는 과정에서 수리적 논리를 부여하여 보편성을 획득합니다. 따라서 경험주의자 입장에서는 100% 확신하는 지식은 없을수 있지만 통계학을 사용해서 어떤 지식이 상대적으로 더 확실한 것인지에 대해 합리적인 진술을 할수 있게 됩니다. 그래서 통계학은 경험주의의 한계를 극복하고자 하는 인간 지성사의 커다란 선물인 것입니다.

5. 통계학이 과학의 방법론이긴 하지만 통계학을 사용했다고 해서 그 결론이 다 타당하거나 과학적인 것은 아닙니다. 왜냐하면 주어진 데이터가 증거로써 능력을 가지는 확률을 통계학을 사용하여 계산하기 위해서는 두가지 중요한 전제가 있는데 그 전제를 만족하는지를 확인하는 것이 통계학 실력에 좌우되기 때문입니다.

6. 첫번째 전제는 데이터의 적절성입니다. 적절성이라는 것은 데이터의 질적 지표인 대표성(representativeness), 타당성(validity)과 신뢰성(reliablity)를 포함하는 개념인데요 양질의 데이터를 수집하는 것은 전문성과 함께 비용을 수반합니다. 그런 양질의 데이터를 얻기가 힘들다면 적어도 사용하고자 하는 데이터의 증거 적절성 여부를 우선 판단해야 하는데 초보자들은 이에 대해 어려움을 겪거나 아예 그 문제 자체를 인지하지 못합니다. 데이터의 적절성을 판단하는 것은 법정에서 증거가 제시되었을때 그것을 증거로 채택할 것인지 아닌지를 먼저 판단하는 것과 비슷한 것입니다.

7. 두번째 전제는 모델의 적절성입니다. 첫번째 전제를 통과한 데이터를 사용하여 확률을 계산하기 위해서는 사용하고자 하는 확률 모형의 적절성이 또한 전제가 되어야 합니다. 모형은 현실에 대한 이해의 틀이고 모형의 적절성은 결국 그 모형이 데이터의 현실을 얼마나 잘 반영하느냐에 따라 판단되어질수 있는데 이는 자료의 구조를 이해하여하 함을 의미합니다. 자료가 범주형인지 연속형인지, 시계열 자료인지, 공간자료인지, 계층적 구조를 가진 것인지 아닌지 이러한 정보들은 자료의 구조에 대한 이해를 전제로 하고 이것은 모형의 적절성을 결정합니다. 현실(데이터의 구조)를 제대로 반영하는 모형을 사용할수록 그로부터 얻어지는 결론의 정확성은 높아질 것입니다.

8. 이러한 두가지 전제를 만족하여 얻어진 통계학적 결론은 상당한 수준의 과학적 근거를 가지게 됩니다. 하지만 단지 통계학을 사용했다고 다 같은 수준의 과학적 근거를 갖는다고 믿는다면 그것은 중세 시대의 종교적 믿음과 별반 다를바 없는 것입니다. 근대의 시작은 자신의 믿음의 근거를 의심하는데서 시작됩니다. 그래서 각자가 깨아나야 하는 것입니다.