논문 읽을 때 몰랐던 통계, 이것만 알아도 다 해석할 수 있다.
Danbee Kang, PhD
Sungkyunkwan Univ., Korea논문을 해석할 때 가장 먼저 기억해야 할 점은 p 값에 집착하지 않는 것이다. p 값은 귀무가설(군간 차이가 전혀 없다는 가설) 하에서 관찰된 결과가 우연히 나타날 확률을 의미한다. 전통적으로 0.05를 기준으로 유의성을 나누지만, 이는 연구자가 실제 차이가 없는데도 있다고 결론 내릴 1종 오류를 5%까지 허용하겠다는 임의적 기준일 뿐이다. 표본 수가 크면 임상적으로 미미한 차이도 유의하게 나오고, n 수가 적으면 중요한 차이도 유의하지 않게 된다. 따라서 p 값만으로 결론을 내리는 것은 위험하다.
대신 몇 가지를 살펴야 한다. 첫째, 결과의 차이가 환자 진료에서 의미 있는 수준인지 판단해야 한다. 체중 0.1 kg 감소가 통계적으로 유의하더라도 실제 치료에 의미가 없을 수 있고, 반대로 유의하지 않아도 효과 크기가 충분히 크면 임상적으로 주목할 가치가 있다. 둘째, 노출(exposure)의 단위가 타당한지 확인해야 한다. 연속형 변수는 한 단위 증가당 결과 변화로 제시되므로, 단위 설정이 비현실적이면 해석이 왜곡된다. 셋째, 참조 집단(reference group)의 설정이 적절해야 한다. 기준 값이 임상적으로 부적절하면 상대적 비교가 과장되거나 축소된다. 예를 들어 체중 0.1 kg과 0.2 kg 감소는 모두 미미하지만 상대 비교에서는 2배 차이로 오해될 수 있다.
결국 임상가는 복잡한 통계 기법보다 결과가 실제 환자 진료에 어떤 의미를 가지는지를 비판적으로 해석해야 한다. 같은 0.1 kg 차이라도 미숙아와 성인 남성에서 그 의미는 전혀 다르다. 통계는 숫자의 계산이 아니라 의미의 해석이다. 임상적 맥락을 고려하지 않은 통계 해석은 환자 진료에 기여하지 못한다.