* 1일 1통계 시리즈는 프리렉 출판사의 '통계101x데이터 분석' 을 참고하여 작성하였습니다.

내가 마지막으로 통계를 배운 것은 대학 1학년 1학기 '경영 통계학'이었다. 수학을 짝사랑 했던 나는 여전히 외면당했고(내가 열심히 안했겠지만) 그 이후로 통계랑은 담을 쌓고 지냈는데... 데이터 분석가가 될 줄은 몰랐지.

그 중 가장 기본적인 '기술 통계' 역시 낯선 개념이었다.

 

기술 통계 vs. 추론 통계

기술 통계는 '수집한 데이터를 정리하고 요약하는 방법' 이라고 본문에서 소개하고 있다. technical의 기술이 아닌, descriptive 즉 확보한 데이터를 묘사하는 것에 초점을 두고 있다. 평균, 분산 등의 계산을 포함하여 데이터 자체에서 얻는 통계를 뜻한다.

반면, 추론 통계는 '수집한 데이터로부터 데이터의 발생원을 추정하는 방법' 이라고 소개되어있다. 대상을 이해하기 위해 대상이 측정된 방식, 알고자 하는 대상에 대해 추정하는 것이다.

이를 추정하기 위해 '확률 모형' 이라는 것을 사용하게 된다.

데이터는 관찰한 값이지만, 이 대상의 성질은 관찰한 값 만으로는 알기 어렵다.

우리는 정육면체 주사위의 여섯 면이 동일하다는 가정 하에 각 면이 1/6의 확률로 나타나는 확률 모형으로 표현한다.

 

통계적 추론과 가설 검정

- 통계적 추론: 데이터에서 가정한 확률 모형의 성질을 추정하는 방법

e.g. 서로 다른 크기의 면을 가진 주사위라면, 각 눈의 확률이 1/6이 아닐 수 있다. 이런 경우 통계적 추론을 이용하여, 얻은 데이터로부터 각 눈이 어떤 확률로 나오는 주사위인가를 추정할 수 있다.

- 가설 점정: 세운 가설과 얻은 데이터가 얼마나 들어맞는지를 평가하여, 가설을 채택할 것인가를 판단하는 방법

 

+ Recent posts