통계적 추론
적절한 표본집단을 지정하여 이 표본집단에서 평균, 표준편차와 같은 통계량을 구한 뒤 이를 통해 모수를 추정한다.
* 통계량(statistics) : 추출된 표본의 평균, 표준편차, 분산 등
* 모수(parameter) : 모집단의 모평균, 모표준편차, 모분산 등
모수적 방법
정규성을 갖는다는 모수적 특성을 이용하는 통계적 방법
* 중심극한정리 : 본래의 분포에 상관없이 무작위로 복원추출된 연속형 자료의 평균의 분포는 정규분포를 따른다.
군당 30명 이상으로 구성된 표본의 경우 정규분포를 따른다고 가정한다.
비모수적 방법
정규성 검정에서 정규분포를 따르지 않는다고 증명되거나 군 당 10명 미만의 소규모 실험에서는 정규분포임을 가정할 수 없다. 이 경우 비모수적 방법을 이용한다. 비모수적 방법에는 모수의 특성을 이용하지 않는 순위합검정이 있다. 숫자로는 표현되지만 수량화 할 수 없는 순위척도의 경우에도 연속형 자료가 아니더라도 순위합을 이용하는 비모수적 방법을 적용하는 것이 가능하다.
* 순위합검정 : 자료를 크기 순으로 배열하여 순위를 매긴 다음 순위의 합을 통해 차이를 비교
[참고]
모수적/비모수적 http://dermabae.tistory.com/147
반응형
'Study-넘버웍스 (2017)' 카테고리의 다른 글
4주차_#1. 머신러닝과 통계의 차이 (0) | 2017.10.16 |
---|---|
3주차_#5. K-means의 대표적인 의미론적 단점은 무엇인가? (계산량이 많다는 것 말고) (0) | 2017.10.10 |
3주차_#4. 서버를 100대 가지고 있는 경우, 인공신경망보다 Random Forest를 써야하는 이유는? (0) | 2017.10.10 |
3주차_#3. 오래된 머신러닝 기법인 나이브베이즈(naïve bayes)의 장점 (0) | 2017.10.10 |
3주차_#2. 베이지안(Bayesian)과 프리퀀티스트(Frequentist) 간의 입장 차이 (4) | 2017.10.09 |