티스토리 뷰

Data

기술 통계 vs 추측 통계

ellie.strong 2021. 7. 5. 16:07
728x90

기술 통계 (Descriptive Statistics)

: 현재 가지고 있는 데이터를 기반으로 객관적 사실만을 나타내는 통계 (데이터 탐색)

 

→ 수집한 데이터를 요사/묘약/설명하는 통계 기법

 

 

 

추측 통계 (Inferential Statistics)

: 현재 가지고 있는 데이터로부터 더 큰 집단의 특징을 추측하는 통계

 

- 모집단(Population) : 관심 있는 대상 모두의 수치적 자료

    - 모수(Parameter) : 모집단의 특징을 나타내는 양적인 측도 (평균, 분산 등)

- 표본(Sample) : 모집단으로부터 뽑은 부분집합

    - 통계량(Statistic) : 표본의 특성을 나타내는 양적인 측도 

 

표본의 통계량으로부터 모집단의 모수를 추론하는 것이 목적!!

 

모수추정

 

Q. 모집단이 충분히 클 경우 표본평균을 가지고 모평균을 잘 맞출 수 있는 이유?

 

중심극한정리

: 모집단의 크기가 크면 표본평균이 모평균 근처에 가까이 간다. 

 

모든 가능한 표본평균의 분포를 구했을 때 이것이 모평균 근처에 매우 뾰족한 정규분포를 그린다. 

→ 오차가 작아진다. 

 

- 참고 : 표본평균의 분포 시뮬레이션 (estat.me)

 

2억명의 모집단에서 1000명의 표본을 뽑는 경우의 수 : 2억C1000

 

 

가설검정

: 대상 집단에 대한 가설을 설정한 후 그 가설이 옳은지 그른지에 대한 채택여부를 결정하는 방법론

 

- 두 모평균이 서로 같은 지, 모평균끼리의 차의 분포를 관찰한다. (t-검정)

검정통계량이 0에 가깝기 때문에 두 모평균이 같은 확률이 높다. 

 

 

conf. 추정, 가설검정, 모집단, 표본, 분산분석, t검정

 

 

 


Ref.

- DATA - 6. 기술 통계학과 추측 통계학 (tistory.com)

- 3.3.2.기술 통계와 통계적 추론 - 개발자가 데이터 분석 준전문가 되기 (wikidocs.net)

- 모평균의 신뢰구간 추정하기 by bskyvision

 

 

 

728x90
댓글
공지사항
최근에 올라온 글