티스토리 뷰
기술 통계 (Descriptive Statistics)
: 현재 가지고 있는 데이터를 기반으로 객관적 사실만을 나타내는 통계 (데이터 탐색)
→ 수집한 데이터를 요사/묘약/설명하는 통계 기법
추측 통계 (Inferential Statistics)
: 현재 가지고 있는 데이터로부터 더 큰 집단의 특징을 추측하는 통계
- 모집단(Population) : 관심 있는 대상 모두의 수치적 자료
- 모수(Parameter) : 모집단의 특징을 나타내는 양적인 측도 (평균, 분산 등)
- 표본(Sample) : 모집단으로부터 뽑은 부분집합
- 통계량(Statistic) : 표본의 특성을 나타내는 양적인 측도
→ 표본의 통계량으로부터 모집단의 모수를 추론하는 것이 목적!!
모수추정
Q. 모집단이 충분히 클 경우 표본평균을 가지고 모평균을 잘 맞출 수 있는 이유?
중심극한정리
: 모집단의 크기가 크면 표본평균이 모평균 근처에 가까이 간다.
→ 모든 가능한 표본평균의 분포를 구했을 때 이것이 모평균 근처에 매우 뾰족한 정규분포를 그린다.
→ 오차가 작아진다.
- 참고 : 표본평균의 분포 시뮬레이션 (estat.me)
2억명의 모집단에서 1000명의 표본을 뽑는 경우의 수 : 2억C1000
가설검정
: 대상 집단에 대한 가설을 설정한 후 그 가설이 옳은지 그른지에 대한 채택여부를 결정하는 방법론
- 두 모평균이 서로 같은 지, 모평균끼리의 차의 분포를 관찰한다. (t-검정)
검정통계량이 0에 가깝기 때문에 두 모평균이 같은 확률이 높다.
conf. 추정, 가설검정, 모집단, 표본, 분산분석, t검정
Ref.
- DATA - 6. 기술 통계학과 추측 통계학 (tistory.com)
- 3.3.2.기술 통계와 통계적 추론 - 개발자가 데이터 분석 준전문가 되기 (wikidocs.net)
- 모평균의 신뢰구간 추정하기 by bskyvision