통계 - 기본 용어 및 기호 정리
개요
통계학을 공부하거나 데이터 분석을 할 때 가장 기본이 되는 용어와 기호들을 정리했음.
기본 개념
모집단과 표본
모집단(Population)
- 기호: N
- 정의: 연구나 분석의 대상이 되는 전체 집단
- 예시: 모든 성인 남성의 키
표본(Sample)
- 기호: n
- 정의: 모집단에서 추출된 일부분
- 예시: 100명의 성인 남성의 키
모수와 통계량
모수(Parameter)
- 정의: 모집단의 특성을 나타내는 값
- 예시: 모집단의 평균(μ), 분산(σ²)
통계량(Statistic)
- 정의: 표본의 특성을 나타내는 값
- 예시: 표본 평균($\bar{X}$), 표본 분산(s²)
중심 경향값
평균(Mean)
- 모집단 평균: μ
- 표본 평균: $\bar{X}$
- 정의: 데이터의 중앙 위치를 나타내는 값
중앙값(Median)
- 기호: M (통상적)
- 정의: 데이터를 크기순으로 나열했을 때의 중간값
산포도
분산(Variance)
- 모집단 분산: σ²
- 표본 분산: s²
- 정의: 데이터가 평균에서 얼마나 퍼져 있는지를 나타내는 척도
표준편차(Standard Deviation)
- 모집단 표준편차: σ
- 표본 표준편차: s
- 정의: 분산의 제곱근으로, 데이터의 퍼짐 정도를 원래 단위로 나타냄
가설검정 관련 용어
유의수준과 p-값
유의수준(Significance Level)
- 기호: α
- 일반적 값: 0.05
- 정의: 가설검정에서 1종 오류를 범할 최대 확률
p-값(p-value)
- 정의: 귀무가설이 참일 때, 현재 관찰된 데이터보다 더 극단적인 결과가 나타날 확률
가설의 종류
귀무가설(Null Hypothesis)
- 기호: H₀
- 정의: “차이가 없다” 또는 “효과가 없다”는 가설
대립가설(Alternative Hypothesis)
- 기호: H₁ 또는 Hₐ
- 정의: “차이가 있다” 또는 “효과가 있다”는 가설
주요 검정 방법
z-검정(Z-test)
- 기호: z
- 공식: $z = \frac{\bar{X} - μ}{σ/\sqrt{n}}$
- 사용: 모집단의 표준편차를 알고 있거나, 표본 크기가 클 때
t-검정(T-test)
- 기호: t
- 공식: $t = \frac{\bar{X} - μ}{s/\sqrt{n}}$
- 사용: 모집단의 표준편차를 모를 때, 또는 표본 크기가 작을 때
카이제곱 검정(χ²-test)
- 기호: χ²
- 공식: $χ² = \sum\frac{(O_i - E_i)^2}{E_i}$
- 사용: 범주형 데이터의 분석
오류의 종류
1종 오류(Type I Error)
- 기호: α
- 정의: 실제로는 귀무가설이 참인데, 잘못 기각하는 오류
2종 오류(Type II Error)
- 기호: β
- 정의: 실제로는 대립가설이 참인데, 잘못 기각하지 않는 오류
중요 이론
중심극한정리(Central Limit Theorem, CLT)
- 정의: 표본 크기가 충분히 클 경우, 표본 평균의 분포가 정규분포에 근사하게 되는 이론
- 적용: 일반적으로 n ≥ 30일 때 적용 가능
정리
이상의 통계 용어와 기호들은 통계학의 기초를 이루는 중요한 개념들. 이러한 기본 개념들을 잘 이해하면, 더 복잡한 통계적 분석과 해석을 수행하는 데 도움이 될 것 같다.
This post is licensed under CC BY 4.0 by the author.