Post

통계 - 기본 용어 및 기호 정리

개요

통계학을 공부하거나 데이터 분석을 할 때 가장 기본이 되는 용어와 기호들을 정리했음.

기본 개념

모집단과 표본

모집단(Population)

  • 기호: N
  • 정의: 연구나 분석의 대상이 되는 전체 집단
  • 예시: 모든 성인 남성의 키

표본(Sample)

  • 기호: n
  • 정의: 모집단에서 추출된 일부분
  • 예시: 100명의 성인 남성의 키

모수와 통계량

모수(Parameter)

  • 정의: 모집단의 특성을 나타내는 값
  • 예시: 모집단의 평균(μ), 분산(σ²)

통계량(Statistic)

  • 정의: 표본의 특성을 나타내는 값
  • 예시: 표본 평균($\bar{X}$), 표본 분산(s²)

중심 경향값

평균(Mean)

  • 모집단 평균: μ
  • 표본 평균: $\bar{X}$
  • 정의: 데이터의 중앙 위치를 나타내는 값

중앙값(Median)

  • 기호: M (통상적)
  • 정의: 데이터를 크기순으로 나열했을 때의 중간값

산포도

분산(Variance)

  • 모집단 분산: σ²
  • 표본 분산: s²
  • 정의: 데이터가 평균에서 얼마나 퍼져 있는지를 나타내는 척도

표준편차(Standard Deviation)

  • 모집단 표준편차: σ
  • 표본 표준편차: s
  • 정의: 분산의 제곱근으로, 데이터의 퍼짐 정도를 원래 단위로 나타냄

가설검정 관련 용어

유의수준과 p-값

유의수준(Significance Level)

  • 기호: α
  • 일반적 값: 0.05
  • 정의: 가설검정에서 1종 오류를 범할 최대 확률

p-값(p-value)

  • 정의: 귀무가설이 참일 때, 현재 관찰된 데이터보다 더 극단적인 결과가 나타날 확률

가설의 종류

귀무가설(Null Hypothesis)

  • 기호: H₀
  • 정의: “차이가 없다” 또는 “효과가 없다”는 가설

대립가설(Alternative Hypothesis)

  • 기호: H₁ 또는 Hₐ
  • 정의: “차이가 있다” 또는 “효과가 있다”는 가설

주요 검정 방법

z-검정(Z-test)

  • 기호: z
  • 공식: $z = \frac{\bar{X} - μ}{σ/\sqrt{n}}$
  • 사용: 모집단의 표준편차를 알고 있거나, 표본 크기가 클 때

t-검정(T-test)

  • 기호: t
  • 공식: $t = \frac{\bar{X} - μ}{s/\sqrt{n}}$
  • 사용: 모집단의 표준편차를 모를 때, 또는 표본 크기가 작을 때

카이제곱 검정(χ²-test)

  • 기호: χ²
  • 공식: $χ² = \sum\frac{(O_i - E_i)^2}{E_i}$
  • 사용: 범주형 데이터의 분석

오류의 종류

1종 오류(Type I Error)

  • 기호: α
  • 정의: 실제로는 귀무가설이 참인데, 잘못 기각하는 오류

2종 오류(Type II Error)

  • 기호: β
  • 정의: 실제로는 대립가설이 참인데, 잘못 기각하지 않는 오류

중요 이론

중심극한정리(Central Limit Theorem, CLT)

  • 정의: 표본 크기가 충분히 클 경우, 표본 평균의 분포가 정규분포에 근사하게 되는 이론
  • 적용: 일반적으로 n ≥ 30일 때 적용 가능

정리

이상의 통계 용어와 기호들은 통계학의 기초를 이루는 중요한 개념들. 이러한 기본 개념들을 잘 이해하면, 더 복잡한 통계적 분석과 해석을 수행하는 데 도움이 될 것 같다.

This post is licensed under CC BY 4.0 by the author.