# 확률 분포: 정규 분포 (Normal Distribution)

***

#### 정규 분포의 정의와 기본 개념

정규 분포(Normal Distribution)는 통계학과 확률 이론에서 가장 중요한 분포 중 하나로, 연속 확률 분포의 한 형태이다. 이 분포는 수많은 자연 현상에서 관찰되며, 특히 측정 오차와 같은 다양한 상황에서 자주 나타난다. 정규 분포는 종 모양의 대칭 곡선으로 시각화되며, 평균(μ)을 중심으로 데이터가 분포되는 패턴을 보인다.

정규 분포는 평균(μ)과 표준 편차(σ)라는 두 가지 매개변수에 의해 결정된다. 평균은 분포의 중심 위치를 나타내고, 표준 편차는 분포의 폭, 즉 데이터가 평균으로부터 얼마나 퍼져 있는지를 나타낸다. 수학적으로, 정규 분포는 확률 밀도 함수(PDF)로 표현되며, 이는 다음과 같은 식으로 주어진다:

$$
f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)
$$

이 식에서 $ x $는 확률 변수, $ \mu $는 평균, $ \sigma $는 표준 편차를 나타낸다.

#### 정규 분포의 특성

정규 분포는 여러 가지 중요한 특성을 지닌다:

1. **대칭성**: 정규 분포는 평균을 기준으로 완벽하게 대칭적이다. 즉, 평균을 중심으로 좌우가 같은 모양을 띤다.
2. **단일 봉우리**: 정규 분포는 하나의 봉우리를 가진다. 이는 정규 분포의 평균에서 가장 높은 값을 가지며, 이 점에서 확률 밀도가 최대이다.
3. **평균, 중앙값, 최빈값의 일치**: 정규 분포에서는 평균, 중앙값, 최빈값이 모두 동일하다. 이는 정규 분포의 대칭성에서 기인한 특성이다.
4. **확률 밀도 함수의 형태**: 정규 분포의 확률 밀도 함수는 종 모양(Bell-shaped)을 띠며, 그 꼬리 부분은 무한히 뻗어 가지만, 값은 0에 수렴한다.
5. **68-95-99.7 규칙**: 정규 분포에서는 데이터의 약 68%가 평균에서 ±1σ 범위 내에, 95%가 ±2σ 범위 내에, 99.7%가 ±3σ 범위 내에 존재한다.

#### 표준 정규 분포

표준 정규 분포(Standard Normal Distribution)는 정규 분포의 특수한 경우로, 평균이 0이고 표준 편차가 1인 정규 분포를 말한다. 표준 정규 분포는 $ Z $ 변환을 통해 임의의 정규 분포에서 얻을 수 있다. $ Z $ 변환은 다음과 같이 정의된다:

$$
Z = \frac{X - \mu}{\sigma}
$$

이 변환을 통해 임의의 정규 분포 $ X \sim N(\mu, \sigma^2) $는 표준 정규 분포 $ Z \sim N(0, 1) $로 변환된다. 표준 정규 분포의 확률 밀도 함수는 다음과 같다:

$$
f(z) = \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{z^2}{2}\right)
$$

#### 정규 분포와 중심 극한 정리

중심 극한 정리(Central Limit Theorem)는 정규 분포의 중요성을 더욱 강조하는 결과로, 어떤 확률 분포를 따르는 독립적인 랜덤 변수들의 합이 충분히 큰 경우, 그 합은 정규 분포에 가까워진다는 것을 의미한다. 이 정리는 많은 샘플이 있는 경우, 그 평균이 정규 분포를 따를 것이라는 통계적 추론의 근거가 된다.

중심 극한 정리는 다양한 분포에 적용 가능하며, 특히 모집단의 분포가 정규 분포가 아니더라도 샘플의 크기가 충분히 크다면 그 샘플 평균은 정규 분포에 근접하게 된다. 이 결과는 샘플링 분포의 평균과 표준 오차를 이용한 추정과 가설 검정에서 중요한 역할을 한다.

#### 정규 분포의 확률 계산

정규 분포의 확률 계산은 주로 정규 분포의 누적 분포 함수(CDF)를 통해 이루어진다. 누적 분포 함수 $ F(x) $는 주어진 값 $ x $ 이하의 확률을 나타내며, 다음과 같이 정의된다:

$$
F(x) = P(X \leq x) = \int\_{-\infty}^{x} f(t),dt
$$

표준 정규 분포의 경우, 누적 분포 함수는 통계표를 통해 직접 계산할 수 있다. 임의의 정규 분포에 대해서는 $ Z $ 변환을 사용하여 표준 정규 분포의 CDF 값을 참조하여 계산할 수 있다.

#### 정규 분포의 수학적 특성

정규 분포는 다양한 수학적 특성을 지니고 있다. 특히, 정규 분포는 모든 차수의 모멘트를 가지며, 평균을 중심으로 하는 모멘트는 0이 된다. 또 다른 중요한 특성은 독립적인 정규 분포 변수들의 합은 다시 정규 분포를 따른다는 것이다. 이는 정규 분포의 폐쇄성(closedness) 특성으로, 다양한 확률 모델링에서 중요한 역할을 한다.

정규 분포의 엔트로피는 다음과 같이 계산된다:

$$
H(X) = \frac{1}{2} \log(2\pi e \sigma^2)
$$

이 식에서 엔트로피는 정규 분포의 불확실성을 측정하는 척도로 해석할 수 있다.

***

관련 자료:

* DeGroot, M.H., & Schervish, M.J. (2012). *Probability and Statistics*. Addison-Wesley.
* Casella, G., & Berger, R.L. (2001). *Statistical Inference*. Duxbury.
* Feller, W. (1968). *An Introduction to Probability Theory and Its Applications*. John Wiley & Sons.
