# t-분포 (Probability Distribution: t-Distribution)

#### t-분포의 정의 및 개요

t-분포(스튜던트 t-분포, Student's t-distribution)는 모집단의 표준편차를 알 수 없을 때, 특히 표본 크기가 작은 경우에 평균의 추정에 사용되는 확률 분포이다. t-분포는 윌리엄 시얼리 고셋(William Sealy Gosset)에 의해 개발되었으며, 그의 필명인 "Student"를 따서 "스튜던트 t-분포"라고도 불린다. 이는 표본의 크기와 표본의 분산에 따라 변형되는 정규 분포의 일종으로, 표본 크기가 작을수록 정규 분포보다 꼬리가 두껍다. 이는 극단값(outlier)이나 작은 표본으로 인한 불확실성을 고려하기 위해서이다.

#### t-분포의 수학적 정의

t-분포는 자유도(degree of freedom, df)에 의해 정의된다. 자유도는 일반적으로 표본 크기에서 1을 뺀 값으로 정의되며, 이는 분포의 형태에 큰 영향을 미친다. t-분포의 확률 밀도 함수는 다음과 같이 정의된다.

$$
f(t) = \frac{\Gamma\left(\frac{\nu + 1}{2}\right)}{\sqrt{\nu\pi} , \Gamma\left(\frac{\nu}{2}\right)} \left(1 + \frac{t^2}{\nu}\right)^{-\frac{\nu + 1}{2}}
$$

여기서 $ \nu $는 자유도, $ \Gamma $는 감마 함수(Gamma function)이다. 이 함수는 정규 분포와 유사한 형태를 가지지만, 꼬리가 더 두꺼워 자유도가 낮을수록 극단값의 발생 확률이 더 높다.

#### t-분포와 정규 분포의 관계

t-분포는 자유도가 무한대로 증가할 때 정규 분포에 수렴한다. 이는 표본의 크기가 충분히 클 경우, 정규 분포를 이용한 추론이 t-분포를 이용한 추론과 거의 동일해짐을 의미한다. 하지만, 표본의 크기가 작거나 모집단의 분산을 모르는 경우, t-분포를 사용하는 것이 더 적절하다. 이는 작은 표본 크기로 인한 불확실성을 고려하기 위해서이며, t-분포는 이러한 상황에서 더 넓은 신뢰 구간을 제공한다.

#### t-분포의 특성

t-분포는 여러 가지 중요한 특성을 가지고 있다:

* **평균 (Mean):** t-분포의 평균은 0이다.
* **분산 (Variance):** t-분포의 분산은 $ \nu > 2 $일 때 $ \frac{\nu}{\nu - 2} $로 주어진다. 이는 자유도가 증가할수록 분산이 작아짐을 의미한다.
* **비대칭도 및 첨도 (Skewness and Kurtosis):** t-분포는 대칭 분포로서 비대칭도가 0이다. 하지만 첨도(kurtosis)는 자유도에 따라 다르며, 자유도가 낮을수록 첨도가 증가하여 분포의 꼬리가 두꺼워진다.

#### 자유도에 따른 t-분포의 변화

자유도가 낮을수록 t-분포는 더 뚜렷한 꼬리를 가진다. 이는 자유도가 낮을수록 극단값이 나타날 가능성이 높아지는 것을 의미하며, 이는 분포의 분산이 증가하기 때문이다. 반면 자유도가 높아질수록 t-분포는 점차 정규 분포에 가까워지며, 표본 크기가 무한대로 갈 때 완전히 정규 분포에 수렴한다.

t-분포의 이러한 특성은 특히 소규모 표본을 다루는 통계 분석에서 매우 중요하다. 통계학자들은 이 특성을 이용해 소규모 표본에서 평균에 대한 신뢰 구간을 추정하거나, 가설 검정을 수행할 때 t-분포를 활용한다.

***

관련 자료:

* John E. Freund's Mathematical Statistics with Applications, 8th Edition.
* Probability and Statistics for Engineers and Scientists, 9th Edition by Ronald E. Walpole, Raymond H. Myers, Sharon L. Myers, and Keying E. Ye.
* Student's t-distribution on Wikipedia.
