카이제곱 분포 (Chi-Squared Distribution)
카이제곱 분포의 정의
카이제곱 분포(Chi-Squared Distribution)는 확률 이론에서 자주 사용되는 연속 확률 분포로, 주로 분산 분석, 적합도 검정, 독립성 검정 등에서 활용된다. 이 분포는 자유도(degrees of freedom)라는 매개변수에 따라 형태가 달라지며, 자유도가 증가할수록 분포의 모양이 정규 분포에 가까워진다. 카이제곱 분포는 정규 분포를 기반으로 한 통계적 검정에 중요한 역할을 한다.
카이제곱 분포는 다음과 같은 함수로 정의된다:
여기서 $ Z_i $는 독립적인 표준 정규 분포를 따르는 랜덤 변수이고, $ \sigma_i^2 $는 해당 변수의 분산이다. 이 식에서의 합은 $ k $개의 독립적인 표준 정규 분포로부터 나온다.
카이제곱 분포의 성질
카이제곱 분포는 몇 가지 중요한 성질을 가지고 있다:
비대칭성: 카이제곱 분포는 자유도가 낮을 때 크게 비대칭적이며, 자유도가 높아질수록 점점 정규 분포에 가까워진다.
자유도에 따른 변화: 카이제곱 분포의 자유도는 분포의 중심과 모양을 결정한다. 자유도가 1일 때는 매우 오른쪽으로 꼬리가 긴 형태를 가지며, 자유도가 증가함에 따라 꼬리가 짧아지고 분포가 중앙으로 집중된다.
기댓값과 분산: 카이제곱 분포의 기댓값은 자유도 $ k $에 해당하며, 분산은 $ 2k $로 주어진다.
카이제곱 분포의 확률 밀도 함수
카이제곱 분포의 확률 밀도 함수(PDF)는 다음과 같이 정의된다:
여기서 $ \Gamma(\cdot) $는 감마 함수이다. 이 확률 밀도 함수는 $ x = 0 $에서 시작하며, $ x $가 증가함에 따라 점점 감소하는 형태를 보인다. $ k $가 증가하면, 분포의 최대값이 오른쪽으로 이동하며, 전체 분포는 더 넓고 낮아진다.
카이제곱 분포의 누적 분포 함수
카이제곱 분포의 누적 분포 함수(CDF)는 단osed 형태로 주어지지 않지만, 감마 함수의 불완전 베타 함수(Incomplete Beta Function)를 이용하여 계산할 수 있다. 이는 주어진 $ x $값까지의 확률을 계산하는 데 사용된다. 통계 소프트웨어나 테이블을 통해 값을 찾는 것이 일반적이다.
카이제곱 분포와 다른 분포와의 관계
카이제곱 분포는 다른 여러 통계적 분포와 밀접한 관계를 가지고 있다:
정규 분포: $ k $개의 독립적이고 표준 정규 분포를 따르는 변수의 제곱합은 카이제곱 분포를 따른다.
감마 분포: 카이제곱 분포는 특별한 경우의 감마 분포로 볼 수 있다. 특히, 감마 분포의 형태 모수가 2의 정수 배인 경우, 카이제곱 분포와 동일한 형태를 갖는다.
t-분포: t-분포는 카이제곱 분포와 정규 분포의 조합으로 정의된다. 구체적으로, t-분포는 표준 정규 분포와 자유도가 $ k $인 카이제곱 분포의 제곱근으로 구성된다.
카이제곱 분포의 극한 성질
카이제곱 분포는 자유도 $ k $가 무한대로 갈 때, 중앙극한정리에 의해 정규 분포에 수렴한다. 이는 통계적 검정에서 대형 표본을 사용할 경우, 카이제곱 분포를 근사적으로 정규 분포로 처리할 수 있음을 의미한다.
관련 자료:
Last updated