기하 분포 (Geometric Distribution)


기하 분포의 정의

기하 분포(Geometric Distribution)는 이산 확률 분포 중 하나로, 독립적이고 동일한 베르누이 시행이 성공할 때까지의 시행 횟수를 나타낸다. 베르누이 시행은 각 시행에서 두 가지 결과 중 하나(성공 또는 실패)가 나타나는 시행을 의미한다. 기하 분포는 첫 번째 성공이 나올 때까지의 실패 횟수와 관련이 깊다. 기하 분포는 매 시행이 독립적이고, 각 시행의 성공 확률이 일정한 경우에 사용된다.

확률 변수 $ X $가 기하 분포를 따를 때, 이 변수는 특정 시행에서 처음 성공할 때까지 걸린 시행의 수를 나타낸다. 만약 성공 확률을 $ p $라 하고 실패 확률을 $ q = 1 - p $라 하면, 기하 분포의 확률 질량 함수(PMF)는 다음과 같이 표현된다:

P(X=k)=(1p)k1pP(X = k) = (1 - p)^{k-1} \cdot p

여기서 $ k $는 첫 번째 성공이 발생하는 시행의 횟수이다.

기하 분포의 성질

확률 질량 함수(PMF)

기하 분포의 확률 질량 함수는 특정 시행에서 첫 성공이 나타날 확률을 나타내며, 이는 다음과 같이 주어진다:

P(X=k)=(1p)k1pP(X = k) = (1 - p)^{k-1} \cdot p

이 공식에서 중요한 점은 성공 확률 $ p $는 고정되어 있지만, 실패가 계속되는 동안 확률이 점차 감소한다는 것이다. 이는 기하 분포의 특성이며, 실패 횟수가 늘어날수록 처음 성공할 확률은 감소하게 된다.

누적 분포 함수(CDF)

누적 분포 함수(CDF)는 특정 시행 $ k $까지 첫 번째 성공이 나타날 확률을 나타낸다. 기하 분포의 누적 분포 함수는 다음과 같이 표현된다:

F(k)=P(Xk)=1(1p)kF(k) = P(X \leq k) = 1 - (1 - p)^k

이 함수는 $ k $번째 시행까지 성공하지 못할 확률을 뺀 값으로 계산된다.

기대값과 분산

기하 분포에서 확률 변수 $ X $의 기대값(평균)은 다음과 같이 계산된다:

E(X)=1pE(X) = \frac{1}{p}

기하 분포의 기대값은 성공할 때까지 걸리는 시행 횟수의 평균을 나타내며, 성공 확률 $ p $의 역수로 표현된다. 이는 성공 확률이 낮을수록 더 많은 시행이 필요하다는 것을 의미한다.

분산(Variance)은 다음과 같이 계산된다:

Var(X)=1pp2\text{Var}(X) = \frac{1 - p}{p^2}

이 분산은 기하 분포의 변동성을 측정하는 지표로, 성공 확률 $ p $가 낮을수록 분산이 커진다. 이는 성공까지 걸리는 시행 횟수의 불확실성이 더 커짐을 의미한다.

기하 분포의 기억 상실성

기하 분포는 '기억 상실성'(Memorylessness)이라는 중요한 성질을 갖고 있다. 이는 특정 시행에서 성공 여부와 관계없이, 그 이후의 시행에서 첫 성공이 나타날 확률이 이전 시행들의 결과에 영향을 받지 않는다는 것이다. 수학적으로 이는 다음과 같이 표현된다:

P(X>m+nX>m)=P(X>n)P(X > m + n \mid X > m) = P(X > n)

이 성질은 기하 분포가 마르코프 속성(Markov property)을 가진다는 것을 의미하며, 이는 연속적인 확률 과정에서 매우 중요한 역할을 한다.

기하 분포의 모멘트 생성 함수

모멘트 생성 함수(Moment Generating Function, MGF)는 확률 분포의 모멘트를 계산하는 데 사용되는 함수로, 기하 분포의 경우 다음과 같이 표현된다:

MX(t)=pet1(1p)etfor t<ln(1p)M_X(t) = \frac{pe^t}{1 - (1-p)e^t} \quad \text{for } t < -\ln(1-p)

모멘트 생성 함수는 분포의 성질을 파악하는 데 중요한 도구로 사용되며, 이로부터 기댓값과 분산 등의 주요 통계적 척도를 유도할 수 있다.

기하 분포와 관련된 기타 분포들

기하 분포는 베르누이 분포, 이항 분포 등과 밀접한 관련이 있다. 기하 분포는 여러 번의 독립적 베르누이 시행이 이루어질 때 첫 번째 성공까지의 실패 횟수를 모델링하며, 이는 베르누이 분포가 반복될 때 나타나는 결과의 분포라고 볼 수 있다.

또한, 기하 분포는 음이항 분포(Negative Binomial Distribution)의 특수한 경우로도 간주될 수 있다. 음이항 분포는 특정 성공 횟수에 도달할 때까지의 실패 횟수를 모델링하며, 기하 분포는 이때 성공 횟수가 1일 때의 경우이다.


관련 자료:

  • Ross, Sheldon M. Introduction to Probability Models. Academic Press, 2014.

  • Grimmett, Geoffrey, and David Stirzaker. Probability and Random Processes. Oxford University Press, 2001.

  • Feller, William. An Introduction to Probability Theory and Its Applications. Wiley, 1968.

Last updated