# 기하 분포 (Geometric Distribution)

***

#### 기하 분포의 정의

기하 분포(Geometric Distribution)는 이산 확률 분포 중 하나로, 독립적이고 동일한 베르누이 시행이 성공할 때까지의 시행 횟수를 나타낸다. 베르누이 시행은 각 시행에서 두 가지 결과 중 하나(성공 또는 실패)가 나타나는 시행을 의미한다. 기하 분포는 첫 번째 성공이 나올 때까지의 실패 횟수와 관련이 깊다. 기하 분포는 매 시행이 독립적이고, 각 시행의 성공 확률이 일정한 경우에 사용된다.

확률 변수 $ X $가 기하 분포를 따를 때, 이 변수는 특정 시행에서 처음 성공할 때까지 걸린 시행의 수를 나타낸다. 만약 성공 확률을 $ p $라 하고 실패 확률을 $ q = 1 - p $라 하면, 기하 분포의 확률 질량 함수(PMF)는 다음과 같이 표현된다:

$$
P(X = k) = (1 - p)^{k-1} \cdot p
$$

여기서 $ k $는 첫 번째 성공이 발생하는 시행의 횟수이다.

#### 기하 분포의 성질

**확률 질량 함수(PMF)**

기하 분포의 확률 질량 함수는 특정 시행에서 첫 성공이 나타날 확률을 나타내며, 이는 다음과 같이 주어진다:

$$
P(X = k) = (1 - p)^{k-1} \cdot p
$$

이 공식에서 중요한 점은 성공 확률 $ p $는 고정되어 있지만, 실패가 계속되는 동안 확률이 점차 감소한다는 것이다. 이는 기하 분포의 특성이며, 실패 횟수가 늘어날수록 처음 성공할 확률은 감소하게 된다.

**누적 분포 함수(CDF)**

누적 분포 함수(CDF)는 특정 시행 $ k $까지 첫 번째 성공이 나타날 확률을 나타낸다. 기하 분포의 누적 분포 함수는 다음과 같이 표현된다:

$$
F(k) = P(X \leq k) = 1 - (1 - p)^k
$$

이 함수는 $ k $번째 시행까지 성공하지 못할 확률을 뺀 값으로 계산된다.

**기대값과 분산**

기하 분포에서 확률 변수 $ X $의 기대값(평균)은 다음과 같이 계산된다:

$$
E(X) = \frac{1}{p}
$$

기하 분포의 기대값은 성공할 때까지 걸리는 시행 횟수의 평균을 나타내며, 성공 확률 $ p $의 역수로 표현된다. 이는 성공 확률이 낮을수록 더 많은 시행이 필요하다는 것을 의미한다.

분산(Variance)은 다음과 같이 계산된다:

$$
\text{Var}(X) = \frac{1 - p}{p^2}
$$

이 분산은 기하 분포의 변동성을 측정하는 지표로, 성공 확률 $ p $가 낮을수록 분산이 커진다. 이는 성공까지 걸리는 시행 횟수의 불확실성이 더 커짐을 의미한다.

**기하 분포의 기억 상실성**

기하 분포는 '기억 상실성'(Memorylessness)이라는 중요한 성질을 갖고 있다. 이는 특정 시행에서 성공 여부와 관계없이, 그 이후의 시행에서 첫 성공이 나타날 확률이 이전 시행들의 결과에 영향을 받지 않는다는 것이다. 수학적으로 이는 다음과 같이 표현된다:

$$
P(X > m + n \mid X > m) = P(X > n)
$$

이 성질은 기하 분포가 마르코프 속성(Markov property)을 가진다는 것을 의미하며, 이는 연속적인 확률 과정에서 매우 중요한 역할을 한다.

#### 기하 분포의 모멘트 생성 함수

모멘트 생성 함수(Moment Generating Function, MGF)는 확률 분포의 모멘트를 계산하는 데 사용되는 함수로, 기하 분포의 경우 다음과 같이 표현된다:

$$
M\_X(t) = \frac{pe^t}{1 - (1-p)e^t} \quad \text{for } t < -\ln(1-p)
$$

모멘트 생성 함수는 분포의 성질을 파악하는 데 중요한 도구로 사용되며, 이로부터 기댓값과 분산 등의 주요 통계적 척도를 유도할 수 있다.

#### 기하 분포와 관련된 기타 분포들

기하 분포는 베르누이 분포, 이항 분포 등과 밀접한 관련이 있다. 기하 분포는 여러 번의 독립적 베르누이 시행이 이루어질 때 첫 번째 성공까지의 실패 횟수를 모델링하며, 이는 베르누이 분포가 반복될 때 나타나는 결과의 분포라고 볼 수 있다.

또한, 기하 분포는 음이항 분포(Negative Binomial Distribution)의 특수한 경우로도 간주될 수 있다. 음이항 분포는 특정 성공 횟수에 도달할 때까지의 실패 횟수를 모델링하며, 기하 분포는 이때 성공 횟수가 1일 때의 경우이다.

***

관련 자료:

* Ross, Sheldon M. *Introduction to Probability Models*. Academic Press, 2014.
* Grimmett, Geoffrey, and David Stirzaker. *Probability and Random Processes*. Oxford University Press, 2001.
* Feller, William. *An Introduction to Probability Theory and Its Applications*. Wiley, 1968.
