# 포아송 분포 (Poisson Distribution)

#### 포아송 분포의 정의 (Definition of Poisson Distribution)

포아송 분포(Poisson distribution)는 주어진 시간 간격 또는 공간 내에서 어떤 사건이 발생하는 횟수를 모델링하는 이산 확률 분포 중 하나이다. 특정 간격 내에서 사건의 발생이 독립적이고 일정한 평균 발생률을 가질 때, 이 사건의 발생 횟수는 포아송 분포를 따른다. 포아송 분포는 19세기 프랑스 수학자인 시메옹 드니 포아송(Simeon Denis Poisson)에 의해 처음 연구되었다.

포아송 분포의 확률 질량 함수(PMF, Probability Mass Function)는 다음과 같이 정의된다:

$$
P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}
$$

여기서 $ X $는 사건의 발생 횟수를 나타내는 이산 확률 변수이고, $ \lambda $는 주어진 시간 또는 공간 단위에서의 평균 발생 횟수(평균률)이다. $ k $는 사건이 발생한 횟수를 의미하며, $ e $는 자연로그의 밑, 약 2.718이다.

#### 포아송 분포의 가정 (Assumptions of Poisson Distribution)

포아송 분포는 다음과 같은 몇 가지 주요 가정에 기반한다:

1. **사건의 독립성 (Independence of Events):** 각 사건의 발생은 서로 독립적이다. 즉, 한 사건이 발생했다고 해서 다른 사건이 발생할 확률에 영향을 주지 않는다.
2. **시간 또는 공간의 균일성 (Uniformity of Time/Space):** 사건이 발생하는 평균률 $ \lambda $는 일정한 시간 간격이나 공간 내에서 일정하게 유지된다. 즉, 특정 시간 또는 공간에서 사건이 더 자주 발생하지 않는다.
3. **동시 발생 불가능성 (Impossibility of Simultaneous Events):** 매우 짧은 시간 간격 내에서는 두 개 이상의 사건이 동시에 발생할 확률이 무시할 수 있을 정도로 작다. 즉, 작은 시간 간격에서는 한 번에 한 사건만 발생할 수 있다고 가정한다.

이러한 가정들이 충족될 때, 포아송 분포는 특정 간격에서 사건의 발생 횟수를 모델링하는 데 매우 적합한 도구가 된다.

#### 포아송 분포의 주요 특성 (Key Properties of Poisson Distribution)

포아송 분포는 몇 가지 중요한 통계적 특성을 지닌다:

1. **기대값과 분산 (Mean and Variance):** 포아송 분포에서 기대값(평균)과 분산은 모두 $ \lambda $로 같다. 이는 포아송 분포의 독특한 특성 중 하나로, 다른 분포들과 구분되는 중요한 특징이다.

$$
\text{E}(X) = \lambda, \quad \text{Var}(X) = \lambda
$$

2. **확률 질량 함수(PMF)의 단조성 (Monotonicity of PMF):** 포아송 분포의 확률 질량 함수는 $ k = \lambda $ 부근에서 최댓값을 가지며, 그 이후로는 감소하는 경향이 있다. 이는 사건 발생의 평균 횟수 주변에서 발생 빈도가 가장 높다는 것을 의미한다.
3. **희소성 (Sparsity):** 포아송 분포는 주로 사건이 드물게 발생하는 상황을 모델링하는 데 사용된다. $ \lambda $가 작을수록 분포가 더 희소해지고, 사건이 발생하지 않을 확률이 높아진다.

#### 포아송 분포의 유도 (Derivation of Poisson Distribution)

포아송 분포는 이항 분포(Binomial distribution)에서 특정한 극한 과정을 통해 유도될 수 있다. 이항 분포에서 성공 확률이 매우 작고 시도 횟수가 매우 큰 경우, 이항 분포는 포아송 분포로 근사될 수 있다.

이항 분포에서 성공 확률을 $ p $, 시도 횟수를 $ n $, 그리고 성공 횟수를 $ k $라 할 때, 이항 분포의 확률 질량 함수는 다음과 같다:

$$
P(X = k) = \binom{n}{k} p^k (1 - p)^{n-k}
$$

이때, $ n $이 매우 크고 $ p $가 매우 작아 $ np = \lambda $를 일정하게 유지하는 경우, 이항 분포는 포아송 분포로 수렴하게 된다. 이를 수식적으로 표현하면 다음과 같다:

$$
P(X = k) = \lim\_{n \to \infty} \binom{n}{k} \left(\frac{\lambda}{n}\right)^k \left(1 - \frac{\lambda}{n}\right)^{n-k} = \frac{\lambda^k e^{-\lambda}}{k!}
$$

이 과정을 통해 포아송 분포는 사건 발생이 매우 드문 상황을 설명하는 데 적합한 모델임을 알 수 있다.

#### 포아송 분포의 적률 생성 함수 (Moment Generating Function of Poisson Distribution)

포아송 분포의 적률 생성 함수(MGF, Moment Generating Function)는 다음과 같이 주어진다:

$$
M\_X(t) = \text{E}\left\[e^{tX}\right] = \exp\left(\lambda \left(e^t - 1\right)\right)
$$

적률 생성 함수는 확률 분포의 모멘트(예: 평균, 분산 등)를 계산하는 데 유용한 도구이다. 이 함수는 포아송 분포의 기대값과 분산뿐만 아니라, 더 높은 차수의 모멘트를 계산하는 데에도 사용할 수 있다.

#### 포아송 분포의 성질과 활용 (Properties and Utilization of Poisson Distribution)

포아송 분포는 이산 확률 분포로서, 여러 가지 흥미로운 성질을 가지고 있다. 앞서 언급한 바와 같이 기대값과 분산이 동일하다는 점, 그리고 극한 과정에서 이항 분포와의 관계는 이 분포가 매우 중요한 확률 모형임을 시사한다.

포아송 분포는 또한 덧셈 정리(Additivity Property)를 가지고 있다. 만약 두 개의 독립적인 포아송 분포를 가진 확률 변수 $ X\_1 $과 $ X\_2 $가 각각 파라미터 $ \lambda\_1 $과 $ \lambda\_2 $를 가지고 있다면, 이들의 합 $ X\_1 + X\_2 $는 $ \lambda\_1 + \lambda\_2 $를 파라미터로 하는 포아송 분포를 따른다:

$$
X\_1 + X\_2 \sim \text{Poisson}(\lambda\_1 + \lambda\_2)
$$

이는 포아송 분포가 다양한 상황에서 매우 유연하게 적용될 수 있음을 보여준다.

***

관련 자료:

* Grimmett, G., & Stirzaker, D. (2020). *Probability and Random Processes*. Oxford University Press.
* Ross, S. M. (2014). *Introduction to Probability Models*. Academic Press.
* Casella, G., & Berger, R. L. (2002). *Statistical Inference*. Duxbury.