# 로지스틱 분포 (Logistic Distribution)

로지스틱 분포(Logistic Distribution)는 확률론에서 정규 분포와 유사한 형태의 연속 확률 분포 중 하나로, 주로 통계학과 회귀 분석에서 사용된다. 로지스틱 분포는 그 확률 밀도 함수(pdf)가 시그모이드(Sigmoid) 곡선의 형태를 가지며, 특히 로지스틱 회귀 분석에서 사용된다. 로지스틱 분포는 그 형태가 종모양으로 중앙이 집중되어 있는 분포로, 비대칭적인 분포를 설명할 때도 유용하다.

로지스틱 분포는 두 가지 주요 매개변수로 정의된다:

* **위치 매개변수 (location parameter, μ):** 이 매개변수는 분포의 중심을 결정하며, 로지스틱 분포의 평균이다.
* **스케일 매개변수 (scale parameter, s):** 이 매개변수는 분포의 폭을 조절하며, 분포의 표준편차와 관련이 있다.

로지스틱 분포의 확률 밀도 함수는 다음과 같이 주어진다:

$$
f(x) = \frac{e^{-\frac{x-\mu}{s}}}{s \left(1 + e^{-\frac{x-\mu}{s}}\right)^2}
$$

이 함수는 시그모이드 함수의 1차 도함수와 형태가 매우 유사한다.

로지스틱 분포의 누적 분포 함수(CDF)는 다음과 같이 표현된다:

$$
F(x) = \frac{1}{1 + e^{-\frac{x-\mu}{s}}}
$$

이 누적 분포 함수는 시그모이드 함수와 동일하며, 이로 인해 로지스틱 분포는 로지스틱 회귀에서 매우 중요한 역할을 한다.

#### 2. 로지스틱 분포의 모멘트

모멘트는 분포의 중심 경향과 형태를 수학적으로 표현하는 데 중요한 역할을 한다. 로지스틱 분포의 주요 모멘트들은 다음과 같다:

* **기대값 (Mean):** 로지스틱 분포의 기대값은 위치 매개변수 μ와 동일한다.

$$
E\[X] = \mu
$$

* **분산 (Variance):** 분산은 로지스틱 분포의 퍼짐 정도를 나타내며, 스케일 매개변수 s에 의해 결정된다.

$$
\text{Var}(X) = \frac{s^2 \pi^2}{3}
$$

* **표준편차 (Standard Deviation):** 표준편차는 분산의 제곱근으로 정의된다.

$$
\sigma = \frac{s \pi}{\sqrt{3}}
$$

* **왜도 (Skewness):** 로지스틱 분포는 대칭적인 분포이므로 왜도는 0이다.
* **첨도 (Kurtosis):** 로지스틱 분포의 첨도는 6/5로, 이는 정규 분포의 첨도보다 낮은 값이다. 이는 로지스틱 분포가 정규 분포에 비해 덜 뾰족하고 더 완만한 꼬리를 가짐을 의미한다.

#### 3. 로지스틱 분포의 특징과 성질

로지스틱 분포는 다음과 같은 여러 가지 중요한 성질을 갖는다:

* **대칭성:** 로지스틱 분포는 μ를 중심으로 대칭적이다. 즉, $ f(μ - x) = f(μ + x) $가 성립한다.
* **확률 밀도 함수의 최대점:** 로지스틱 분포의 확률 밀도 함수는 위치 매개변수 μ에서 최대값을 갖는다. 이는 이 점이 로지스틱 분포의 중앙값이기도 함을 의미한다.
* **시그모이드 함수와의 관계:** 로지스틱 분포의 누적 분포 함수는 시그모이드 함수와 동일한다. 이는 로지스틱 회귀 분석에서 로지스틱 분포가 자주 사용되는 이유 중 하나이다.
* **특정 함수로의 수렴:** 로지스틱 분포는 극값 분포의 일종으로, 적절한 정규화 과정을 거치면 Gumbel 분포로 수렴한다. 이는 극값 이론에서 중요한 역할을 한다.

#### 4. 로지스틱 분포와 정규 분포의 비교

로지스틱 분포는 여러 측면에서 정규 분포와 비교될 수 있다:

* **형태:** 로지스틱 분포와 정규 분포는 모두 종모양 곡선으로, 대칭적이며 중앙이 집중된 분포이다. 그러나 로지스틱 분포의 꼬리는 정규 분포보다 두꺼워서 극단값에 대한 확률이 더 크다.
* **첨도:** 로지스틱 분포의 첨도는 1.2(정규 분포의 경우 3)로, 이는 로지스틱 분포가 덜 뾰족함을 의미한다.
* **확률 밀도 함수:** 두 분포 모두 확률 밀도 함수가 위치 및 스케일 매개변수에 의해 조절되지만, 로지스틱 분포의 밀도 함수는 분모에 시그모이드 함수의 제곱항이 들어가 있어, 정규 분포와 다른 형태를 갖는다.
* **적합성:** 로지스틱 분포는 데이터의 극단값이 중요하거나, 비대칭적인 경우에 더 적합하게 사용될 수 있다. 반면, 정규 분포는 대부분의 자연 현상에서 관측되는 대칭적인 분포를 잘 설명한다.

***

관련 자료:

* Casella, G., & Berger, R. L. (2002). *Statistical Inference* (2nd ed.). Duxbury Press.
* Johnson, N. L., Kotz, S., & Balakrishnan, N. (1995). *Continuous Univariate Distributions, Volume 2* (2nd ed.). Wiley.
* Montgomery, D. C., & Runger, G. C. (2010). *Applied Statistics and Probability for Engineers* (5th ed.). Wiley.
