행렬의 노름 (Matrix Norms)

행렬 노름의 정의

행렬 노름(matrix norm)은 벡터 노름의 확장으로, 주어진 행렬에 대해 하나의 실수 값을 반환하는 함수이다. 행렬 노름은 행렬의 크기나 길이를 측정하는 데 사용되며, 행렬 공간에서 벡터 공간의 노름과 유사한 역할을 한다. 수학적으로, 행렬 $ A \in \mathbb{R}^{m \times n} $에 대한 노름 $ |A| $는 다음과 같은 성질을 만족해야 한다.

  1. $ |A| \geq 0 $ (비음수성, Non-negativity): $ |A| = 0 $은 $ A = 0 $일 때, 그리고 그때에만 성립한다.

  2. $ |\alpha A| = |\alpha||A| $ (동차성, Homogeneity): $ \alpha $는 실수 스칼라 값이다.

  3. $ |A + B| \leq |A| + |B| $ (삼각 부등식, Triangle Inequality): 임의의 행렬 $ A $와 $ B $에 대해 성립한다.

서브멀티플리카티브 노름

행렬 노름이 추가적으로 서브멀티플리카티브(sub-multiplicative) 성질을 만족할 경우, 이를 서브멀티플리카티브 노름이라고 한다. 즉, 행렬 $ A $와 $ B $에 대해 다음의 조건을 만족해야 한다:

$ |AB| \leq |A||B| $

이 성질은 주로 행렬의 곱셈에 관해 노름이 안정적인지를 판단하는 데 사용된다.

흔히 사용되는 행렬 노름

1-노름 (Induced Norm 또는 Operator Norm)

1-노름은 행렬의 모든 열(column)의 절대값 합 중 최대값으로 정의된다. 즉, $ A = [a_{ij}] $인 행렬에 대해 다음과 같이 정의된다:

$ |A|1 = \max{1 \leq j \leq n} \sum_{i=1}^{m} |a_{ij}| $

이 노름은 행렬의 열벡터들의 크기를 기준으로 행렬의 크기를 측정하는 데 적합하다.

∞-노름

∞-노름은 행렬의 모든 행(row)의 절대값 합 중 최대값으로 정의된다. $ A = [a_{ij}] $인 행렬에 대해 다음과 같이 정의된다:

$ |A|\infty = \max{1 \leq i \leq m} \sum_{j=1}^{n} |a_{ij}| $

이 노름은 행벡터들의 크기를 기준으로 행렬의 크기를 측정하는 데 사용된다.

Frobenius 노름

Frobenius 노름은 행렬의 모든 요소의 제곱합의 제곱근으로 정의된다. $ A = [a_{ij}] $인 행렬에 대해 다음과 같다:

$ |A|F = \left(\sum{i=1}^{m}\sum_{j=1}^{n} |a_{ij}|^2\right)^{1/2} $

Frobenius 노름은 벡터의 유클리드 노름(Euclidean norm)과 유사한 방식으로 행렬의 크기를 측정한다.

스펙트럴 노름 (Spectral Norm)

스펙트럴 노름은 행렬의 최대 특이값(singular value)에 해당한다. 만약 $ A $의 특이값 분해가 $ A = U\Sigma V^T $라고 할 때, 스펙트럴 노름은 다음과 같이 정의된다:

$ |A|2 = \sigma{\max}(A) $

여기서 $ \sigma_{\max}(A) $는 $ A $의 최대 특이값이다.

행렬 노름의 성질

정규화 성질

모든 행렬 노름은 벡터 노름과 마찬가지로, 동일한 정규화 조건을 만족해야 한다. 즉, $ |I| = 1 $이어야 하며, $ I $는 단위 행렬이다.

대칭성

대칭 행렬의 경우, Frobenius 노름과 스펙트럴 노름은 동일한 값을 가진다. 이는 대칭 행렬의 특수한 구조로 인해 발생한다.

등각성

스펙트럴 노름은 회전이나 직교 변환에 대해 불변성을 가진다. 즉, $ Q $가 직교 행렬이라면 $ |QA|_2 = |A|_2 $이다.

행렬 노름의 계산 방법

행렬 노름을 계산하기 위한 일반적인 방법은 주로 행렬 분해(Matrix Decomposition)를 사용하는 것이다. 예를 들어, 스펙트럴 노름을 계산하기 위해서는 특이값 분해(SVD, Singular Value Decomposition)를 사용한다.

또한, $ p $-노름에 대한 일반적인 계산은 다음과 같은 최적화 문제로 변환할 수 있다:

$ |A|p = \sup{|x|_p \leq 1} |Ax|_p $

여기서 $ |x|_p $는 벡터 $ x $의 $ p $-노름이다.


관련 자료:

  • Horn, Roger A., and Charles R. Johnson. Matrix Analysis. Cambridge University Press, 1985.

  • Golub, Gene H., and Charles F. Van Loan. Matrix Computations. 4th ed., Johns Hopkins University Press, 2013.

  • Trefethen, Lloyd N., and David Bau. Numerical Linear Algebra. SIAM, 1997.

Last updated