기존 변환(푸리에 변환 등)과의 비교

푸리에 변환의 기본 개념

연속 시간 영역에서 정의된 신호를 주파수 영역으로 변환하기 위한 대표적인 방식으로 푸리에 변환이 활용된다. 예를 들어, 시간 영역에서 정의된 신호 $x(t)$에 대한 연속 푸리에 변환은

X(ω)=x(t)ejωtdtX(\omega) = \int_{-\infty}^{\infty} x(t)\,e^{-j \omega t}\,dt

와 같이 표현된다. 이 변환은 임의의 주파수 성분이 신호 안에 어느 정도 포함되어 있는지 주파수 스펙트럼으로 해석할 수 있게 해주지만, 시간에 따른 주파수 성분의 변화나 순간적인 이상 현상을 직접적으로 추적하기에는 어려움이 있다.

단시간 푸리에 변환(STFT)과 시간-주파수 해석의 한계

푸리에 변환만으로 시간 정보가 배제될 수 있으므로, 신호 분석에서 시간 분해능과 주파수 분해능 모두를 확보하기 위한 여러 시도가 이루어졌다. 그중 하나가 창 함수를 도입하여 일정 구간(window)을 선택한 뒤 푸리에 변환을 수행하는 단시간 푸리에 변환(STFT)이다. STFT는

STFT{x(t)}(t,ω)=x(τ)g(tτ)ejωτdτ\mathrm{STFT}\{x(t)\}(t, \omega) = \int_{-\infty}^{\infty} x(\tau)\,g(t-\tau)\,e^{-j \omega \tau}\,d\tau

로 정의된다. 여기서 $g(t-\tau)$는 시간축에서 특정 구간만을 떼어 내는 창 함수이며, 창의 길이에 따라 시간 분해능과 주파수 분해능이 트레이드오프 관계를 가진다.

창 길이가 짧으면(time window가 작으면) 순간적인 변화를 더 잘 포착할 수 있지만, 상대적으로 주파수 해상도는 떨어진다. 창 길이가 길면 주파수 해상도는 좋아지지만 시간 해상도는 떨어진다. 즉, STFT는 하나의 고정된 창 크기를 사용하기 때문에 전 구간에 걸쳐 동일한 시간-주파수 해상도를 제공한다. 이는 다양한 스케일(또는 크기)에서 신호를 해석할 수 없다는 한계를 가진다.

이산 푸리에 변환(DFT)과의 차이

연속 푸리에 변환이 이론적인 정의라면, 실제 디지털 신호 처리에서는 이산 푸리에 변환(DFT)을 자주 사용한다. 이산 푸리에 변환은 다음과 같이 표현된다:

X[k]=n=0N1x[n]ej2πNknX[k] = \sum_{n=0}^{N-1} x[n]\,e^{-j \frac{2\pi}{N} k n}

이는 $N$개의 표본화된 데이터로부터 주파수 스펙트럼을 얻는 방법이다. 실제 계산은 보통 빠른 푸리에 변환(FFT) 알고리즘을 통해 수행된다. 그러나 DFT 역시 고정된 크기의 윈도우(표본 개수)를 사용하기 때문에 시간-주파수 해상도에서 동일한 한계를 가진다. 특히 갑작스러운 스파이크나 비정상 신호 구간을 분리하여 분석하는 데에는 적합하지 않을 수 있다.

시간-주파수 해석의 직관적 비교

다음 다이어그램은 STFT와 웨이블릿 변환이 시간-주파수 평면에서 데이터를 어떻게 해석하는지를 간단히 비교한 것이다.

spinner

STFT의 경우 모든 주파수 대역에서 동일한 시간 해상도와 주파수 해상도를 제공하고, 웨이블릿 변환의 경우 주파수가 낮을 때는 넓은 창(높은 주파수 분해능/낮은 시간 분해능)을, 주파수가 높을 때는 좁은 창(높은 시간 분해능/낮은 주파수 분해능)을 사용한다.

해석상 차이점과 장단점

푸리에 계열 기반 변환에서는 주파수 해석이 매우 정교하게 이루어지지만, 시간 정보가 주파수 영역으로 완전히 확산되어 버리는 특성이 있다. 이를 보완하기 위해 창 함수를 도입한 STFT(단시간 푸리에 변환)가 고안되었으나, 단 하나의 고정된 창 크기로 전 구간을 해석하기 때문에 신호 스펙트럼의 국소적 특성을 다양하게 포착하기 어렵다. 웨이블릿 변환은 다중해상도 분석(Multi-Resolution Analysis)을 통해 주파수 대역별로 스케일(또는 창 크기)을 달리함으로써, 상대적으로 저주파 대역에서는 긴 창을, 고주파 대역에서는 짧은 창을 사용한다.

저주파대에서 긴 창을 사용한다는 것은 주파수 해상도(Frequency Resolution)를 높게 가져가되, 시간 해상도(Time Resolution)가 떨어질 수 있음을 의미한다. 이에 반해 고주파대에서는 창을 짧게 잡아 순간적인 시간 변화를 더 잘 포착할 수 있지만, 이때는 주파수 해상도가 낮아질 수 있다. 이렇게 서로 다른 주파수 대역에서 적절한 해상도를 자동으로 선택해 주는 것이 웨이블릿 변환의 핵심적 특징 중 하나이다.

푸리에 변환이나 STFT 등의 기존 기법에서 특정 대역을 더 세밀하게 해석하려면, 해당 구간 또는 주파수 대역을 직접 잘라내거나 재가공하여 별도로 변환 과정을 적용해야 한다. 이로 인해 분석 과정이 복잡해지고, 중첩된 주파수 대역이나 가변적인 신호 특징을 놓칠 가능성이 높아진다. 웨이블릿 변환은 신호 전 구간에 대해 다중 스케일 분석을 수행하므로, 새로운 구간을 따로 지정하지 않아도 자동적으로 저주파부터 고주파까지의 변화를 모자이크처럼 쪼개어 관찰할 수 있다.

시간-주파수 영역 타일링(Tiling) 관점에서의 차별성

푸리에 변환 계열 기법은 시간축 전체에 대해 일정한 주파수 해상도를 유지한다. STFT 역시 고정된 창 폭을 사용하므로, 동일한 해상도로 시간축을 잘게 나누고 각각의 구간에 대해 푸리에 변환을 취하는 방식이다. 따라서 시간-주파수 평면에서 일정한 형태의 직사각형 타일들이 분포하는 형태로 해석할 수 있다.

웨이블릿 변환은 스케일(Scale)과 시간을 동시에 고려하여 타일링을 유연하게 수행한다. 고주파 대역일수록 짧은 시간 창으로 나누고, 저주파 대역일수록 긴 시간 창으로 나누어 시간축을 분석한다. 시간-주파수 평면에서 이를 시각화하면, 저주파 영역에서 넓은 창(폭)이 확보되고 고주파 영역으로 갈수록 창이 점차 좁아지는 쐐기(Wedge) 형태의 타일링 구조가 형성된다.

다중해상도 분석을 통한 불규칙 신호 처리

푸리에 변환은 신호가 주기적이거나 안정적이라고 가정했을 때 이상적인 해석 수단으로 간주되지만, 현실에서 측정되는 신호는 비정상적(Non-stationary)이거나 국소적인 불규칙성을 가지는 경우가 많다. 이런 영역에서 STFT는 창의 크기를 바꿔가며 여러 번 해석을 수행해야 하므로, 실무적으로 복잡하고 중복 계산량이 증가한다.

웨이블릿 변환은 이미 다중해상도 분석이라는 구조적 특징을 내부적으로 갖추고 있기 때문에, 단 하나의 변환으로 저주파 영역부터 고주파 영역까지 순차적으로 세밀하게 들여다보는 것이 가능하다. 다시 말해, 스케일 파라미터의 변화를 통해 신호에 존재하는 다양한 주파수 대역을 각각의 적절한 시간 해상도로 분석할 수 있다. 이러한 방식은 신호에 짧은 스파이크나 이상치가 나타나더라도 특정 스케일에서 이를 포착하기 용이하도록 지원한다.

희박성(Sparsity) 관점에서의 이점

지정된 직교 기저(푸리에 기저 등)로 신호를 전개했을 때 계수가 희박하게 분포한다면, 해당 기저가 신호를 잘 표현한다고 해석할 수 있다. 웨이블릿 기저는 대체로 시간영역에서 특정 구간에 집중되고, 주파수영역에서도 국소성을 갖는 모함수(Mother Wavelet)를 사용하기 때문에, 스파이크나 급격한 변화를 가지는 비정상 신호에서 상대적으로 적은 수의 웨이블릿 계수만으로도 원 신호를 재현할 수 있다. 이는 압축이나 노이즈 제거 같은 응용에서 큰 장점을 제공한다.

계산 복잡도와 구현 관점에서의 비교

푸리에 변환 계열을 계산할 때는 보통 고속 푸리에 변환(FFT) 알고리즘을 적용하여 $O(N\log N)$ 정도의 계산 복잡도를 가진다. 웨이블릿 변환은 필터뱅크 구조로 구현되는 경우가 많으며, 적절한 필터를 선택하면 $O(N)$에 가까운 효율적인 연산이 가능하다. 특히 이산 웨이블릿 변환(DWT)에서는 상향필터와 하향필터를 단계적으로 적용하여 신호를 저주파 성분과 고주파 성분으로 분할하고, 저주파 성분에 대해서 다시 같은 과정을 반복하는 방식으로 계층적 구조의 분석이 이루어진다.

웨이블릿 변환을 수행할 때 경계 조건(신호의 시작부나 끝부분에 대한 처리)도 중요한 이슈로 등장한다. 푸리에 변환은 신호가 주기적이라고 가정하거나, 적절한 길이로 창을 잘라내어 처리함으로써 경계 현상을 어느 정도 수용한다. 웨이블릿 변환에서는 필터뱅크의 컨벌루션 과정에서 신호 길이가 변화하기 때문에, 단순한 영 패딩(Zero Padding)부터 반사 패딩(Reflection Padding) 등 다양한 기법으로 경계를 처리한다. 이 과정을 어떻게 설정하느냐에 따라 변환 결과의 국소적 특성이 미세하게 달라질 수 있다.

웨이블릿 변환에 쓰이는 모함수(Mother Wavelet)와 스케일링 함수(Scaling Function)는 각각의 특성(정규성, 소멸모멘트(Vanishing Moment), 대역폭 등)에 따라 필터를 구성하게 되며, 이 선택은 결과 분석에 직접적으로 영향을 끼친다. 반면 푸리에 변환은 $\exp(-j\omega t)$ 형태의 복소지수함수를 고정 기저로 사용하기 때문에, 모함수 선택이라는 측면에서의 자유도가 크게 존재하지 않는다. 이 점은 분석 목적에 맞추어 기저 함수를 바꿀 수 있는 웨이블릿 변환의 유연성을 부각시키는 부분이기도 하다.

Scalogram과 Spectrogram의 비교

단시간 푸리에 변환(STFT)으로 얻은 $|\mathrm{STFT}{x(t)}(t, \omega)|^2$ 형태의 시간-주파수 분포를 보통 스펙트로그램(Spectrogram)이라 부른다. 웨이블릿 변환의 경우에는 $|W{x(t)}(a, b)|^2$ 형태의 시간-스케일 분포를 스케일로그램(Scalogram)이라고 한다. 두 방법 모두 신호의 시간축 분할에 따른 주파수 혹은 스케일 축에서의 계수 크기를 시각화한다는 점에서 유사하나, 다음과 같은 차이가 있다.

STFT 기반의 스펙트로그램은 전 구간에서 동일한 창 크기를 적용하여 얻어진 주파수 성분의 크기를 시간에 따라 배열한 것이다. 이를 $t$-축과 $\omega$-축(또는 $\omega$ 대신 주파수 축 $f$)에 대응시켜 2차원 평면에 매핑한다. 한편, 웨이블릿 기반의 스케일로그램은 연속 웨이블릿 변환(CWT)의 스케일 $a$와 시간 평행 이동 $b$에 따라 결정되는 웨이블릿 계수의 세기를 2차원 평면으로 시각화한다. 이때 스케일 $a$가 작은 영역(고주파 영역)은 스펙트럼이 조밀하게 분해되고, 스케일 $a$가 큰 영역(저주파 영역)은 더 넓은 시간 구간을 관찰하지만 주파수 해상도가 낮아지는 특성을 갖는다.

스케일로그램에서 시간 및 스케일(또는 대응 주파수)이 변함에 따라 창 폭이 유연하게 변화하기 때문에, 국소적(time-localized) 변동이 큰 고주파 성분을 더 선명하게 포착하고, 비교적 느린 변동이 주가 되는 저주파 성분에는 넓은 시간 창을 확보함으로써 전반적 추세를 파악하기 쉽다. 반면 스펙트로그램은 특정 구간에서 국소적 스파이크가 발생하더라도 고정된 시간 창 폭 내에서만 해석되므로, 해당 구간이 창의 경계를 벗어나면 분석 정밀도가 떨어질 수 있다.

위상(Phase) 해석 관점에서의 차이

푸리에 변환 계열(연속, 이산, STFT 등)에서 중요한 부분 중 하나는 변환 계수의 위상(Phase) 정보를 어떻게 해석하느냐이다. 예를 들어 연속 푸리에 변환의 경우

X(ω)=X(ω)ejϕ(ω)X(\omega) = |X(\omega)|e^{j\phi(\omega)}

와 같이 진폭 스펙트럼 $|X(\omega)|$과 위상 스펙트럼 $\phi(\omega)$로 분리된다. 단시간 푸리에 변환(STFT)으로 얻은 스펙트로그래밍(Spectrogram) 역시 복소수 계수를 갖기 때문에, 시간 축에 따라 $\phi(t,\omega)$가 어떻게 변하는지 살펴볼 수 있다. 그러나 앞서 언급했듯이 STFT가 고정된 창 크기로 전 구간을 해석하기 때문에, 국소적인 영역에서 위상이 급격히 변하거나 특정 주파수 성분의 위상이 빠르게 진동하는 경우를 세밀하게 추적하기가 어렵다.

웨이블릿 변환은 모함수(Mother Wavelet)의 특성에 따라 실수형 또는 복소형 웨이블릿을 선택할 수 있다. 예컨대 복소 모를렛(Morlet) 웨이블릿arrow-up-right을 사용하면

ψ(t)=et2/2σ2ejω0t\psi(t) = e^{-t^2/2\sigma^2} e^{j \omega_0 t}

와 같은 복소 지수 신호에 가우시안 창이 곱해진 형태로, 변환 계수 역시 복소수를 형성하므로 위상 해석이 가능하다. 이때 스케일 $a$와 평행 이동 $b$에 의존하는 웨이블릿 계수의 위상 $\phi(a,b)$를 시간과 스케일 축에서 함께 살피면, 특정 대역(스케일)에서 나타나는 위상 변화를 시간적으로 세밀하게 추적할 수 있다. 특히 고주파 대역에서 발생하는 빠른 위상 변화를 훨씬 더 세분화된 시간 해상도로 관찰할 수 있다는 점이 웨이블릿 변환의 강점이다.

일반적인 푸리에 변환 계열은 전역적(global) 주파수 성분을 추출한 뒤, 해당 주파수 성분들의 위상을 비교적 한꺼번에 확인하는 방식이지만, 웨이블릿 변환은 시간에 따라 단계적으로 쪼개어 들어가므로 특정 시점의 국소 위상 변화가 어떻게 축적되어 나가는지를 자연스럽게 볼 수 있다. 이는 잡음이 껴 있는 신호에서 위상 동기화를 추적하거나, 진동 신호의 순간 주파수 변동을 분석할 때 특히 유용한 특성이다.

Last updated