실제 시스템 전달함수의 추정

이론적 배경과 관찰 신호의 특징

물리적인 제어 대상은 실험실에서 다루는 이론적 모델과 달리 마찰, 유체 동역학, 온도 변화 등에 의한 비선형 효과를 내재한다. 이상적인 블록선도나 라플라스 변환만으로는 이러한 비선형성을 완벽히 반영하기 어렵다. 따라서 실제 시스템의 전달함수를 추정하려면 다양한 환경에서의 입력-출력 데이터를 수집하고, 이를 바탕으로 수학적 모델을 체계적으로 식별하는 절차가 필요하다. 여기서 말하는 식별은 단순히 계수만 맞추는 것이 아니라, 시스템이 보여주는 동특성 자체를 추정하는 과정을 의미한다. 관찰 가능한 출력 신호 $y(t)$와 설계된 입력 신호 $u(t)$ 사이의 관계를 라플라스 영역에서 표현하면 전달함수 $G(s)$가 나타나지만, 실제로는 주변 잡음이나 간섭 등의 영향으로 이 이론값과 오차가 발생한다. 이러한 오차를 최소화하는 방식으로 매개변수를 추정해야 한다.

실제 시스템은 일반적으로 다음과 같은 형태의 입력-출력 관계를 가진다고 가정할 수 있다

y(t)=F{u(t)}+η(t)y(t) = \mathcal{F}\{u(t)\} + \eta(t)

여기서 $\mathcal{F}$는 미지의 동특성을 나타내는 어떤 연산자(혹은 연산자 계열)이며, $\eta(t)$는 측정 잡음이나 외란 등으로 인한 추가 항이다. 선형 시불변(Linear Time-Invariant, LTI) 시스템이라는 이상적인 전제 아래에서는 $\mathcal{F}$가 선형 연산자로 간주될 수 있고, 그 결과 라플라스 영역에서

Y(s)=G(s)U(s)+N(s)Y(s) = G(s)U(s) + N(s)

와 같은 형태를 보인다. $N(s)$는 $\eta(t)$의 라플라스 변환이다.

파라미터 기반 전달함수 모델과 구조 선택

실제 시스템을 전달함수로 근사하기 위해서는 적절한 모델 구조를 정하고 그 모델 구조 안에서 매개변수를 찾는 과정이 필요하다. 모델 구조를 결정하는 대표적인 방식은 분모차수와 분자차수를 갖는 전형적인 유리형 전달함수로 가정하는 것이다. 예를 들어,

G(s)=b0sm+b1sm1++bma0sn+a1sn1++anG(s) = \frac{b_0 s^m + b_1 s^{m-1} + \dots + b_m}{a_0 s^n + a_1 s^{n-1} + \dots + a_n}

형태를 갖는 선형 모델을 가정한다면, $a_i$와 $b_i$ 계수들을 추정하는 것이 목표가 된다. $m$과 $n$은 모델의 차수를 결정하는 척도가 된다. 높은 차수 모델을 사용하면 실제 시스템을 더 정확히 근사할 수 있다는 이점이 있지만, 과적합(overfitting)이 일어나거나 실제 구현에서 복잡도가 급격히 증가할 수 있으므로 모델 차수를 적절히 정하는 것이 중요하다.

식별 방법론: 시간영역 접근과 주파수영역 접근

시간영역에서의 식별(Time-Domain Identification)은 일반적으로 입력 신호 $u(t)$와 출력 신호 $y(t)$의 시계열 데이터를 통해 이루어진다. 이를 위해 예를 들면 least squares 방법, ARX(Auto-Regressive eXogenous) 모델 등을 적용한다. 한편 주파수영역에서의 식별(Frequency-Domain Identification)은 보데선도나 나이퀴스트선도 형태로 측정된 주파수응답 자료로부터 모형을 추정한다. 실제로 주파수응답 자료가 풍부하다면 주파수대역별로 피팅하여 정밀하게 추정할 수 있다. 그러나 측정 과정에서 잡음이나 비선형이 들어가면, 특정 주파수에서 실험하기가 어렵거나 응답 특성이 왜곡될 수 있기 때문에 다양한 실험 설계가 필요하다.

시간영역 방법으로 식별할 때는 보통 입력 $u(t)$를 충분히 다양한 형태로 주어서 시스템의 동특성을 풍부하게 관측해야 한다. 예컨대 임펄스 입력, 스텝 입력, 펄스 열(pulse train), 난수성 신호(prbs: pseudo-random binary sequence) 등을 사용한다. 주파수영역 방법의 경우에는 사인 스위프 입력이나 특정 주파수별 사인 응답을 측정하는 방법 등이 있다. 어떤 방식을 택하더라도, 이상적 신호만 주어진다고 해서 실제 시스템의 모든 특성을 단번에 알 수 있는 것은 아니므로, 여러 가지 실험이 필요하고 얻은 측정 데이터도 신호처리 기법을 통해 잡음을 제거하거나 미분, 적분, 보간 등 사전 처리 과정을 거치곤 한다.

회귀(Regression) 기반 식별과 최소자승법

선형 시스템이라고 가정한다면, 시간영역에서의 식별 문제는 기본적으로 파라미터 추정으로 볼 수 있다. 입력-출력 관계를 차분방정식 형태로 표현하고, 이를 회귀(Regression) 문제로 전환한 뒤 최소자승법(Least Squares Method) 등을 적용하는 전형적인 절차가 널리 쓰인다. 예컨대 1차 시스템이라면,

a1y(k)+a0y(k1)=b1u(k)+b0u(k1)a_1 y(k) + a_0 y(k-1) = b_1 u(k) + b_0 u(k-1)

와 같은 이산화 모델을 둘 수 있고, 이를

y(k)=a0a1y(k1)+b1a1u(k)+b0a1u(k1)y(k) = -\frac{a_0}{a_1} y(k-1) + \frac{b_1}{a_1} u(k) + \frac{b_0}{a_1} u(k-1)

형식으로 정리하면 $y(k)$가 과거 출력과 현재·과거 입력의 선형결합으로 표현된다. 이때 $-\frac{a_0}{a_1}$, $\frac{b_1}{a_1}$, $\frac{b_0}{a_1}$ 등이 식별해야 할 계수가 된다. 측정 데이터 쌍 $\bigl(u(k), y(k)\bigr)$을 충분히 많이 확보하면, 선형 회귀 기법으로 이 계수들을 추정할 수 있다.

선형 최소자승법은 간단하지만, 실제 시스템에서 잡음이 크거나 비선형 구간이 존재하거나 외란이 입력에 상관된 형태로 침투하면 편향(bias)이 발생하거나 모델의 신뢰도가 떨어질 수 있다. 따라서 ARMAX, Box-Jenkins 등 보다 복잡한 모델 구조나 예측오차 식별법(Prediction Error Method), 최대우도추정(Maximum Likelihood Estimation), 적응필터 기법 등을 도입할 때가 많다.

식별 실험 설계와 모수 추정의 정합성

식별 이론에서 중요한 요소 중 하나는 실험 설계(Experiment Design)이다. 즉, 어떤 입력 신호를 언제 얼마나 오래 인가하고, 그에 따른 출력 신호를 어떻게 측정할지 결정하는 것이다. 추정하려는 모델의 차수나 시스템의 동특성(예를 들어 시간상수, 고유진동수 등)에 따라 입력 신호가 충분한 스펙트럼 특성을 갖도록 해야 한다. 너무 단순한 입력만 사용하면 식별된 모델이 특정 주파수 대역에서만 정확해지고, 다른 대역 특성은 반영하지 못한다.

추가로, 모수 추정(Parameter Estimation)의 정합도를 검증하기 위해선 추정된 모델을 활용해 검증용 데이터(validation data)에 대해 시뮬레이션을 수행하고 측정값과 비교하는 절차가 필수적이다. 동일한 데이터만으로 모델을 식별하고 검증까지 해버리면 과적합 문제가 발생할 수 있으므로, 데이터 세트를 식별용과 검증용으로 분리해서 사용한다.

비선형 식별 기법과 동특성 확장

실제 시스템에서는 마찰, 탄성 한계, 발열 등으로 인해 비선형 현상이 발생할 수 있다. 선형 가정만으로는 불충분한 경우 비선형 모델을 직접 도입하거나, 선형 근사 기반 접근을 반복 수행하여 비선형 성분을 단계적으로 보정해야 한다. 비선형 시스템 모델링에는 볼터라(Volera) 계열, 해머스타인(Hammerstein) 모델, 위너(Wiener) 모델 등이 존재한다. 이들 모델은 선형 블록과 비선형 블록의 결합 형태를 가정하여 파라미터를 식별한다. 예를 들어 해머스타인 모델에서는 먼저 비선형 함수(주로 포화, 마찰 곡선 등을 나타냄)를 거친 뒤, 그 결과가 선형 블록을 통과한다. 반면 위너 모델은 선형 블록 뒤에 비선형 블록이 위치한다.

비선형 모델 식별 시에는 입력범위를 넓게 설정해야 다양한 비선형 영역을 충분히 탐색할 수 있다. 예컨대 출력이 포화(saturation)에 이르거나 마찰력에 의해 서서히 움직임이 정지될 때의 동작 특성을 포함하지 않으면, 식별된 모델이 정상적인 운동 영역만을 반영하고 특수 동작 범위에서는 부정확한 결과를 낳는다.

비선형 식별에서는 구간별 리니어라이제이션을 수행하는 접근도 쓰인다. 즉, 시스템이 동작하는 구간을 세분화하고, 각 구간에서 선형 근사 모델을 식별한 뒤 이들을 적절히 접합하는 방식이다. 이때 구간 간 이음새에서 연속성을 보장하기 위해 보간 또는 가중 방식을 사용하기도 한다. 하지만 구간화 방식은 모형 차수가 증가하고, 각 구간 경계의 결정에 주관적 요소가 개입하기 쉽다.

상태공간 모델 식별(Subspace Identification)

전달함수 형태가 아닌 상태공간(State-Space) 형태로 직접 식별하는 방식은 대규모 시스템이나 다변수 시스템(MIMO: Multi-Input Multi-Output)에서 특히 유용하다. 상태공간 모델은 일반적으로 다음과 같은 형태를 가진다

x(k+1)=Ax(k)+Bu(k)y(k)=Cx(k)+Du(k)\begin{aligned} \mathbf{x}(k+1) = \mathbf{A}\mathbf{x}(k) + \mathbf{B}\mathbf{u}(k) \\ \mathbf{y}(k) = \mathbf{C}\mathbf{x}(k) + \mathbf{D}\mathbf{u}(k) \end{aligned}

여기서 $\mathbf{x}(k)$는 상태벡터, $\mathbf{u}(k)$는 입력벡터, $\mathbf{y}(k)$는 출력벡터, 그리고 $\mathbf{A}, \mathbf{B}, \mathbf{C}, \mathbf{D}$는 식별해야 할 행렬이다. 만약 시스템이 시변(time-varying)이라면 이 행렬들이 시간에 따라 달라질 수 있지만, 시불변으로 가정한다면 고정된 행렬로서 남는다.

Subspace Identification 기법은 관측 신호 $\mathbf{y}(k)$와 입력 신호 $\mathbf{u}(k)$로부터 $\mathbf{A}, \mathbf{B}, \mathbf{C}, \mathbf{D}$를 추정하기 위해 행렬 연산(특히 특이값 분해, SVD)을 활용한다. 이 방법은 노이즈 환경에서도 비교적 안정적으로 작동하며, 전통적인 최소자승 기반의 전달함수 식별보다 계산 효율이 높다는 장점이 있다. 특히 다변수 시스템에서 전송 특성이 복잡하게 얽혀 있는 경우에도, Subspace Identification은 자동으로 계 연결 구조를 분리해내는 데 유리하다.

상태공간 모델을 식별하면 제어 설계 관점에서 이득배열(Feedback Gain)을 손쉽게 구할 수 있고, 옵저버 설계를 병행하기가 용이하다. 그러나 Subspace Identification은 입력과 출력데이터의 차원이 큰 경우 행렬 차원도 매우 커지므로, 수치적으로 안정된 알고리즘이나 사전 필터링, 차원 축소 기법이 필요하다. 또한 측정 잡음이 크거나 결측 데이터가 있는 경우에는 추가적인 전처리를 통해 신호를 보강해야 한다.

식별 정확도를 평가하는 지표와 모델 검증

모델 식별 후에는 추정된 모델이 실제 시스템을 얼마나 잘 대변하는지를 평가해야 한다. 주로 예측 오차나 잔차(residual)에 대한 통계적 분석을 수행한다. 잔차가 특정한 패턴을 보이거나 자기상관이 존재하면, 모델 구조가 제대로 잡히지 않았음을 시사한다. 잡음이 백색잡음(white noise) 특성을 띠도록 남아야 “모델이 시스템의 동특성을 충분히 설명하고 있다”고 볼 수 있다.

또한 Akaike Information Criterion(AIC), Bayesian Information Criterion(BIC) 등의 모델 복잡도에 대한 페널티가 포함된 정보 기준이 널리 쓰인다. 이를 통해 차수나 모델 구조를 달리했을 때, 과적합 정도와 예측오차 사이의 균형을 평가할 수 있다. 일반적으로 모델 복잡도가 증가하면 예측 정확도는 향상되지만, 과적합 위험 또한 커진다. AIC나 BIC는 이러한 양측 요소를 균형 있게 고려하도록 도와준다.

체계적인 모델 검증을 위해 식별에 사용하지 않은 별도의 입력-출력 데이터(검증 데이터 세트)를 사용해 모델 출력을 예측하고, 실제 측정값과 비교하는 절차가 중요하다. 만약 식별 데이터와 검증 데이터에서 모두 양호한 성능을 보이면, 해당 모델은 목적한 주파수 대역이나 동작 범위 내에서 유효한 것으로 간주된다.

실험 조건과 안전성

실제 시스템에 입력 신호를 가하는 과정에서 안전성과 시스템 손상을 고려해야 한다. 특히 큰 진폭의 임펄스나 주파수 스윕을 입력으로 가하면, 설비 고장이나 과도 응답으로 인한 외부 충격이 발생할 수 있다. 따라서 식별을 위한 실험은 안전 제한 범위 내에서 수행되어야 하고, 필요하다면 비파괴(Non-destructive) 방법을 활용하거나 시뮬레이션 환경에서 부분 테스트를 진행해야 한다.

입력-출력 데이터 수집 과정에서도 센서 포화(saturation), ADC 해상도, 시간 동기화 문제 등이 발생할 수 있다. 예컨대 센서 신호가 일정 범위를 넘어 포화될 경우, 모델링에 필요한 주요 정보를 놓치는 셈이 된다. 또 샘플링 주기가 적절히 설정되지 않으면 앨리어싱(aliasing) 현상에 의해 고주파 성분이 왜곡된 형태로 측정될 수 있다. 이런 문제들을 방지하려면 하드웨어 제약과 샘플링 이론에 대한 기본 이해가 필수다.

온라인 식별과 적응 기법

실험실 환경이 아닌 실제 운전 상황에서도 시스템 파라미터가 변하거나 주변 환경 변화로 특성이 달라질 수 있다. 이런 상황에서 고정된 전달함수로는 제어 성능이 저하되기 쉬우므로, 실시간으로 전달함수를 추정하고 제어기를 재설계하는 적응(Adaptive) 기법이 요구된다. 온라인 식별(Online Identification)은 운전 중에 관측된 입력-출력 데이터를 이용해 시스템 모델 파라미터를 갱신하는 과정을 말한다. 이를 위해 일반적으로 재귀(Recursive) 형태의 최소자승 알고리즘이나 칼만필터 기반 추정법이 활용된다.

재귀 최소자승법(Recursive Least Squares, RLS)은 새로운 입력-출력 쌍이 들어올 때마다 기존 식별 결과를 업데이트하여 파라미터를 즉시 보정한다. 이는 다음과 같은 형태의 갱신식을 갖는다

θ^(k)=θ^(k1)+K(k)[y(k)ϕ(k)θ^(k1)]K(k)=P(k1)ϕ(k)λ+ϕ(k)TP(k1)ϕ(k)P(k)=1λ[IK(k)ϕ(k)T]P(k1)\begin{aligned} \hat{\theta}(k) &= \hat{\theta}(k-1) + K(k)\bigl[y(k) - \phi(k)\hat{\theta}(k-1)\bigr] \\ K(k) &= \frac{P(k-1)\phi(k)}{\lambda + \phi(k)^T P(k-1)\phi(k)} \\ P(k) &= \frac{1}{\lambda}\Bigl[I - K(k)\phi(k)^T\Bigr] P(k-1) \end{aligned}

여기서 $\hat{\theta}(k)$는 식별된 파라미터 벡터 추정치, $\phi(k)$는 회귀벡터(과거 입력과 출력 등을 포함하는 벡터), $P(k)$는 공분산 행렬에 해당하며, $\lambda$는 망각인자(forgetting factor) 역할을 한다. 망각인자는 오래된 데이터의 기여도를 줄여서 시스템이 빠르게 변화해도 최근 데이터를 중심으로 모델을 갱신하도록 만든다.

만일 비선형성이나 빠른 시변적 특성이 큰 시스템이라면, 간단한 재귀 최소자승법만으로는 추적 성능이 떨어질 수 있다. 이때는 확장 칼만 필터(Extended Kalman Filter, EKF)나 오비서버(observer)를 내장한 적응 구조를 채택하기도 한다. 이를 통해 비선형 항을 선형화하고, 불확실도나 잡음을 고려하여 모델을 보정할 수 있다. 또한 시스템이 구간별로 다른 작동 모드를 갖는 경우에는 각 모드마다 별도의 식별 알고리즘을 운용하고, 현재 동작 모드를 판별해 적절한 모델 파라미터를 선택하는 전환 기법(모드 전환 추정)도 적용될 수 있다.

견실 식별(Robust Identification)과 불확실성

실제 산업 현장에서는 데이터 노이즈, 측정 오차, 외란 등이 피할 수 없이 존재한다. 또한 모델링 오차나 누락 변수, 비선형 영향이 복합적으로 작용할 경우, 식별된 모델이 큰 불확실성을 지닐 수 있다. 이러한 문제를 해결하기 위해서는 견실(Robust) 식별 기법이 필요하다. 견실 식별 기법은 잡음에 둔감하거나, 특정한 통계 분포를 가정하지 않아도 안정적인 추정을 보장하는 방향으로 설계된다.

대표적인 예로 최소자승법보다 훨씬 큰 잡음이나 이상치(outlier)에 견딜 수 있는 M추정(M-estimation) 방법이 제안되어 왔다. M추정에서는 오차항에 대한 손실 함수(loss function)를 일반적인 2차 형태가 아닌, 절댓값이나 허버(Huber) 함수 등으로 대체하여 이상치 영향을 완화한다. 또한 공정 잡음과 측정 잡음이 함께 존재하는 경우에는 Error-in-Variables(EIV) 기법을 도입하기도 한다. 이는 입력 신호가 오류 없이 주어질 것이라는 전형적인 가정을 완화하여, 입력에서도 노이즈가 포함된다고 보는 현실적 관점에 기반한다.

시스템 불확실성을 고려하는 또 다른 방법으로는 모델 집합(Model Set) 개념이 있다. 실험 결과로부터 얻어진 여러 후보 모델이나, 불확실성 구간을 포함하는 파라미터 범위를 설정한 뒤, 그 범위 안에서 최악의 시나리오를 상정해도 시스템이 안정도를 유지할 수 있도록 제어기를 설계한다. 이는 흔히 μ-synthesis 또는 H∞ 제어에서 다루는 영역이지만, 그 기초 단계로서 식별 과정에서부터 불확실성 범위를 추정하고 반영해야 한다.

자료 기반 비모수적(non-parametric) 식별

전달함수를 유리형(분자-분모) 모델로 가정하거나, 특정 상태공간 구조를 설정하지 않고도 시스템 특성을 파악하는 비모수적(non-parametric) 방법이 있다. 예컨대 임펄스 응답이나 주파수 응답 측정으로부터 직접적으로 응답 함수를 테이블 혹은 근사 함수 형태로 수집하여 제어에 활용하는 방안이다. FIR(Filter Impulse Response) 모델을 추정하거나, 주파수응답 데이터를 보간(interpolation)해서 임의의 중간 주파수대역 특성을 얻는 방식이 그 예다.

비모수적 접근은 모델 구조를 사전에 강하게 가정하지 않아도 된다는 장점이 있다. 단점으로는, 고차원·광대역 시스템에서 요구되는 데이터 양이 매우 많아질 수 있고, 파라미터화된 모델에 비해 응답 해석이나 응용 설계(예: 극점 배치, 안정도 해석)가 직관적으로 어렵다는 점이 있다. 주파수응답을 기반으로 제어기를 설계할 때는 내삽(內插) 오차나 잡음 처리를 신중하게 해야 하며, 상황에 따라서는 비모수적 데이터를 다시 최소자승 기법 등으로 근사하여 특정 전달함수 형태를 도출하기도 한다.

시뮬레이션 기반 보강과 하드웨어 인 더 루프(HIL)

실제 시스템을 바로 실험하기 어렵거나 위험 부담이 큰 경우, 시뮬레이터를 활용해 일부 식별 단계를 사전에 점검할 수 있다. 예컨대 CAD 모델이나 물리학적 방정식에 기초해 만든 시뮬레이터를 통하여 입력-출력 관계를 모사하고, 그로부터 가상의 측정 데이터를 생성하여 초기 모델 식별을 수행한다. 이를 통해 적절한 모델 차수나 추정 알고리즘을 미리 검증할 수 있다.

하드웨어 인 더 루프(Hardware-In-The-Loop, HIL) 환경에서는 실제 제어기(혹은 핵심 하드웨어 구성요소)는 그대로 사용하되, 제어 대상(플랜트)만 시뮬레이션 모델로 대체한다. 이 방식은 극한 상황 테스트나 과도 응답 분석을 비교적 안전하게 수행하고, 식별 알고리즘을 점진적으로 보완하는 용도로 쓰인다. 이후 최종적으로 실제 시스템에 접속하여 제한된 범위에서 추가 실험만 수행해도 충분히 정확한 모델을 얻을 수 있다.

컴퓨터 기반 자동화와 소프트웨어 도구

실제 시스템 식별 과정은 다수의 실험 데이터 취득, 전처리, 파라미터 추정, 모델 검증이라는 일련의 흐름으로 진행된다. 이때 소프트웨어 도구가 거의 필수적으로 활용된다. Python, MATLAB, Julia 등에서는 시스템 식별에 특화된 라이브러리가 제공되며, 그 밖에도 R, Octave 등 다양한 환경에서 통계적 분석 툴이나 최적화 함수를 활용할 수 있다. 이런 도구는 실험 데이터를 손쉽게 불러오고, 미분·적분·필터링 등의 전처리를 수행하고, 여러 후보 모델에 대한 최소자승 혹은 최대우도추정 과정까지 자동화해준다. 결과로부터 나오는 모델 적합도, 정보 기준, 잔차 해석 등도 빠르게 시각화할 수 있어 식별 과정에 대한 이해도가 높아진다.

소프트웨어 도구를 사용할 때는 결과만 맹신하지 말고, 모델 차수 설정이나 잡음 특성 등에 대한 이론적 배경을 바탕으로 값을 해석해야 한다. 식별 알고리즘 옵션(예: 반복 횟수, 초기 추정치, 수치적 수렴 조건 등)이 모델에 큰 영향을 미치므로, 무턱대고 디폴트 설정만 쓰는 대신 문제 특성에 맞추어 조정해야 한다. 특히 파라미터 추정 과정에서 로컬 최적해에 빠지지 않도록, 여러 초기값이나 알고리즘 변종을 시도해보기도 한다.

간단한 C++ 예제: Least Squares 식별

아래 예시는 간단한 1차 시스템을 가정하고, 난수 잡음이 포함된 입력-출력 데이터를 생성한 뒤, 최소자승법을 통해 시스템 전달함수를 추정하는 과정을 보여준다. 예제에서는 1차 전달함수

G(s)=b0τs+1G(s) = \frac{b_0}{\tau s + 1}

를 이산화하여 다음의 차분방정식 형태

y(k)=αy(k1)+βu(k1)y(k) = \alpha y(k-1) + \beta u(k-1)

로 나타내고, 이를 기반으로 회귀방정식을 세워서 $[\alpha, \beta]$를 추정한다. 실제 소프트웨어 도구 없이 C++로 구현하므로 매우 간략화된 형태지만, 전반적인 절차를 이해하기에는 도움이 된다.

이 예제는 기본적인 1차 선형 시스템으로부터 데이터를 생성하고, 동일한 구조를 가정하여 최소자승법으로 파라미터를 추정한다. 실제로는 시스템 차수를 모를 수도 있고, 입력에 잡음이 존재하거나 비선형 구간이 섞일 수도 있다. 또 실험 과정에서 센서 스케일, 샘플링 오차, ADC 해상도 등 여러 이슈가 발생할 수 있으므로, 더욱 견고한 알고리즘과 다양한 모델 구조를 고려해야 한다.

다양한 접근 방식의 상호보완

고전적 유리형 전달함수 식별, 상태공간 Subspace Identification, 온라인 적응 식별, 비모수적 응답 분석 등은 모두 나름의 장단점을 지닌다. 특정 문제에서 어떤 식별 접근이 가장 효과적일지는 시스템 물리특성, 실험 가능성, 센서 가용성, 제어 목적 등에 달려 있다. 예를 들어 모터 속도 제어와 같은 단일 루프 시스템 식별에는 저차수 유리형 모델이 충분할 수 있지만, 복잡한 화학공정이나 항공우주 분야에서는 고차원 상태공간 모델이 더 적절하다.

식별 전문가는 시스템 동작 메커니즘과 제어 요구사항을 폭넓게 고려하여, 가장 합리적인 식별 전략(실험 설계, 모델 구조 선택, 추정 알고리즘, 검증 방법 등)을 종합적으로 결정해야 한다. 궁극적으로는 모델 식별 과정을 통해 얻은 전달함수가 실제 운영 환경에서 설계된 제어 성능을 만족하도록 지원해줘야 한다.

머신러닝과 확률론적 접근

실제 산업 현장에서 쌓이는 대규모 데이터나 복잡한 시변 특성을 다루기 위해, 머신러닝(Machine Learning) 기법이나 확률론적(Bayesian) 접근을 통한 시스템 식별이 주목받고 있다. 이는 전통적인 최소자승법 혹은 상태공간 식별 기법과 달리, 정해진 모델 구조 없이 광범위한 함수 공간에서 동특성을 학습하거나, 불확실성의 정량화를 포함해 식별 문제를 해결한다는 특징을 가진다.

머신러닝을 활용한 식별 중 하나는 인공신경망(Artificial Neural Network, ANN)을 이용하는 것이다. 입력 신호와 출력 신호를 학습 데이터로 사용해, 적절한 네트워크 구조(다층 퍼셉트론, CNN, RNN 등)를 선택하고 최적화 알고리즘(주로 역전파 기반)을 거쳐서 출력 예측 모델을 만든다. 회귀 문제 형태로 볼 수도 있으며, 순환신경망(RNN)은 순차 데이터 처리 능력이 있으므로 동적 시스템 식별에 응용하기 용이하다. 다만, 신경망 모델은 블랙박스 형태가 되기 쉬워 물리적 해석이 어렵고, 하이퍼파라미터(은닉층 수, 뉴런 수, 활성함수 등)에 따라 결과가 민감하게 달라질 수 있다.

확률론적 접근, 특히 베이지안(Bayesian) 기법은 파라미터나 모델 구조에 대한 사전 분포(prior)를 설정하고, 관측된 데이터로부터 사후 분포(posterior)를 갱신해가는 방식을 취한다. 예컨대 가우시안 프로세스(Gaussian Process, GP)를 활용하면, 특정 커널 함수를 통해 시스템 함수를 연속적·확률적으로 추정하게 된다. 이는 과적합을 방지하고 데이터가 부족해도 추정 함수를 부드럽게 보간할 수 있으며, 예측값에 대한 분산(신뢰도) 정보를 함께 제공한다. 전달함수의 매개변수를 직접 추정하는 대신, 입력-출력 맵핑을 확률적 함수로 간주하고, 새 입력에 대한 응답을 사후 예측분포 형태로 얻는 것이 특징이다.

머신러닝이나 베이지안 기법을 실제로 적용할 때는 반드시 물리적 직관과 결합해 해석해야 한다. 아무리 데이터가 많아도, 시스템이 주파수 응답상 특정 밴드에서만 선형 근사 가능한 특성을 가진다면, 비선형 모델을 무리하게 학습하는 것보다 오히려 간단한 유리형 모델이 더 적절할 수도 있다. 반면 환경이 시시각각 변하고, 관측 잡음이 많으며, 동특성이 복잡하게 얽혀 있는 상황에서는 유연한 함수 공간으로 식별 문제를 푸는 머신러닝 접근이 유리할 수 있다.

스토캐스틱 시스템 식별과 잡음 모델링

측정 잡음이나 외란이 시스템 출력에 미치는 영향을 더 정교하게 반영하기 위해서는, 식별 모델에 잡음 모델이 포함되어야 한다. 예컨대 Box-Jenkins 모델은

y(t)=B(q1)F(q1)u(t)+C(q1)D(q1)e(t)y(t) = \frac{B(q^{-1})}{F(q^{-1})} u(t) + \frac{C(q^{-1})}{D(q^{-1})} e(t)

형태로 입력 부분과 잡음 부분을 분리하여 나타낸다. 여기서 $q^{-1}$은 시프트 연산자이고, $B(q^{-1}), F(q^{-1}), C(q^{-1}), D(q^{-1})$는 각각 유리함수 계수다. $e(t)$는 백색잡음(white noise)라고 가정한다. 이러한 구조에서는 최소자승법이 아닌 예측오차 식별법(Prediction Error Method)이나 최대우도추정(Maximum Likelihood Estimation, MLE)이 자주 쓰인다. 스토캐스틱 모델을 세우면 잔차 분석이 더욱 체계적으로 가능해지고, 예측 신뢰 구간까지 구할 수 있다.

잡음을 단순 가우시안 분포로 가정하기 어려운 경우, 비가우시안 분포나 중첩분포(mixture distribution)를 택해 식별을 수행하기도 한다. 이는 사회·경제 분야나 신호처리에서 발생하는 드문 극값(outlier)이나 넓은 꼬리(tail)를 가진 통계적 특성을 반영할 때 필요하다. 불연속적인 충격성 잡음, 포아송 성분이 섞인 잡음 등은 일반적인 가우시안 잡음 모델로는 잘 설명되지 않을 수 있으므로, 상황에 따라 확률 모형을 유연하게 설정해야 한다.

자동 제어 설계와 통합된 식별 프로세스

현대 제어 시스템 설계에서는 식별과 제어기 설계가 완전히 분리되지 않고, 반복적·통합적으로 수행되기도 한다. 대표적인 예로 모델 예측 제어(Model Predictive Control, MPC)는 모델 신뢰도에 따라 제어 성능이 크게 달라지므로, 운전 중 발생하는 오차를 이용해 식별 모델을 동적으로 보정하는 전략이 쓰인다. 선형 MPC라면 ARX 계열 모델을 업데이트하고, 비선형 MPC라면 뉴럴넷 기반 모델이나 Hammerstein-Wiener 모델을 보정한다. 이를 통해 플랜트가 시시각각 변화해도 제어기의 예측 정확도를 유지하게끔 한다.

또한 무인 이동체(드론, 자율주행 차량 등)에서는 센서 퓨전 기법과 연계된 식별-제어 구조가 일반화되고 있다. 센서가 다양한 좌표계나 노이즈 특성으로부터 정보를 제공하기 때문에, 실시간으로 지도(map)를 작성하거나 궤적을 추정하는 동시에 동적 모델(추력, 항력, 관성 등)을 보정해야 한다. 이는 매우 높은 차원의 상태공간 모델을 다루는 일이지만, 적합한 확률 필터와 적응 식별 기법을 결합하면 실시간으로 모델 추정을 수행하며 제어 성능을 유지할 수 있다.

응용 분야와 추가 고려사항

전달함수 식별은 기계·전자·화학·항공·해양 등 다양한 엔지니어링 분야에 응용된다. 예컨대 기계 시스템 식별에서는 기어 백래시나 점탄성 변형 등 비선형 요소가 자주 문제되며, 항공기 동역학 식별에서는 플러터(flutter) 같은 고차 공진현상을 잡아내기 위해 주파수영역 식별이 중요해진다. 화학공정의 경우 여러 반응 단계가 연쇄적으로 이어져서 단순한 전달함수로는 표현하기 어려울 수 있으며, 연속 흐름과 부분 분할 흐름이 섞인 복잡 계 구조가 형성된다.

실험 설계 단계에서는 안전성과 정확성을 동시에 만족해야 한다. 작은 범위의 입력 신호만 주어도 실험이 안전할 수 있지만, 모델이 해당 범위 밖에서 의미가 없어질 수 있다. 반대로 큰 폭의 입력을 인가하면 모델 정확도는 높아질 수 있지만, 장비 손상이나 과도 응답 문제가 커진다. 따라서 업계 기준과 규정을 충족하는 선에서 충분한 실험 공간을 확보해야 한다.

하나의 모델로 전체 운전 범위를 모두 커버하기 어려울 때는 구간별 모델링이나 파라미터 스위칭 기법을 고려해야 한다. 구간별 모델을 연결할 때는 이음새에서 이산적 점프가 생기지 않도록 보간 함수를 넣을 수도 있고, 전환 로직(logic)을 엄밀히 설계해 모드 전환을 매끄럽게 처리할 수도 있다.

모델 무효화(Model Invalidation)와 재식별 전략

실제 시스템이 수집된 데이터 범위를 벗어난 새로운 운전 상태나 외란 환경에 직면하면, 기존 식별 모델이 유효하지 않게 될 수 있다. 이를 사전에 감지하는 절차를 모델 무효화(Model Invalidation)라 한다. 특정 지표나 잔차 모니터링을 통해, 예컨대 다음과 같은 기준을 설정할 수 있다

ymeas(k)ymodel(k)  >  ϵ| y_\text{meas}(k) - y_\text{model}(k) | \;>\; \epsilon

이 일정 횟수 이상 반복되면 “기존 모델이 주어진 오차 한계를 벗어났다”고 판단하고, 재식별이나 모델 갱신 절차를 실행한다. 이는 하이브리드 시스템(불연속 모드 전환이 있는 시스템)이나 고도의 시변성 시스템에서 특히 유용하다.

재식별 시에는 기존 모델의 파라미터를 초기값으로 설정하거나, 새 데이터만으로 식별을 재수행할지 아니면 이전 데이터도 가중치 형태로 반영할지를 결정해야 한다. 온라인 적응 식별과는 구분되는 개념으로, 일정 구간 동안은 동일 모델을 유지하되 유효성 검사를 통해 모델이 무효화되면 비로소 재식별 모드를 발동하는 ‘이벤트 기반’ 접근이 흔히 사용된다. 이렇게 하면 연속적 파라미터 추적(재귀 최소자승 등) 방식에 비해 계산량이 줄고, 정상 운전 상태에서는 모델이 과하게 진동하거나 추적 오류가 누적되는 문제를 완화할 수 있다.

다중 모드 시스템과 스위칭 모델

혼합논리(Hybrid Dynamics)가 작용하는 다중 모드 시스템의 경우, 작동 모드마다 전혀 다른 전달함수를 갖거나 파라미터가 급격히 변화한다. 예컨대 로켓 추진 단계마다 질량이 변화하거나, 로봇 조인트에서 토크 제한기가 걸릴 때와 걸리지 않을 때 등이 이에 해당한다. 이때 전체 시스템을 단일 전달함수로 표현하면 오차가 클 뿐만 아니라, 식별 과정에서도 중복 파라미터나 불연속적인 전이가 발생해 일관성 있는 하나의 모델로 수렴하기 어렵다.

이를 해결하는 대표적 방법으로 스위칭(switching) 모델 식별이 있다. 각 모드별로 $G_1(s), G_2(s), \dots, G_M(s)$ 같은 서브 모델을 식별하고, 모드 전환 매커니즘(스위치 규칙)을 식별하거나 사전에 정의한다. 전환 규칙은 센서 측정값이나 논리 조건에 의해 결정될 수도 있고, 별도의 상태머신(State Machine)으로 기술될 수도 있다. 이때 모드가 전환될 때마다 해당 서브 모델로 즉시 바꿔 쓰거나, 구간별로 모델을 활성화하는 방식이 구현된다.

스위칭 모델 식별에서는 각 모드 구간에 대해 충분한 데이터를 확보해야 하며, 모드 전환 지점을 자동 추정하는 기법(예: Hidden Markov Model, HMM 유사 접근)이 쓰일 수도 있다. 모드가 과도하게 자주 바뀌면 잡음과 섞여 스위칭 지점이 애매해지므로, 물리적 지식을 활용해 모드 전환 빈도를 제한하거나 특정 히스테리시스 구간을 설정하기도 한다.

회로·전자계통에서의 전달함수 추정

제어공학에서 다루는 많은 실제 사례는 전기·전자회로의 동작이나 임베디드 시스템 형태를 취한다. 예컨대 전력변환 장치(DC-DC 컨버터, 인버터 등), 서보 모터 드라이버, 센서 및 트랜스듀서 회로 등은 전달함수로 단순화하기 좋지만, 실제로는 스위칭 소자나 포화 특성 등으로 인해 비선형·시변 요소가 발생한다. 이런 시스템에서는 다음과 같은 식별 절차가 널리 쓰인다.

  • 소신호선형화(Small-Signal Linearization): 정격 운전점 근처에서 교란을 작게 가하여, 출력 응답을 분석함으로써 선형 근사 모델을 얻는다. 파워일렉트로닉스의 스위칭 모델에서 평균화(averaging) 기법을 적용하는 경우가 이에 해당한다.

  • PSIM, SPICE 등 회로 시뮬레이터를 통한 사전 분석: 하드웨어 실험 전, 회로 시뮬레이터로부터 얻은 임펄스 응답이나 AC 해석 결과를 통해 주파수영역에서 모델 근사를 시도한다.

  • 수직적 통합 모델: 전력단(plant)만이 아니라 게이트 드라이버, 센서, 필터 요소까지 포괄하는 통합 모델을 식별할 수도 있다. 이때는 측정점과 내부 신호 경로 설정이 복잡해질 수 있다.

전자회로 기반 시스템에서는 스위칭 주파수, 곰돌링(ringing) 현상, EMI/EMC 영향 등이 식별 결과에 큰 오차를 일으킬 수 있으므로, 측정 장비나 접지(ground) 설계, 신호 동기화 등에 세심한 주의를 기울여야 한다.

연속·분산파동 시스템과 고급 PDE 기반 모델

기계 구조물의 진동, 유체 유동, 열전달, 탄성파 등은 편미분방정식(PDE) 계를 따르는 연속시스템인 경우가 많다. 이들 시스템을 전형적인 유리함수 기반 전달함수로 단순화하기 위해서는 모드 해석(Modal Analysis)이나 근사 기법(Finite Element Method, Finite Difference 등)이 필요하다. 예컨대 기계 구조물의 진동 모드를 몇 가지 대표 모드로 잘라내면, 저차 상태공간 모델로 가까운 근사를 얻을 수 있다. 그러나 실제로는 무수히 많은 고차 모드가 존재할 수 있으므로, 간단한 유리함수로 표현했을 때 고주파 대역에서 예측 오차가 클 수 있다.

열전달이나 유체 흐름, 음향 파동 같은 분산파동(distributed wave) 문제도 마찬가지다. 통제 대상 구간을 짧게 쪼개어 수많은 부분계로 표현하면, 차수가 거대해져 직접 식별이 곤란해진다. 이를 위해 모드 축소(모델 저차화) 기법인 Balanced Truncation, Proper Orthogonal Decomposition(POD), Balanced POD 등이 개발되었다. 이들은 풀 차원 PDE 해석 또는 고차 선형계로부터 동등한(또는 근사적인) 전달함수를 저차로 축소하되, 핵심 모드는 남기고 영향이 작은 모드는 제거하는 방식을 취한다. 그 후 저차화 모델에 대해서만 식별이나 추정을 수행하면 계산 및 실험 복잡도가 크게 줄어든다.

빅데이터 환경에서의 분산 식별

산업 IoT(Internet of Things)나 대규모 분산형 센서 네트워크 상황에서는, 여러 구역에서 동시에 데이터를 수집·처리하여 시스템 전체의 분산 모델 또는 부분 모델을 식별하려는 요구가 생긴다. 개별 노드(센서·액추에이터)가 한 곳에 데이터를 전부 모으지 않고도, 네트워크를 통해 협력적으로 식별 문제를 해결하는 분산 알고리즘이 연구되고 있다. 예컨대 ADMM(Alternating Direction Method of Multipliers) 기반 분산 최적화 기법을 사용하면, 각 노드가 지역(local) 문제를 풀고 간단한 통신을 통해 전역(global) 모델 파라미터를 합의(consensus)하는 방식으로 식별할 수 있다.

이 접근은 중앙 서버가 모든 데이터를 독점적으로 저장·처리하는 중앙집중형 방식과 달리, 각 노드의 계산·메모리 부담을 분산시키고 통신 비용을 최적화한다. 또한 보안·프라이버시 문제에서 일부 민감한 데이터를 노출하지 않고도 공동 모델을 구축할 수 있는 장점이 있다. 그러나 노드 간 통신 지연이나 오류, 네트워크 구조의 변동성 등이 추가 난관이 될 수 있으며, 잡음·실측 오차가 분산적으로 포함되므로 견실한 분산 식별 알고리즘이 필요하다.

식별 과정에서의 유연성

실제 제어 대상은 공간적·시간적으로 복잡한 특성을 내포하기 때문에, 단순 교과서적 전형 모델로는 대응하기 어렵다. 결국 식별 과정은 “어떤 모델 구조가 최소한의 복잡도로 원하는 제어 목적을 만족하는가?”를 끊임없이 탐색·재검증하는 순환적 절차가 된다. 필요하면 비선형, 시변, 고차, 확률론적, 분산 모델까지 다양한 가설을 설정해보아야 한다. 반면, 엔지니어링 현장에서는 예산·시간·장비·안전 등 현실 제약이 따르므로, 모델링 목표와 조건에 맞춰 적정 수준에서 타협점을 찾는 안목도 중요하다.

Last updated