MPC 컨트롤러에서 데이터 기반 및 이상적인 예측 모델 비교

Aug 20 2020

나는 미지의 역학을 가정 한 시스템에 대해 비선형 MPC 컨트롤러를 구현했습니다. 여기서 예측 모델은 다음에 따라 이산 NARX 모델에 의해 제공됩니다.

$$y_{k+1} = f(w_k) = f(x_k, x_{k-1}, y_k, y_{k-1}, y_{k-2})$$

...에 대한 $y_{k+1} \in \mathbb{R}^{1 \times 1}$, 2 개의 입력 지연으로 설명 $x$, 및 3 개의 출력 지연, 표시 $y$. 여기$f(\cdot)$사용 가능한 입력 및 출력 데이터에서 근사치입니다. 결과적으로 다음과 같은 상태 공간 모델이 생성됩니다.

$$x_{k+1} = \begin{bmatrix} y_{k+1} \\ y_{k} \\ y_{k-1} \\ u_{k-1} \end{bmatrix} = \begin{bmatrix} f(w_k) \\ y_{k} \\ y_{k-1} \\ u_{k-1} \end{bmatrix} $$

데이터 기반 MPC 컨트롤러의 성능을 비교하기 위해 ODE를 예측 모델로 사용하는 MPC 컨트롤러와 비교하고 싶습니다. ODE는 다음에 따라 이산화되고 이산 차이 모델로 구현됩니다.

$$z_{k+1} = g(z_k, u_k)$$

어디 $z_{k+1} \in \mathbb{R}^{3 \times 1}$. 예측은 다음을 사용하여 얻습니다.

$$ y_{k+1} = C^{T}z_{k+1}$$

어디 $C = \begin{bmatrix}1 & 0 & 0 \end{bmatrix}$.

이제 정확한 예측 모델을 사용하여 NARX 모델을 공식화해야합니다. 이제 문제는 두 컨트롤러를 가능한 한 비교 가능하게 만들기 위해 정확한 예측 모델을 사용하는 상태 공간 표현이 다음과 같아야하는 것입니다.

$$x_{k+1} = \begin{bmatrix} y_{k+1} \\ y_{k} \\ y_{k-1} \\ u_{k-1} \end{bmatrix} = \begin{bmatrix} C^{T}g(z_k, u_k) \\ y_{k} \\ y_{k-1} \\ u_{k-1} \end{bmatrix} $$

이것은 사실을 고려할 때 의미가 있습니까? $g(z_k, u_k)$ 근사 모델에서와 같이 전체 NARX 상태 벡터에 의존하지 않습니까?

답변

1 unobservable_node Aug 20 2020 at 18:48

두 시나리오 (예 : 데이터 기반 및 모델 기반)에 대해 서로 다른 상태, 출력 및 입력을 갖게됩니다. 즉, 데이터 기반의 경우 MPC 컨트롤러가$\mathcal{D}$ 입력을 생성하는 $u_k$. 여기에 다음 시스템이 있습니다.$$ \begin{array}{ccl} x_{k+1} &=& \left[\begin{array}{c} f(w_k) \\ y_k \\ y_{k-1} \\ u_{k-1} \end{array}\right] \\ y_{k+1} &=& f(w_k). \end{array} $$

모델 기반 시나리오의 경우 MPC 컨트롤러가 $\mathcal{M}$ (같은 구조로 $\mathcal{D}$ 그러나 모델에 의존 함) 입력을 생성하는 $\hat{u}_k$. 여기에서 시스템은 다음과 같습니다.$$ \begin{array}{ccl} \hat{x}_{k+1} &=& \left[\begin{array}{c} C^T z_{k+1} \\ \hat{y}_k \\ \hat{y}_{k-1} \\ \hat{u}_{k-1} \end{array}\right] \\ z_{k+1} &=& g(z_k,\hat{u}_k) \\ \hat{y}_{k+1} &=& C^T z_{k+1}. \end{array} $$

이제 두 컨트롤러가 사용하는 에너지 측면에서 비교할 수 있습니다. $$ \sum_{k=1}^T \|u_k\|_2 \quad \text{vs.} \quad \sum_{k=1}^T \|\hat{u}_k\|_2. $$ 안정화하거나 조절하면 과도 현상을 볼 수 있습니다. $x_k$$\hat{x}_k$