6. 状态反馈与极点配置
6.1 问题的提出
对于线性时不变系统:
$$\begin{aligned} \dot{x} &= Ax + Bu \\ y &= Cx + Du \end{aligned} $$
开环控制的局限性:无法改变系统动态特性(极点固定,由A矩阵的特征值决定)。
状态反馈控制:
$$u = -Kx + v $$
其中 $K \in \mathbb{R}^{m \times n}$ 是反馈增益矩阵,$v$ 是参考输入。
闭环系统:
$$\dot{x} = (A - BK)x + Bv $$
核心问题:如何选择反馈增益矩阵 $K$,使闭环系统具有期望的极点(特征值)?
6.2 极点配置定理
定理:系统可通过状态反馈任意配置全部极点的充要条件是系统完全能控。
- 完全能控:能控性矩阵 $\mathcal{C} = [B \ AB \ A^2B \ \cdots \ A^{n-1}B]$ 满秩(秩为 $n$)
- 如果不能控,则不能控模态的极点无法通过状态反馈改变
- 能控性保证了我们可以通过状态反馈"移动"所有极点
6.3 极点配置方法
6.3.1 方法一:变换法(适用于单输入系统)
步骤:
- 将系统变换为能控标准型
- 根据期望特征多项式确定反馈增益
- 反变换回原坐标系
具体推导:
设系统 $(A, B)$ 能控,期望闭环极点为 $\lambda_1^d, \lambda_2^d, \dots, \lambda_n^d$,对应的期望特征多项式为:
$$\alpha^d(s) = s^n + \alpha_1 s^{n-1} + \cdots + \alpha_{n-1}s + \alpha_n = \prod_{i=1}^n (s - \lambda_i^d) $$
存在变换矩阵 $T$ 将系统化为能控标准型:
$$\bar{A} = T^{-1}AT = \begin{bmatrix} 0 & 1 & 0 & \cdots & 0 \\ 0 & 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & 1 \\ -a_0 & -a_1 & -a_2 & \cdots & -a_{n-1} \end{bmatrix}, \quad \bar{B} = T^{-1}B = \begin{bmatrix} 0 \\ 0 \\ \vdots \\ 0 \\ 1 \end{bmatrix} $$
在能控标准型下,状态反馈 $\bar{u} = -\bar{K}\bar{x}$ 的闭环矩阵为:
$$\bar{A} - \bar{B}\bar{K} = \begin{bmatrix} 0 & 1 & 0 & \cdots & 0 \\ 0 & 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & 1 \\ -(a_0 + \bar{k}_1) & -(a_1 + \bar{k}_2) & -(a_2 + \bar{k}_3) & \cdots & -(a_{n-1} + \bar{k}_n) \end{bmatrix} $$
特征多项式为:
$$\det(sI - (\bar{A} - \bar{B}\bar{K})) = s^n + (a_{n-1} + \bar{k}_n)s^{n-1} + \cdots + (a_1 + \bar{k}_2)s + (a_0 + \bar{k}_1) $$
令其等于期望多项式:
$$\bar{K} = [\alpha_n - a_0, \ \alpha_{n-1} - a_1, \ \cdots, \ \alpha_1 - a_{n-1}] $$
最后反变换回原坐标系:
$$K = \bar{K} T^{-1} $$
6.3.2 方法二:Ackermann公式
对于单输入系统,有简洁的Ackermann公式:
$$\boxed{K = [0 \ 0 \ \cdots \ 0 \ 1] \cdot \mathcal{C}^{-1} \cdot \alpha^d(A)} $$
其中:
- $\mathcal{C} = [B \ AB \ A^2B \ \cdots \ A^{n-1}B]$ 是能控性矩阵
- $\alpha^d(A) = A^n + \alpha_1 A^{n-1} + \cdots + \alpha_{n-1}A + \alpha_n I$ 是期望特征多项式在 $A$ 处的值
推导思路:Ackermann公式实际上是将变换法和凯莱-哈密顿定理结合起来的结果,避免了显式求取变换矩阵 $T$。
6.3.3 方法三:MATLAB实现
1 | % 单输入系统(避免重复极点) |
其中 $P$ 是期望极点向量。
注意事项:
place函数可以处理多输入系统和重复极点acker只适用于单输入系统,且极点不能重复- 数值稳定性:
place使用稳健的算法,对病态问题更鲁棒
6.4 多输入系统的极点配置
对于多输入系统 $(m > 1)$,极点配置问题更复杂:
6.4.1 问题的特殊性
- 解不唯一(自由度更多)
- 可选择自由度用于优化其他性能指标
- 可能存在数值敏感性问题
6.4.2 方法分类
-
直接法:将多输入问题转化为单输入问题
- 选择方向向量 $w$,令 $u = -wKx$
- 转化为单输入问题配置极点
- 调整 $w$ 改善数值特性
-
循环法:利用循环矩阵的性质
- 找到使 $(A, B)$ 能控的循环化增益
- 转化为单输入极点配置
-
特征结构配置:同时配置极点和特征向量
- 提供更多设计自由度
- 可影响系统暂态响应
6.4.3 参数化方法
对于多输入系统,极点配置解可参数化为:
$$K = K_0 + K_1 F $$
其中 $K_0$ 是特解,$K_1$ 的列构成零空间的一组基,$F$ 是自由参数矩阵。自由参数可用于:
- 最小化控制能量
- 改善鲁棒性
- 优化暂态响应
6.5 极点选择原则
6.5.1 主导极点概念
高阶系统的响应通常由主导极点决定:
- 主导极点:离虚轴最近(实部绝对值最小)且附近无零点的极点
- 非主导极点:离虚轴远(实部绝对值至少是主导极点的5倍以上)
- 偶极子:距离很近的极点和零点,相互抵消影响
6.5.2 选择准则
-
稳定性要求:
- 所有极点实部 < 0(连续系统)
- 阻尼比 $\zeta > 0$(通常 $0.4 \leq \zeta \leq 0.8$)
-
响应速度:
- 极点离虚轴越远,响应越快
- 但控制能量需求越大
- 受执行器饱和限制
-
阻尼特性:
- $\zeta \approx 0.7$ 时超调量适中(约5%)
- $\zeta$ 过小 → 振荡严重
- $\zeta$ 过大 → 响应迟钝
-
自然频率:
- $\omega_n$ 决定响应带宽
- 受系统带宽限制
- 考虑传感器噪声
6.5.3 工程经验公式
对于二阶系统近似:
| 性能指标 | 关系式 | 典型值 |
|---|---|---|
| 超调量 $M_p$ | $M_p = e^{-\pi\zeta/\sqrt{1-\zeta^2}}$ | 5%~25% |
| 峰值时间 $t_p$ | $t_p = \pi/(\omega_n\sqrt{1-\zeta^2})$ | 设计决定 |
| 调节时间 $t_s$ | $t_s \approx 4/(\zeta\omega_n)$ (2%准则) | 设计决定 |
| 上升时间 $t_r$ | $t_r \approx 1.8/\omega_n$ | 设计决定 |
6.6 状态反馈的其他性质
6.6.1 能稳性
如果系统不完全能控,但不能控部分稳定,则系统称为能稳的:
- 能稳 ⇔ 不能控模态全部渐近稳定
- 对于能稳系统,可设计状态反馈使闭环系统稳定(尽管不能任意配置极点)
6.6.2 跟踪问题与积分作用
为消除稳态误差,引入积分作用:
$$\dot{x}_I = r - y = r - Cx $$
增广系统:
$$\begin{bmatrix} \dot{x} \\ \dot{x}_I \end{bmatrix} = \begin{bmatrix} A & 0 \\ -C & 0 \end{bmatrix} \begin{bmatrix} x \\ x_I \end{bmatrix} + \begin{bmatrix} B \\ 0 \end{bmatrix} u + \begin{bmatrix} 0 \\ I \end{bmatrix} r $$
控制律:
$$u = -[K \ K_I] \begin{bmatrix} x \\ x_I \end{bmatrix} $$
6.6.3 状态反馈与输出反馈
- 状态反馈:需要全部状态,性能好,但实现成本高
- 输出反馈:$u = -Ky$,实现简单,但性能受限
- 动态输出反馈:引入补偿器,折衷方案
6.7 数值考虑与实现问题
6.7.1 病态问题
当系统接近不可控时,极点配置可能产生很大的增益:
- 条件数很大的能控性矩阵
- 增益矩阵元素数量级差异大
- 对参数摄动敏感
6.7.2 增益幅值限制
实际实现中需考虑:
- 执行器饱和:$u_{\min} \leq u \leq u_{\max}$
- 避免过大的控制信号
- 可在设计中加入约束
6.7.3 鲁棒性考虑
- 精确极点配置可能对模型误差敏感
- 考虑将极点配置在"区域"而非精确点
- 结合鲁棒控制方法
7. 状态观测器设计
7.1 为什么需要观测器?
现实困境:状态反馈需要全部状态,但实际中:
- 部分状态无法直接测量(物理限制、成本因素)
- 测量存在噪声(传感器噪声)
- 某些状态是抽象的数学变量(无物理对应)
解决方案:通过可测量的输入输出重构状态 → 状态观测器
7.2 观测器的基本思想
7.2.1 开环观测器
最直接的思路:用模型进行开环仿真
$$\dot{\hat{x}} = A\hat{x} + Bu $$
问题:
- 初始误差 $\hat{x}(0) \neq x(0)$ 无法消除
- 模型误差、扰动导致估计偏差累积
- 误差动态:$\dot{e} = Ae$,若 $A$ 不稳定则误差发散
7.2.2 闭环观测器(龙伯格观测器)
引入输出误差反馈修正:
$$\dot{\hat{x}} = A\hat{x} + Bu + L(y - C\hat{x}) $$
其中 $L \in \mathbb{R}^{n \times p}$ 是观测器增益矩阵。
结构特点:
- 模型部分:$A\hat{x} + Bu$(开环预测)
- 修正部分:$L(y - C\hat{x})$(利用输出误差反馈)
7.3 观测器误差分析
定义观测误差:$e = x - \hat{x}$
误差动态方程:
$$\begin{aligned} \dot{e} &= \dot{x} - \dot{\hat{x}} \\ &= (Ax + Bu) - [A\hat{x} + Bu + L(Cx - C\hat{x})] \\ &= A(x - \hat{x}) - LC(x - \hat{x}) \\ &= (A - LC)e \end{aligned} $$
关键结论:
- 误差动态是齐次线性系统 $\dot{e} = (A - LC)e$
- 通过选择 $L$ 使 $A - LC$ 的特征值具有负实部
- 误差渐近收敛到零:$\lim_{t \to \infty} e(t) = 0$
- 收敛速度由 $(A - LC)$ 的特征值决定
7.4 对偶原理
对偶原理:观测器设计问题 ⇔ 对偶系统的状态反馈问题
对偶系统定义:
$$\begin{aligned} \dot{z} &= A^T z + C^T v \\ w &= B^T z \end{aligned} $$
核心对应关系:
| 原系统(观测器设计) | 对偶系统(状态反馈设计) |
|---|---|
| 矩阵 $A$ | 矩阵 $A^T$ |
| 矩阵 $C$(输出) | 矩阵 $B^T$(输入) |
| 观测器增益 $L$ | 反馈增益 $L^T$ |
| 需配置 $A-LC$ 的极点 | 需配置 $A^T - C^T L^T$ 的极点 |
重要推论:
- 原系统能观 ⇔ 对偶系统能控
- 若原系统能观,则可通过极点配置对偶系统得到观测器增益:
$$L^T = \text{place}(A^T, C^T, P_{\text{obs}}) $$
即:$$L = \text{place}(A^T, C^T, P_{\text{obs}})^T $$
7.5 观测器存在条件
定理:系统存在渐近观测器的充要条件是系统完全能观。
- 完全能观:能观性矩阵 $\mathcal{O} = [C^T \ (CA)^T \ (CA^2)^T \ \cdots \ (CA^{n-1})^T]^T$ 满秩
- 观测器极点可任意配置 ⇔ 完全能观
- 若系统不完全能观但不能观部分稳定,则存在能检测性质,可设计观测器使误差收敛
7.6 观测器极点选择
7.6.1 基本原则
观测器的动态特性由 $A-LC$ 的特征值决定:
- 极点越负 → 收敛越快,但对噪声敏感
- 极点靠近原点 → 收敛慢,但滤波效果好
- 需在收敛速度与噪声抑制间权衡
7.6.2 工程经验准则
-
比控制器快3-10倍:
- 一般取观测器极点实部绝对值 = (3~5) × 控制器极点实部绝对值
- 确保观测误差快速收敛,不影响闭环性能
- 满足分离原理的应用条件
-
避免过快的观测器:
- 观测器带宽过高会放大测量噪声
- 可能激发未建模高频动态
- 一般不超过传感器带宽
-
考虑离散实现:
- 采样周期 $T_s$ 限制观测器带宽
- 观测器极点应满足采样定理
7.6.3 最优观测器:卡尔曼滤波
在随机噪声环境下,卡尔曼滤波器是最优观测器:
$$L = PC^T R^{-1} $$
其中 $P$ 满足 Riccati 方程:
$$AP + PA^T + Q - PC^T R^{-1} CP = 0 $$
- $Q$:过程噪声协方差
- $R$:测量噪声协方差
- 平衡模型不确定性与测量噪声
7.7 降维观测器
7.7.1 基本思想
当部分状态可直接测量时,只需估计不可测状态:
- 设可测状态 $x_1 \in \mathbb{R}^{n_1}$,不可测状态 $x_2 \in \mathbb{R}^{n_2}$,$n_1 + n_2 = n$
- 输出 $y = x_1$(经坐标变换后)
7.7.2 系统分解
将系统按可测/不可测分块:
$$\begin{bmatrix} \dot{x}_1 \\ \dot{x}_2 \end{bmatrix} = \begin{bmatrix} A_{11} & A_{12} \\ A_{21} & A_{22} \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \end{bmatrix} + \begin{bmatrix} B_1 \\ B_2 \end{bmatrix} u $$
$$y = \begin{bmatrix} I & 0 \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \end{bmatrix} $$
7.7.3 降维观测器设计
定义辅助变量 $z = x_2 - L y$,可构造 $n_2$ 维观测器:
$$\dot{z} = (A_{22} - L A_{12}) z + (A_{21} - L A_{11}) y + (B_2 - L B_1) u $$
$$\hat{x}_2 = z + L y $$
优点:
- 维数更低($n_2 < n$)
- 计算量小
- 收敛可能更快
缺点:
- 对测量噪声敏感(直接使用 $y$ 的微分?需注意实现)
- 需要可测状态品质好
7.8 观测器的其他形式
7.8.1 函数观测器
不是重构全部状态,而是重构状态的线性组合 $z = Kx$:
- 维数可能更低
- 直接用于反馈控制
7.8.2 未知输入观测器
同时估计状态和未知扰动:
$$\dot{\hat{x}} = A\hat{x} + Bu + L(y - C\hat{x}) + F\hat{d} $$
可处理:
- 系统扰动
- 模型不确定性
- 故障检测与诊断
7.8.3 自适应观测器
在线估计系统参数:
$$\dot{\hat{x}} = A(\hat{\theta})\hat{x} + B(\hat{\theta})u + L(y - C\hat{x}) $$
$$\dot{\hat{\theta}} = \Gamma \cdot \text{(某种自适应律)} $$
7.9 离散时间观测器
7.9.1 离散系统模型
离散系统:
$$x[k+1] = A_d x[k] + B_d u[k] $$
$$y[k] = C_d x[k] $$
7.9.2 预测观测器
$$\hat{x}[k+1] = A_d \hat{x}[k] + B_d u[k] + L_p (y[k] - C_d \hat{x}[k]) $$
特点:
- 当前估计基于上一时刻测量
- 存在一步延迟
- 适用于控制律计算需要提前量的场合
7.9.3 当前观测器
$$\hat{x}[k] = A_d \hat{x}[k-1] + B_d u[k-1] + L_c (y[k] - C_d(A_d \hat{x}[k-1] + B_d u[k-1])) $$
特点:
- 使用当前测量更新当前估计
- 无延迟
- 计算量稍大
7.9.4 离散观测器设计
通过对偶原理,将连续极点映射到离散域:
- 期望连续极点 $s = -\alpha \pm j\beta$
- 对应离散极点 $z = e^{sT_s}$
- 用
place或acker设计离散增益
8. 基于观测器的反馈与分离原理
8.1 组合系统结构
在实际控制系统中,我们往往:
- 无法直接测量全部状态 → 使用观测器估计状态
- 用估计状态代替真实状态进行反馈 → $u = -K\hat{x} + v$
组合系统结构:
1 | v(t) ┌───┐ u(t) ┌─────────┐ y(t) |
8.2 闭环系统动态分析
8.2.1 状态方程
实际系统:
$$\dot{x} = Ax + Bu = Ax - BK\hat{x} + Bv $$
观测器:
$$\dot{\hat{x}} = A\hat{x} + Bu + L(y - C\hat{x}) = (A - BK - LC)\hat{x} + Ly + Bv $$
8.2.2 引入观测误差
定义观测误差 $e = x - \hat{x}$,则:
$$\hat{x} = x - e $$
代入系统方程:
$$\dot{x} = Ax - BK(x - e) + Bv = (A - BK)x + BKe + Bv $$
误差动态(前面已推导):
$$\dot{e} = (A - LC)e $$
8.2.3 组合系统状态空间描述
以 $[x; e]$ 为状态:
$$\begin{bmatrix} \dot{x} \\ \dot{e} \end{bmatrix} = \begin{bmatrix} A - BK & BK \\ 0 & A - LC \end{bmatrix} \begin{bmatrix} x \\ e \end{bmatrix} + \begin{bmatrix} B \\ 0 \end{bmatrix} v $$
$$y = \begin{bmatrix} C & 0 \end{bmatrix} \begin{bmatrix} x \\ e \end{bmatrix} $$
8.3 分离原理(核心定理)
分离原理:闭环系统的特征多项式等于状态反馈部分特征多项式与观测器部分特征多项式的乘积:
$$\det\begin{bmatrix} sI - (A - BK) & -BK \\ 0 & sI - (A - LC) \end{bmatrix} = \det(sI - (A - BK)) \cdot \det(sI - (A - LC)) $$
重要推论:
- 闭环系统特征值 = $(A-BK)$ 的特征值 ∪ $(A-LC)$ 的特征值
- 控制器设计(极点配置)与观测器设计可以独立进行
- 两者合并后,系统稳定性不受影响
- 大大简化设计复杂度
证明思路:由于组合系统矩阵是块下三角阵,其特征值即为对角块特征值的并集。
8.4 分离原理的意义
8.4.1 设计解耦
-
第一步:假设全状态反馈,设计 $K$ 使 $A-BK$ 具有期望极点
- 只考虑控制性能(响应速度、阻尼、稳态精度)
- 不考虑状态是否可测
-
第二步:独立设计观测器,选择 $L$ 使 $A-LC$ 具有期望极点
- 只考虑估计性能(收敛速度、噪声抑制)
- 通常取观测器极点比控制器极点快3-10倍
-
第三步:组合实现,得到基于观测器的输出反馈控制律
- 保证整体稳定性
- 整体性能接近全状态反馈
8.4.2 性能损失分析
虽然分离原理保证稳定性,但基于观测器的反馈与全状态反馈相比:
-
暂态性能差异:
- 初始时刻:$\hat{x}(0) \neq x(0)$,控制不是最优的
- 过渡过程:观测器收敛过程中控制性能受影响
- 最终性能:当 $e \to 0$ 时,趋近全状态反馈性能
-
鲁棒性差异:
- 全状态反馈对模型误差有一定鲁棒性
- 基于观测器的反馈对模型误差更敏感(观测器依赖模型)
- 回路传输恢复技术可改善
-
频域解释:
- 观测器引入额外动态($n$ 阶)
- 相当于在反馈回路中串联了观测器传递函数
- 可能改变回路增益和相位裕度
8.5 回路传输恢复(LTR)
8.5.1 问题的提出
基于观测器的反馈可能降低系统的鲁棒性:
- 全状态反馈具有好的增益裕度和相位裕度
- 引入观测器后,这些裕度可能减小
8.5.2 LTR技术思想
通过在观测器设计中恢复全状态反馈的回路传输特性:
- 方法一:在观测器设计时,使 $L$ 很大(高增益观测器)
- 方法二:在控制器设计时,预补偿使回路特性接近目标
8.5.3 数学条件
回路传输恢复的条件:
- 系统最小相位(零点在左半平面)
- 相对阶 ≤ 2
- 观测器增益选择满足渐近性质
8.6 基于观测器的输出反馈设计步骤
8.6.1 标准设计流程
graph TD
A[系统建模与验证] --> B[能控性能观性检查]
B --> C[控制器设计K]
B --> D[观测器设计L]
C --> E[组合系统分析]
D --> E
E --> F[仿真验证]
F --> G{性能满足?}
G -->|是| H[离散化与实现]
G -->|否| C
H --> I[硬件在环测试]
8.6.2 设计参数选择
-
控制器极点:
- 根据性能指标(超调、调节时间)确定
- 考虑执行器限制
-
观测器极点:
- 比控制器极点快3-10倍
- 考虑噪声水平
- 不超过传感器带宽
-
初始状态:
- 观测器初值通常设为0
- 有先验信息时可设置更佳初值
8.7 数值例子
8.7.1 系统描述
考虑倒立摆系统(线性化模型):
$$A = \begin{bmatrix} 0 & 1 \\ 10 & 0 \end{bmatrix}, \quad B = \begin{bmatrix} 0 \\ 1 \end{bmatrix}, \quad C = \begin{bmatrix} 1 & 0 \end{bmatrix} $$
- 状态:$x_1$ 为角度,$x_2$ 为角速度
- 输出:仅测量角度 $x_1$
8.7.2 控制器设计
期望闭环极点:$-2 \pm 2j$(阻尼比 0.707,自然频率 2.828 rad/s)
1 | K = acker(A, B, [-2+2j, -2-2j]) |
验证:$A-BK$ 特征值为 -2.0000 ± 2.0000i
8.7.3 观测器设计
取观测器极点比控制器快5倍:$-10, -10$
1 | L = acker(A', C', [-10, -10])' |
验证:$A-LC$ 特征值为 -10.0000, -10.0000
8.7.4 组合系统仿真
初始条件:$x(0) = [0.1; 0]$,$\hat{x}(0) = [0; 0]$
结果分析:
- 观测误差 $e(t)$ 快速收敛(约0.5秒)
- 系统状态 $x(t)$ 收敛到0(约3秒)
- 初期控制有偏差,后接近全状态反馈性能
8.8 工程实现考虑
8.8.1 抗积分饱和
当观测器与积分器结合时:
- 执行器饱和时停止积分
- 避免积分器深度饱和(windup)
8.8.2 数值稳定性
- 使用平衡实现改善数值条件
- 避免过大的增益矩阵
- 考虑使用平方根算法
8.8.3 故障处理
- 监测观测器残差 $y - C\hat{x}$
- 残差异常指示传感器故障或系统异常
- 可实现故障检测与隔离
9. 最优控制(LQR)
9.1 最优控制问题的提出
之前的极点配置方法虽然能任意配置极点,但存在以下问题:
- 极点位置选择具有随意性
- 未考虑控制能量消耗
- 难以在多目标间权衡
最优控制:在给定系统动态和约束下,寻找使某个性能指标最小的控制律。
9.2 LQR问题描述
9.2.1 连续时间LQR
考虑线性时不变系统:
$$\dot{x} = Ax + Bu, \quad x(0) = x_0 $$
寻找控制 $u(t)$ 最小化二次型性能指标:
$$J = \int_0^\infty \left[ x^T(t) Q x(t) + u^T(t) R u(t) \right] dt $$
其中:
- $Q = Q^T \geq 0$:状态加权矩阵(半正定)
- $R = R^T > 0$:控制加权矩阵(正定)
9.2.2 性能指标的物理意义
-
$x^T Q x$:衡量状态偏离0的程度
- 对角线元素:相应状态的权重
- 非对角线元素:状态间的耦合惩罚
- 常取 $Q = \text{diag}(q_1, q_2, \dots)$
-
$u^T R u$:衡量控制能量消耗
- $R$ 大 → 控制代价高 → 控制作用小
- $R$ 小 → 控制代价低 → 控制作用大
-
折衷权衡:$Q$ 和 $R$ 的相对大小决定状态精度与控制能量的平衡
9.3 LQR问题的解
9.3.1 代数Riccati方程
LQR问题的解由**代数Riccati方程(ARE)**给出:
$$\boxed{A^T P + P A - P B R^{-1} B^T P + Q = 0} $$
其中 $P = P^T \geq 0$ 是 Riccati 方程的唯一半正定解。
9.3.2 最优控制律
最优状态反馈控制律为:
$$\boxed{u(t) = -K x(t), \quad K = R^{-1} B^T P} $$
9.3.3 最优性能值
在最优控制下的性能指标为:
$$J_{\min} = x_0^T P x_0 $$
9.4 代数Riccati方程的求解
9.4.1 解析方法(小系统)
对于低阶系统,可解 ARE 得到 $P$ 的解析表达式。
例:二阶系统
$$A = \begin{bmatrix} 0 & 1 \\ 0 & 0 \end{bmatrix}, \quad B = \begin{bmatrix} 0 \\ 1 \end{bmatrix}, \quad Q = \begin{bmatrix} q_{11} & 0 \\ 0 & q_{22} \end{bmatrix}, \quad R = r $$
设 $P = \begin{bmatrix} p_{11} & p_{12} \\ p_{12} & p_{22} \end{bmatrix}$,代入 ARE 求解方程组。
9.4.2 数值方法
方法一:特征向量法
构造 Hamilton 矩阵:
$$H = \begin{bmatrix} A & -B R^{-1} B^T \\ -Q & -A^T \end{bmatrix} $$
- $H$ 的特征值对称分布于虚轴两侧
- 取稳定特征值对应的特征向量构造 $P$
方法二:迭代法
- Schur 方法(最常用)
- Newton 方法
- 符号函数法
方法三:MATLAB实现
1 | [K, P, e] = lqr(A, B, Q, R) |
9.5 LQR的性质
9.5.1 稳定性
定理:若 $(A, B)$ 能稳,$(A, Q^{1/2})$ 能检测,则 LQR 设计的闭环系统:
$$\dot{x} = (A - BK)x $$
是渐近稳定的。
- 能稳保证存在使系统稳定的反馈
- 能检测保证不可观模态稳定(若 $Q$ 选择使得不可观模态被加权)
- 实际中通常选择 $Q > 0$ 保证能检测
9.5.2 鲁棒性
LQR 具有优良的鲁棒性:
-
增益裕度:$[1/2, \infty)$
- 可在 -6dB 到 +∞ 的增益变化下保持稳定
-
相位裕度:≥ 60°
- 单输入系统至少 60° 相位裕度
- 多输入系统也有保证
-
同时损坏:可容忍多个通道同时的增益/相位变化
9.5.3 最优性与 Lyapunov 函数
- $V(x) = x^T P x$ 是闭环系统的 Lyapunov 函数
- $\dot{V}(x) = -x^T (Q + K^T R K)x < 0$(对 $x \neq 0$)
- 性能指标 $J = \int_0^\infty (\dot{V}) dt = V(x_0)$
9.6 LQR 参数选择指南
9.6.1 Q 矩阵的选择
方法一:Bryson’s Rule
$$Q = \text{diag}\left( \frac{1}{x_{1,\max}^2}, \frac{1}{x_{2,\max}^2}, \dots \right) $$
其中 $x_{i,\max}$ 是状态 $x_i$ 的最大允许偏差。
方法二:输出加权
若关注输出 $y = Cx$,可取 $Q = C^T Q_y C$。
方法三:试凑法
- 增大 $Q$ 对应状态 → 更快的响应,但控制更大
- 对角线占优简化设计
9.6.2 R 矩阵的选择
- 单输入:$R$ 是标量,调节控制力度
- 多输入:权衡各控制通道的代价
- Bryson’s Rule:$R = \text{diag}\left( \frac{1}{u_{1,\max}^2}, \dots \right)$
9.6.3 闭环极点与 LQR
LQR 得到的闭环极点满足根轨迹性质:
- 随着 $1/\rho$ 变化($R = \rho I$),闭环极点从开环极点($\rho \to \infty$)趋向于开环零点($\rho \to 0$)
- 形成 LQR 根轨迹(对称于实轴)
- 所有闭环极点位于左半平面特定区域内
9.7 离散时间 LQR
9.7.1 问题描述
离散系统:
$$x[k+1] = A_d x[k] + B_d u[k], \quad x[0] = x_0 $$
性能指标:
$$J = \sum_{k=0}^{\infty} \left[ x^T[k] Q x[k] + u^T[k] R u[k] \right] $$
9.7.2 离散 Riccati 方程
$$P = A_d^T P A_d - A_d^T P B_d (R + B_d^T P B_d)^{-1} B_d^T P A_d + Q $$
最优控制:
$$u[k] = -K x[k], \quad K = (R + B_d^T P B_d)^{-1} B_d^T P A_d $$
9.7.3 MATLAB实现
1 | [K, P, e] = dlqr(A_d, B_d, Q, R) |
9.8 输出反馈与 LQG
9.8.1 LQG 问题
LQR + Kalman 滤波器 = LQG(Linear Quadratic Gaussian)控制
系统模型:
$$\begin{aligned} \dot{x} &= Ax + Bu + w \\ y &= Cx + Du + v \end{aligned} $$
其中 $w$ 和 $v$ 是零均值高斯白噪声,协方差分别为 $W \geq 0$ 和 $V > 0$。
9.8.2 分离原理
LQG 控制器由两部分组成:
- Kalman 滤波器:估计状态 $\hat{x}$
- LQR 控制器:$u = -K\hat{x}$
分离原理同样成立:
- 控制器设计基于确定性 LQR
- 滤波器设计基于随机估计理论
- 可独立设计
9.8.3 代数 Riccati 方程对
控制器 Riccati 方程:
$$A^T P + P A - P B R^{-1} B^T P + Q = 0 $$
滤波器 Riccati 方程:
$$A \Sigma + \Sigma A^T - \Sigma C^T V^{-1} C \Sigma + W = 0 $$
Kalman 增益:
$$L = \Sigma C^T V^{-1} $$
9.9 LQR 扩展与变体
9.9.1 有限时间 LQR
性能指标在有限时间 $[0, T]$ 上:
$$J = x^T(T) F x(T) + \int_0^T \left[ x^T Q x + u^T R u \right] dt $$
解为时变反馈 $K(t)$,由微分 Riccati 方程给出:
$$-\dot{P} = A^T P + P A - P B R^{-1} B^T P + Q, \quad P(T) = F $$
9.9.2 跟踪问题
使输出 $y = Cx$ 跟踪参考信号 $r(t)$:
$$u = -Kx + K_r r $$
其中 $K_r$ 通过前馈补偿设计。
9.9.3 带积分作用的 LQR
引入积分状态消除稳态误差:
$$\dot{x}_I = r - y = r - Cx $$
增广系统设计 LQR。
10. 鲁棒控制(H∞)初步
10.1 为什么要鲁棒控制?
10.1.1 实际系统的挑战
-
模型不确定性:
- 建模误差
- 参数摄动
- 未建模动态
-
外部扰动:
- 环境干扰
- 负载变化
- 测量噪声
-
传统控制的局限性:
- LQR/LQG 假设精确模型
- 极点配置对模型误差敏感
- 性能可能严重下降
10.1.2 鲁棒控制的目标
设计控制器使系统在模型不确定和外部扰动下:
- 鲁棒稳定性:对一定范围内的不确定性保持稳定
- 鲁棒性能:满足给定的性能指标
10.2 H∞ 范数与系统增益
10.2.1 H∞ 范数定义
对于稳定系统 $G(s)$,其 H∞ 范数定义为:
$$\|G(s)\|_\infty = \sup_{\omega \in \mathbb{R}} \bar{\sigma}(G(j\omega)) $$
其中 $\bar{\sigma}(\cdot)$ 表示最大奇异值。
物理意义:
- 系统频率响应的最大增益
- 最坏情况下的能量放大倍数
- 输入输出 $L_2$ 增益
10.2.2 H∞ 范数的计算
对于状态空间实现 $(A, B, C, D)$:
$$\|G\|_\infty < \gamma \iff H \text{ 无纯虚特征值} $$
其中 $H$ 是 Hamilton 矩阵:
$$H = \begin{bmatrix} A + B R^{-1} D^T C & B R^{-1} B^T \\ -C^T (I + D R^{-1} D^T) C & -(A + B R^{-1} D^T C)^T \end{bmatrix} $$
$R = \gamma^2 I - D^T D$。
10.2.3 小增益定理
小增益定理:考虑两个稳定系统 $G_1(s)$ 和 $G_2(s)$ 的反馈连接,如果:
$$\|G_1\|_\infty \cdot \|G_2\|_\infty < 1 $$
则闭环系统稳定。
这是鲁棒控制的理论基础。
10.3 标准 H∞ 控制问题
10.3.1 问题描述
考虑广义被控对象:
$$\begin{bmatrix} z \\ y \end{bmatrix} = P(s) \begin{bmatrix} w \\ u \end{bmatrix} = \begin{bmatrix} P_{11}(s) & P_{12}(s) \\ P_{21}(s) & P_{22}(s) \end{bmatrix} \begin{bmatrix} w \\ u \end{bmatrix} $$
其中:
- $w$:外部输入(参考、扰动、噪声)
- $u$:控制输入
- $z$:被控输出(性能指标)
- $y$:测量输出
设计控制器 $u = K(s) y$,使闭环系统稳定且:
$$\|T_{zw}(s)\|_\infty < \gamma $$
其中 $T_{zw}$ 是从 $w$ 到 $z$ 的闭环传递函数。
10.3.2 H∞ 最优控制问题
寻找最小 $\gamma$ 使得存在控制器满足 $\|T_{zw}\|_\infty < \gamma$:
$$\gamma_{\min} = \inf_{K \text{ stabilizing}} \|T_{zw}\|_\infty $$
10.3.3 H∞ 次优控制问题
给定 $\gamma > \gamma_{\min}$,寻找控制器使 $\|T_{zw}\|_\infty < \gamma$。
10.4 H∞ 控制的解
10.4.1 状态空间解(DGKF论文,1989)
假设:
- $(A, B_2)$ 能稳
- $(A, C_2)$ 能检
- $D_{12}^T [C_1 \ D_{12}] = [0 \ I]$
- $\begin{bmatrix} B_1 \\ D_{21} \end{bmatrix} D_{21}^T = \begin{bmatrix} 0 \\ I \end{bmatrix}$
两个 Riccati 方程:
控制器 Riccati 方程:
$$A^T X + X A + X(\gamma^{-2} B_1 B_1^T - B_2 B_2^T)X + C_1^T C_1 = 0 $$
滤波器 Riccati 方程:
$$A Y + Y A^T + Y(\gamma^{-2} C_1^T C_1 - C_2^T C_2)Y + B_1 B_1^T = 0 $$
可解条件:
- $X \geq 0$,$Y \geq 0$
- $\rho(XY) < \gamma^2$(谱半径条件)
10.4.2 中心控制器
$$K(s) = \begin{bmatrix} A_\infty & -Z_\infty L_\infty \\ F_\infty & 0 \end{bmatrix} $$
其中:
- $A_\infty = A + \gamma^{-2} B_1 B_1^T X + B_2 F_\infty + Z_\infty L_\infty C_2$
- $F_\infty = -B_2^T X$
- $L_\infty = -Y C_2^T$
- $Z_\infty = (I - \gamma^{-2} Y X)^{-1}$
10.4.3 MATLAB 实现
1 | [K, CL, gamma] = hinfsyn(P, nmeas, ncont) |
10.5 混合灵敏度问题
10.5.1 灵敏度函数
考虑标准反馈系统:
-
灵敏度函数:$S = (I + GK)^{-1}$
- 衡量扰动抑制能力
- 低频段要求 $S$ 小
-
补灵敏度函数:$T = GK(I + GK)^{-1} = I - S$
- 衡量鲁棒稳定性
- 高频段要求 $T$ 小
10.5.2 混合灵敏度指标
$$\left\| \begin{bmatrix} W_S S \\ W_T T \end{bmatrix} \right\|_\infty < 1 $$
其中 $W_S$ 和 $W_T$ 是加权函数:
- $W_S$:在低频大(扰动抑制要求)
- $W_T$:在高频大(鲁棒稳定要求)
10.5.3 加权函数选择
典型形式:
- $W_S(s) = \frac{s/M_S + \omega_B}{s + \omega_B A_S}$
- $W_T(s) = \frac{s + \omega_{BT}/M_T}{A_T s + \omega_{BT}}$
设计原则:
- $W_S$:低频增益高,带宽合适
- $W_T$:高频增益高,滚降低于控制器带宽
- $W_S(j\omega) W_T(j\omega) \approx 1$(冲突约束)
10.6 H∞ 控制的优缺点
10.6.1 优点
- 处理不确定性:系统化处理模型不确定
- 最坏情况设计:保证在最坏扰动下性能
- 多目标优化:可同时考虑多个性能指标
- 成熟理论:有完整的数学基础和求解方法
10.6.2 缺点
- 保守性:可能过于保守(针对最坏情况)
- 控制器阶数高:通常与被控对象阶数相当
- 加权函数选择:需要经验和试凑
- 计算复杂:求解 Riccati 方程或 LMI
10.7 H∞ 控制的扩展
10.7.1 H2/H∞ 混合控制
同时考虑 H2 性能(LQG)和 H∞ 鲁棒性:
$$\min \|T_{zw}\|_2 \quad \text{s.t.} \quad \|T_{zw}\|_\infty < \gamma $$
10.7.2 μ 综合(结构化奇异值)
处理结构不确定性:
- 不确定块对角结构:$\Delta = \text{diag}(\Delta_1, \dots, \Delta_k)$
- 结构化奇异值 $\mu_\Delta(M)$
- D-K 迭代:交替进行 H∞ 设计和尺度变换
10.7.3 时域鲁棒控制
- 积分二次约束(IQC)
- 线性矩阵不等式(LMI)方法
- 耗散系统理论
10.8 H∞ 控制设计实例
10.8.1 问题描述
考虑质量-弹簧-阻尼系统:
$$G(s) = \frac{1}{ms^2 + cs + k} $$
参数:$m=1$,$c=0.1$,$k=1$(标称值)
不确定性:刚度 $k$ 在 $[0.5, 1.5]$ 变化
10.8.2 加权函数选择
1 | % 性能加权(扰动抑制) |
10.8.3 控制器设计
1 | % 构建广义被控对象 |
10.8.4 结果验证
- 检查灵敏度函数:$S$ 在低频小
- 检查补灵敏度函数:$T$ 在高频小
- 参数摄动下稳定性:对 $k \in [0.5, 1.5]$ 稳定
- 时域响应:验证性能
小结:核心知识点回顾
状态反馈与极点配置
- 能控性是任意配置极点的充要条件
- Ackermann公式提供了单输入系统的直接解法
- 极点选择需权衡响应速度、阻尼和控制能量
- 多输入系统有自由度优化其他性能
状态观测器设计
- 能观性是观测器存在的充要条件
- 对偶原理连接观测器设计与极点配置
- 观测器极点通常比控制器快3-10倍
- 降维观测器适用于部分状态可测情况
基于观测器的反馈与分离原理
- 分离原理:控制器和观测器可独立设计
- 组合系统特征值 = 两者特征值的并集
- 保证稳定性,但暂态性能可能受影响
- 回路传输恢复可改善鲁棒性
最优控制(LQR)
- 平衡状态精度与控制能量的权衡
- Riccati方程给出解析解
- 优良的鲁棒性(60°相位裕度,[-6dB,∞)增益裕度)
- LQG扩展到随机系统和输出反馈
鲁棒控制(H∞)初步
- 处理模型不确定性和外部扰动
- H∞范数衡量最坏情况增益
- 小增益定理是理论基础
- 混合灵敏度设计平衡性能与鲁棒性
说些什么吧!