基本原理
LQR 的核心思想是通过找到一个反馈控制律,使得系统在满足控制约束的同时,最小化一个给定的性能指标(即成本函数)。成本函数通常包括两部分:状态偏差成本和控制输入成本。状态偏差成本衡量系统状态偏离期望值的程度,控制输入成本则衡量控制输入的能量消耗。
数学模型
对于一个线性时不变系统,其状态空间描述如下:
ẋ(t) = Ax(t) + Bu(t)
其中,x(t) 是状态向量,u(t) 是控制输入向量,A 和 B 是系统矩阵。 LQR 的目标是找到一个控制律 u(t),使得成本函数 J 最小:
J = ∫0∞ [xT(t)Qx(t) + uT(t)Ru(t)] dt
其中,Q 是状态权重矩阵,R 是控制输入权重矩阵。 Q 和 R 都是半正定矩阵,它们决定了对状态偏差和控制输入能量的惩罚程度。
求解方法
LQR 问题的解决方案通常涉及求解代数 Riccati 方程 (ARE)。ARE 的形式如下:
ATP + PA – PBR-1BTP + Q = 0
其中,P 是一个半正定矩阵,ARE 的解 P 决定了最优反馈增益 K:
K = R-1BTP
最优控制律是:
u(t) = -Kx(t)
这意味着最优控制输入是状态的线性反馈。
应用
LQR 在控制工程领域有广泛的应用,包括:
- 机器人控制: 用于机器人运动控制、平衡控制等。
- 飞行器控制: 用于飞机、无人机等飞行器的姿态控制、轨迹跟踪。
- 过程控制: 用于化工、冶金等过程的优化控制。
- 经济学: 用于宏观经济政策制定,如货币政策和财政政策的制定。
LQR 的设计过程通常包括:确定系统模型、选择合适的 Q 和 R 矩阵、求解 ARE、计算反馈增益 K、以及进行仿真验证。
优点与局限性
LQR 的主要优点包括:
- 设计简单: 相对容易实现,因为其解是明确的。
- 稳定保证: 闭环系统具有稳定性。
- 性能优化: 可以最小化给定的性能指标。
其局限性在于:
- 线性假设: 仅适用于线性系统,对于非线性系统需要进行线性化。
- 二次型成本函数: 成本函数的形式相对固定,可能无法完全反映实际需求。
- 参数选择: Q 和 R 矩阵的选择对控制性能有很大影响,需要一定的经验。
结论
线性二次型调节器是一种强大的最优控制工具,在各种工程和经济学领域都有广泛的应用。理解其基本原理、数学模型和求解方法对于掌握现代控制理论至关重要。 虽然 LQR 具有其局限性,但其简单性和稳定性保证使其成为许多控制系统设计的首选方法。