线性二次型调节器 (Linear–quadratic regulator)

基本原理

LQR 的核心思想是通过找到一个反馈控制律,使得系统在满足控制约束的同时,最小化一个给定的性能指标(即成本函数)。成本函数通常包括两部分:状态偏差成本和控制输入成本。状态偏差成本衡量系统状态偏离期望值的程度,控制输入成本则衡量控制输入的能量消耗。

数学模型

对于一个线性时不变系统,其状态空间描述如下:

ẋ(t) = Ax(t) + Bu(t)

其中,x(t) 是状态向量,u(t) 是控制输入向量,A 和 B 是系统矩阵。 LQR 的目标是找到一个控制律 u(t),使得成本函数 J 最小:

J = ∫0 [xT(t)Qx(t) + uT(t)Ru(t)] dt

其中,Q 是状态权重矩阵,R 是控制输入权重矩阵。 Q 和 R 都是半正定矩阵,它们决定了对状态偏差和控制输入能量的惩罚程度。

求解方法

LQR 问题的解决方案通常涉及求解代数 Riccati 方程 (ARE)。ARE 的形式如下:

ATP + PA – PBR-1BTP + Q = 0

其中,P 是一个半正定矩阵,ARE 的解 P 决定了最优反馈增益 K:

K = R-1BTP

最优控制律是:

u(t) = -Kx(t)

这意味着最优控制输入是状态的线性反馈。

应用

LQR 在控制工程领域有广泛的应用,包括:

  • 机器人控制: 用于机器人运动控制、平衡控制等。
  • 飞行器控制: 用于飞机、无人机等飞行器的姿态控制、轨迹跟踪。
  • 过程控制: 用于化工、冶金等过程的优化控制。
  • 经济学: 用于宏观经济政策制定,如货币政策和财政政策的制定。

LQR 的设计过程通常包括:确定系统模型、选择合适的 Q 和 R 矩阵、求解 ARE、计算反馈增益 K、以及进行仿真验证。

优点与局限性

LQR 的主要优点包括:

  • 设计简单: 相对容易实现,因为其解是明确的。
  • 稳定保证: 闭环系统具有稳定性。
  • 性能优化: 可以最小化给定的性能指标。

其局限性在于:

  • 线性假设: 仅适用于线性系统,对于非线性系统需要进行线性化。
  • 二次型成本函数: 成本函数的形式相对固定,可能无法完全反映实际需求。
  • 参数选择: Q 和 R 矩阵的选择对控制性能有很大影响,需要一定的经验。

结论

线性二次型调节器是一种强大的最优控制工具,在各种工程和经济学领域都有广泛的应用。理解其基本原理、数学模型和求解方法对于掌握现代控制理论至关重要。 虽然 LQR 具有其局限性,但其简单性和稳定性保证使其成为许多控制系统设计的首选方法。

参考资料