线性二次型调节器 (Linear–quadratic regulator)

LQR 的核心思想是通过找到一个反馈控制律，使得系统在满足控制约束的同时，最小化一个给定的性能指标（即成本函数）。成本函数通常包括两部分：状态偏差成本和控制输入成本。状态偏差成本衡量系统状态偏离期望值的程度，控制输入成本则衡量控制输入的能量消耗。

对于一个线性时不变系统，其状态空间描述如下：

ẋ(t) = Ax(t) + Bu(t)

其中，x(t) 是状态向量，u(t) 是控制输入向量，A 和 B 是系统矩阵。 LQR 的目标是找到一个控制律 u(t)，使得成本函数 J 最小：

J = ∫₀^∞ [x^T(t)Qx(t) + u^T(t)Ru(t)] dt

其中，Q 是状态权重矩阵，R 是控制输入权重矩阵。 Q 和 R 都是半正定矩阵，它们决定了对状态偏差和控制输入能量的惩罚程度。

LQR 问题的解决方案通常涉及求解代数 Riccati 方程 (ARE)。ARE 的形式如下：

A^TP + PA – PBR^-1B^TP + Q = 0

其中，P 是一个半正定矩阵，ARE 的解 P 决定了最优反馈增益 K：

K = R^-1B^TP

最优控制律是：

u(t) = -Kx(t)

这意味着最优控制输入是状态的线性反馈。

LQR 在控制工程领域有广泛的应用，包括：

LQR 的设计过程通常包括：确定系统模型、选择合适的 Q 和 R 矩阵、求解 ARE、计算反馈增益 K、以及进行仿真验证。

LQR 的主要优点包括：

其局限性在于：

线性二次型调节器是一种强大的最优控制工具，在各种工程和经济学领域都有广泛的应用。理解其基本原理、数学模型和求解方法对于掌握现代控制理论至关重要。虽然 LQR 具有其局限性，但其简单性和稳定性保证使其成为许多控制系统设计的首选方法。