基础矩阵 (Fundamental Matrix)

极线几何

极线几何是理解基础矩阵的关键。当一个场景被两个或多个相机拍摄时,每个相机都会产生一个图像。一个图像中的一个点,会在另一个图像中对应到一条极线上。极线是连接相机中心与三维场景点的直线的投影,这些投影形成了极线束。极点是相机中心在另一个相机图像上的投影,所有极线都会经过极点。

基础矩阵的数学定义

基础矩阵 F 将一个图像中的点 x 映射到另一个图像中的对应极线 l’ 。对于立体图像中的对应点 xx’ ,它们满足以下关系:

x’T F x = 0

其中, xx’ 分别是两个图像中的对应点,以齐次坐标表示。 这个方程表明,对应点必须满足与基础矩阵相关的约束。基础矩阵包含了相机的内部参数和外部参数的信息。

基础矩阵的计算

计算基础矩阵是计算机视觉中的一个重要问题。通常,可以通过以下步骤来计算基础矩阵:

  • 特征点检测与匹配: 在立体图像中检测并匹配特征点,如SIFT、SURF或ORB。
  • 归一化: 对特征点进行归一化,以提高计算精度。
  • 八点算法: 使用至少八对对应点计算基础矩阵。 这是一种常用的算法,通过解线性方程组来估计基础矩阵。
  • 最小二乘优化: 使用最小二乘法对基础矩阵进行优化,以减少噪声的影响。

基础矩阵的应用

基础矩阵在计算机视觉的许多应用中都发挥着重要作用:

  • 立体视觉: 用于计算场景的三维结构,例如深度图的生成和三维重建。
  • 图像校正: 用于校正立体图像,消除图像的畸变。
  • 相机姿态估计: 用于估计相机在空间中的位置和方向。
  • 物体识别与跟踪: 用于在多个视角下识别和跟踪物体。

基础矩阵与本质矩阵

基础矩阵与本质矩阵密切相关。本质矩阵是基础矩阵在相机内参已知的情况下的特殊形式。本质矩阵描述了相机之间的相对位置和方向,而不需要依赖图像坐标系。 通过相机内参,可以从基础矩阵中推导出本质矩阵。

结论

基础矩阵是计算机视觉中一个至关重要的概念,它为我们理解立体图像的几何关系提供了基础。它在立体视觉、三维重建和相机姿态估计等领域有着广泛的应用,是实现计算机视觉系统的重要组成部分。

参考资料