3.1 问题介绍
考虑线性最小二乘问题
x∈Rnmin∥Ax−b∥22,(3.1) 其中 A∈Rm×n,b∈Rm 问题(3.1)的解称为最小二乘解
当 m=n 且 A 非奇异时, 这就是一个线性方程组, 解为 x∗=A−1b ;
当 m>n 时, 约束个数大于未知量个数, 此时我们称问题 (3.1) 为超定的;
当 m<n 时, 未知量个数大于约束个数, 此时我们称问题 (3.1) 为欠定 (或亚定) 的.
为了讨论方便,本讲假定 A 是满秩的
3.1.1 超定方程组
当 m>n 时, 线性方程组 Ax=b 的解可能不存在. 此时一般考虑求解最小二乘问题 (3.1). 记
J(x)≜∥Ax−b∥22. 易知 J(x) 是关于 x 的二次函数, 而且是凸函数 (当 A 满秩时, J(x) 的Hessen阵是正定的). 因此, 由凸函数的性质可知, x∗ 是问题 (3.1) 的解当且仅当 x∗ 是 J(x) 的稳定点. 令其一阶导数为零, 可得
ATAx−ATb=0. 于是将最小二乘问题转化为一个线性方程组, 这就是后面的正规方程.
如果 A 不是满秩, 则 A⊤A 半正定, 此时解不唯一.
3.1.2 欠定方程组
若 m<n , 则线性方程组 Ax=b 存在无穷多个解 (假定 A 满秩). 这时我们通常寻求最小范数解, 即所有解中范数最小的解. 于是原问题就转化为下面的约束优化问题
Ax=bmin21∥x∥22(3.2) 对应的Lagrange函数为
L(x,λ)=21∥x∥22+λT(Ax−b), 其中 λ=[λ1,λ2,…,λm]T 是Lagrange乘子.此时优化问题(3.2)的解就是 L(x,λ) 的鞍点,即下面方程组的解:
∂x∂L=x+A⊺λ=0,∂λ∂L=Ax−b=0. 写成矩阵形式为
[IAAT0][xλ]=[0b]. 如果 A 满秩, 即 rank(A)=m , 则系数矩阵非奇异 (见练习 3.1), 上述方程组存在唯一解.
本讲主要讨论超定线性最小二乘问题的求解