3.6 广义逆与最小二乘*
满秩的正方矩阵存在逆, 一个很自然的问题就是, 对于不满秩的矩阵或者非正方矩阵, 是不是可以定义类似的逆?
3.6.1 广义逆
广义逆的概念最早由Moore[95]于1920年提出, 他给出的定义如下: 设 A∈Cm×n , 若 X∈Cn×m 满足
AX=PRan(A),XA=PRan(X),(3.24) 即 AX 和 XA 分别为 Ran(A) 和 Ran(X) 上的正交投影算子, 则称 X 是 A 的广义逆.
1955年,Penrose[104]利用下面四个矩阵方程给出了广义逆的另一个定义,这也是当前常用的广义逆定义方式.
定义3.2 设 A∈Cm×n , 若 X∈Cn×m 满足
AXA=A(3.25) XAX=X(3.26) (AX)∗=AX(3.27) (XA)∗=XA.(3.28) 则称 X 为 A 的广义逆,记为 A†
方程组 (3.23) 和 (3.24)-(3.27) 分别称为 Moore 方程组和 Penrose 方程组. 可以证明, 以上两种定义是等价的, 因此广义逆也称为 Moore-Penrose 逆, 简称 MP 逆.
(1) 需要指出的是, 广义逆对所有矩阵都有定义, 并不要求是正方矩阵.
(2) 若 A∈Cn×n 非奇异, 则 A†=A−1 .
(3) 在有的文献中,广义逆也称为伪逆.
定理3.25 [149]设 A∈Cm×n ,则满足矩阵方程组(3.24)-(3.27)的矩阵 X∈Cn×m 存在且唯一.
(板书)
证明. 存在性: 可以通过SVD构造
设 rank(A)=r>0 ,且 A 的SVD为
A=U[Σ1000]V∗,Σ1=diag(σ1,σ2,…,σr)∈Rr×r. 令
X=V[Σ1−1000]U∗. 容易验证, X 满足矩阵方程(3.24)-(3.27).
唯一性: 假设存在 X 和 Y 都满足矩阵方程 (3.24)-(3.27). 则
X=XAX=X(AX)∗=XX∗A∗=XX∗(AYA)∗=X(AX)∗(AY)∗=(XAX)(AY)=XAY. 另一方面,
Y=YAY=(YA)∗Y=A∗Y∗Y=(AXA)∗Y∗Y=(XA)∗(YA)∗Y=XAYAY=XAY. 所以 Y=X
3.6.2 广义逆基本性质
定理3.26 设 A∈Cm×n , 则
(1) (A†)†=A
(2) (AT)†=(A†)T,(A∗)†=(A†)∗;
(3) rank(A)=rank(A†)=rank(A†A) ;
(4) (AA∗)†=(A∗)†A† , (A∗A)†=A†(A∗)† ;
(5) (AA∗)†AA∗=AA† , (A∗A)†A∗A=A†A ;
(6) A†=(A∗A)†A∗=A∗(AA∗)†
特别地, 若 A 列满秩, 则 A†=(A∗A)−1A∗ , 若 A 行满秩, 则 A†=A∗(AA∗)−1 ;
(7) 若 U,V 是酉矩阵, 则 (UAV)†=V∗A†U∗ .
一般来说, 当 A,B 是方阵时,
(AB)†=B†A† ;
AA†=A†A;
(Ak)†=(A†)k
A 和 A† 的非零特征值并不是互为倒数
定理3.27 设 A∈Cm×n , 则
Ran(AA†)=Ran(AA∗)=Ran(A),Ran(A†A)=Ran(A∗A)=Ran(A∗)=Ran(A†),Ker(AA†)=Ker(AA∗)=Ker(A∗)=Ker(A†),Ker(A†A)=Ker(A∗A)=Ker(A). 推论3.28(广义逆与正交投影)设 A∈Cm×n ,则
PA=AA†,PA⊺=A†A, 其中 PA 和 PA⊺ 分别表示 Ran(A) 和 Ran(AT) 上的正交投影变换.
特别地, 如果 A∈Cn×n 是正交投影, 则
A†=A. 3.6.3 广义逆的计算
利用SVD
我们可以利用 A 的奇异值分解来计算 A† , 但运算量较大. 因为奇异值分解通常与 AA∗ 或 A∗A 的特征值分解有关.
利用满秩分解
定理3.29 设 A∈Rm×n
(1) 若 A 是列满秩矩阵, 则 A†=(A∗A)−1A∗ ;
(2) 若 A 是行满秩矩阵, 则 A†=A∗(AA∗)−1 ;
(3) 若 A 的秩是 r≤min{m,n} , 且其满秩分解为 A=FG , 其中 F∈Rm×r,G∈Rr×n , 则
A†=G†F†=G∗(GG∗)−1(F∗F)−1F∗. 利用QR分解
定理3.30 设 A∈Rm×n ( m≥n ) 是列满秩矩阵, 其 QR 分解为 A=QR , 其中 Q∈Rm×n , R∈Rn×n , 则
A†=R−1Q∗. 其他算法
其他比较重要的算法有: Greville 递推算法, Cline 算法等.
3.6.4 广义逆与线性最小二乘
定理3.31 [149, page 85] 设 A∈Rm×n ( m≥n ), 则线性最小二乘问题 (3.1) 的解为
x=A†b+(I−PRan(A⊺))z,∀z∈Rn.(3.29) 通常, 线性最小二乘问题的解 (3.28) 不唯一. 但当 A 列满秩时, PRan(A⊤)=I , 此时解唯一.
定理3.32 [149, page 85] 设 A∈Rm×n ( m≥n ). 记线性最小二乘问题 (3.1) 的解集为 S , 则
x∈Smin∥x∥2(3.30) 存在唯一解, 即线性最小二乘问题 (3.1) 存在唯一的最小范数解.
3.6.5 左逆和右逆
在工程计算中, 有时也会用到矩阵的左逆和右逆
定义3.3 设 A∈Cm×n , 如果存在矩阵 Aleft−1∈Cn×m 使得 Aleft−1A=In , 则称 Aleft−1 是 A 的左逆类似地, 如果存在矩阵 Aright−1∈Cn×m 使得 AAright−1=Im , 则称 Aright−1 是 A 的右逆.
定理3.33 设 A∈Cm×n , 则 A 存在左逆的充要条件是 A 列满秩; A 存在右逆的充要条件是 A 行满秩.
易知, 左逆和右逆一般是不唯一的. 比如
A=100010,则Aleft−1=[1001xy],其 中x,y可 以 取 任 意 值.