4.7 广义特征值问题*
4.7.1 广义特征值基本理论
设 A,B∈Rn×n , 若存在 λ∈C 和非零向量 x∈Cn 使得
Ax=λBx,(4.10) 则称 λ 为矩阵对 (或矩阵束, matrix pair, matrix pencil) (A,B) 的特征值, x 为相应的特征向量. 计算矩阵对 (A,B) 的特征值和特征向量就是广义特征值问题. 当 B=I 时, 广义特征值问题就退化为标准特征值问题. 当 B 非奇异时, 广义特征值问题就等价于标准特征值问题
B−1Ax=λx或AB−1y=λy, 其中 y=Bx
容易看出, λ 是 (A,B) 的一个特征值当且仅当
det(A−λB)=0.(4.11) 若 (4.9) 对所有 λ∈C 都成立, 则称矩阵对 (A,B) 是奇异矩阵对, 否则称为正则矩阵对.
当 B 非奇异时, 特征方程 (4.9) 是一个 n 次多项式, 因此恰好有 n 个特征值. 当 B 奇异时, 特征方程 (4.9) 的次数低于 n , 因此方程的解的个数小于 n . 但是, 注意到 λ=0 是 (A,B) 的特征值当且仅当 μ=λ1 是 (B,A) 的特征值. 因此, 当 B 奇异时, μ=0 是 (B,A) 的特征值, 于是我们自然地把 λ=μ1=∞ 当作是 (A,B) 的特征值. 所以, 广义特征值不是分布在 C 上, 而是分布在 C∪{∞} 上.
容易验证, 若 U,V 非奇异, 则矩阵对 (U∗AV,U∗BV) 的特征值与 (A,B) 是一样的. 因此我们称这种变换为矩阵对的等价变换. 如果 U,V 是酉矩阵, 则称为酉等价变换.
4.7.2 广义Schur分解
广义 Schur 分解是矩阵对在酉等价变化下的最简形式.
定理4.10(广义Schur分解)设 A,B∈Cn×n ,则存在酉矩阵 Q,Z∈Cn×n ,使得
Q∗AZ=RA,Q∗BZ=RB,(4.12) 其中 RA,RB∈Cn×n 都是上三角矩阵. 此时矩阵对 (A,B) 的特征值为 RA 和 RB 的对角线元素的比值, 即
λi=RB(i,i)RA(i,i),i=1,2,…,n. 当 RB(i,i)=0 时,对应的特征值 λi=∞
(留作课外自习)
证明. 若 B 非奇异, 则可设 B−1A 的 Schur 分解为
Z∗B−1AZ=R, 其中 R∈Cn×n 是上三角矩阵, Z∈Cn×n 是酉矩阵. 令 BZ 的 QR 分解为
其中 T∈Cn×n 是上三角矩阵, Q∈Cn×n 是酉矩阵. 则 Q∗BZ=T ,且
Q∗AZ=TR 是上三角矩阵. 令 S=TR 即可
若 B 奇异, 则根据矩阵特征值的连续性, 存在序列 {Bk} , 使得 Bk 非奇异, 且收敛到 B . 由上面的证明可知, 存在酉矩阵 Qk 和 Zk , 使得 Qk∗BkZk 和 Qk∗AZk 都是上三角矩阵. 由于 {Qk} 和 {Zk} 都是有界的, 因此存在收敛子列. 记它们的极限分别为 Q 和 Z , 由矩阵乘积的连续性可知, Q 和 Z 都是酉矩阵, 且 Q∗BZ 和 Q∗AZ 都是上三角矩阵. □
与实 Schur 分解类似, 当 A,B 都是实矩阵时, 我们有相应的广义实 Schur 分解, 具体证明过程可参见相关资料.
定理4.11(广义实Schur分解)设 A,B∈Rn×n ,则存在正交矩阵 Q,Z∈Rn×n ,使得
QTAZ=TA,QTBZ=TB,(4.13) 其中 TA,TB∈Rn×n 都是拟上三角矩阵
(留作课外自习)
4.7.3 QZ迭代法
QZ迭代法是用于计算 (A,B) 的广义Schur分解的方法,是QR方法的自然推广,本质上可以看作是将QR方法作用到矩阵 AB−1 上,在具体实施时需要做一些优化,以提高执行效率. QZ方法的详细推导和实现过程可参见相关资料,如[83,120,152].