4.7_广义特征值问题

4.7 广义特征值问题*

4.7.1 广义特征值基本理论

A,BRn×nA, B \in \mathbb{R}^{n \times n} , 若存在 λC\lambda \in \mathbb{C} 和非零向量 xCnx \in \mathbb{C}^n 使得

Ax=λBx,(4.10)A x = \lambda B x, \tag {4.10}

则称 λ\lambda 为矩阵对 (或矩阵束, matrix pair, matrix pencil) (A,B)(A, B) 的特征值, xx 为相应的特征向量. 计算矩阵对 (A,B)(A, B) 的特征值和特征向量就是广义特征值问题. 当 B=IB = I 时, 广义特征值问题就退化为标准特征值问题. 当 BB 非奇异时, 广义特征值问题就等价于标准特征值问题

B1Ax=λxAB1y=λy,B ^ {- 1} A x = \lambda x \quad {\text {或}} \quad A B ^ {- 1} y = \lambda y,

其中 y=Bxy = Bx

容易看出, λ\lambda(A,B)(A, B) 的一个特征值当且仅当

det(AλB)=0.(4.11)\det (A - \lambda B) = 0. \tag {4.11}

若 (4.9) 对所有 λC\lambda \in \mathbb{C} 都成立, 则称矩阵对 (A,B)(A, B) 是奇异矩阵对, 否则称为正则矩阵对.

BB 非奇异时, 特征方程 (4.9) 是一个 nn 次多项式, 因此恰好有 nn 个特征值. 当 BB 奇异时, 特征方程 (4.9) 的次数低于 nn , 因此方程的解的个数小于 nn . 但是, 注意到 λ0\lambda \neq 0(A,B)(A, B) 的特征值当且仅当 μ=1λ\mu = \frac{1}{\lambda}(B,A)(B, A) 的特征值. 因此, 当 BB 奇异时, μ=0\mu = 0(B,A)(B, A) 的特征值, 于是我们自然地把 λ=1μ=\lambda = \frac{1}{\mu} = \infty 当作是 (A,B)(A, B) 的特征值. 所以, 广义特征值不是分布在 C\mathbb{C} 上, 而是分布在 C{}\mathbb{C} \cup \{\infty\} 上.

容易验证, 若 U,VU, V 非奇异, 则矩阵对 (UAV,UBV)(U^{*}AV, U^{*}BV) 的特征值与 (A,B)(A, B) 是一样的. 因此我们称这种变换为矩阵对的等价变换. 如果 U,VU, V 是酉矩阵, 则称为酉等价变换.

4.7.2 广义Schur分解

广义 Schur 分解是矩阵对在酉等价变化下的最简形式.

定理4.10(广义Schur分解)设 A,BCn×nA,B\in \mathbb{C}^{n\times n} ,则存在酉矩阵 Q,ZCn×nQ,Z\in \mathbb{C}^{n\times n} ,使得

QAZ=RA,QBZ=RB,(4.12)Q ^ {*} A Z = R _ {A}, \quad Q ^ {*} B Z = R _ {B}, \tag {4.12}

其中 RA,RBCn×nR_A, R_B \in \mathbb{C}^{n \times n} 都是上三角矩阵. 此时矩阵对 (A,B)(A, B) 的特征值为 RAR_ARBR_B 的对角线元素的比值, 即

λi=RA(i,i)RB(i,i),i=1,2,,n.\lambda_ {i} = \frac {R _ {A} (i , i)}{R _ {B} (i , i)}, \quad i = 1, 2, \dots , n.

RB(i,i)=0R_{B}(i,i) = 0 时,对应的特征值 λi=\lambda_{i} = \infty

(留作课外自习)

证明. 若 BB 非奇异, 则可设 B1AB^{-1}A 的 Schur 分解为

ZB1AZ=R,Z ^ {*} B ^ {- 1} A Z = R,

其中 RCn×nR \in \mathbb{C}^{n \times n} 是上三角矩阵, ZCn×nZ \in \mathbb{C}^{n \times n} 是酉矩阵. 令 BZBZ 的 QR 分解为

BZ=QT,B Z = Q T,

其中 TCn×nT\in \mathbb{C}^{n\times n} 是上三角矩阵, QCn×nQ\in \mathbb{C}^{n\times n} 是酉矩阵. 则 QBZ=TQ^{*}BZ = T ,且

QAZ=TRQ ^ {*} A Z = T R

是上三角矩阵. 令 S=TRS = TR 即可

BB 奇异, 则根据矩阵特征值的连续性, 存在序列 {Bk}\{B_k\} , 使得 BkB_k 非奇异, 且收敛到 BB . 由上面的证明可知, 存在酉矩阵 QkQ_kZkZ_k , 使得 QkBkZkQ_k^* B_k Z_kQkAZkQ_k^* A Z_k 都是上三角矩阵. 由于 {Qk}\{Q_k\}{Zk}\{Z_k\} 都是有界的, 因此存在收敛子列. 记它们的极限分别为 QQZZ , 由矩阵乘积的连续性可知, QQZZ 都是酉矩阵, 且 QBZQ^* B ZQAZQ^* A Z 都是上三角矩阵. □

与实 Schur 分解类似, 当 A,BA, B 都是实矩阵时, 我们有相应的广义实 Schur 分解, 具体证明过程可参见相关资料.

定理4.11(广义实Schur分解)设 A,BRn×nA, B \in \mathbb{R}^{n \times n} ,则存在正交矩阵 Q,ZRn×nQ, Z \in \mathbb{R}^{n \times n} ,使得

QTAZ=TA,QTBZ=TB,(4.13)Q ^ {\mathsf {T}} A Z = T _ {A}, \quad Q ^ {\mathsf {T}} B Z = T _ {B}, \tag {4.13}

其中 TA,TBRn×nT_A, T_B \in \mathbb{R}^{n \times n} 都是拟上三角矩阵

(留作课外自习)

4.7.3 QZ迭代法

QZ迭代法是用于计算 (A,B)(A,B) 的广义Schur分解的方法,是QR方法的自然推广,本质上可以看作是将QR方法作用到矩阵 AB1AB^{-1} 上,在具体实施时需要做一些优化,以提高执行效率. QZ方法的详细推导和实现过程可参见相关资料,如[83,120,152].