1.4 矩阵标准型
1.4.1 Jordan标准型
在计算矩阵的特征值时, 一个基本的思想是通过相似变换, 将其转化成一个形式尽可能简单的矩阵, 使得其特征值更易于计算. Jordan 标准型则是矩阵在相似变化下的最简形式.
定理 1.44 设 A∈Cn×n (或 Rn×n ) 有 p 个互不相同的特征值, 则存在非奇异矩阵 X∈Cn×n , 使得
X−1AX=J1J2⋱Jp≜J,(1.8) 其中 Ji 的维数等于 λi 的代数重数,且具有下面的结构
Ji=Ji(1)Ji(2)⋱Ji(νi),Ji(k)=λi1⋱⋱λi1λi. 这里的 νi 为 λi 的几何重数, Ji(k) 称为 (对应于 λi 的) Jordan 块, J 就称为 A 的 Jordan 标准型.
该定理可以通过 λ -矩阵来证明(见高等代数教材),也可以通过后面的Schur分解来证明.
除了 Jordan 块的排列次序外, Jordan 标准型是唯一确定的.
可以证明, 对于每一个 Jordan 块 Ji(k) , 都存在一个列满秩矩阵 Xi(k) 使得
AXi(k)=Xi(k)Ji(k). Jordan 标准型的基本性质
Jordan 块的个数等于 A 的线性无关的特征向量的个数;
A 可对角化的充要条件是每个 Jordan 块都是 1×1 的, 此时 X 的列向量就是 A 的特征向量.
根据 Jordan 标准型和特征值的连续性, 我们可以得到下面的结论.
推论1.45所有可对角化矩阵组成的集合在所有矩阵组成的集合中是稠密的,即任何一个矩阵都可以通过可对角化矩阵来逼近.
Jordan 标准型的一个重要应用是可以用来计算矩阵的最小多项式.
定理1.46 设 λ1,λ2,…,λp 为 A∈Cn×n 的互不相等的特征值, 则 A 的最小多项式为
p(λ)=i=1∏q(λ−λi)ri, 其中 ri 是与 λi 所对应的最大Jordan块的维数
1.4.2 Schur分解
Jordan标准型在理论研究中非常有用,但数值计算比较困难.下面我们介绍一个比较实用的矩阵分解,即Schur分解
定理1.47 设 A∈Cn×n (或 Rn×n ), 则存在酉矩阵 U∈Cn×n 使得
U∗AU=λ10⋮0r12λ2………⋱0r1nr2n⋮λn≜R或A=URU∗,(1.9) 其中 λ1,λ2,…,λn 是 A 的特征值 (可以按任意顺序排列).
(板书)
证明. 我们对 n 使用归纳法
当 n=1 时,结论显然成立
假设结论对阶数为 n−1 的矩阵都成立. 考虑 n 阶矩阵 A∈Cn×n . 设 λ 是 A 的一个特征值, 其对应的单位特征向量为 x∈Cn . 构造一个以 x 为第一列的酉矩阵 X=[x,X~] . 于是
X∗AX=[x∗X~∗]A[x,X~]=[x∗AxX~∗Axx∗AX~X~∗AX~]. 因为 x∗Ax=λx∗x=λ ,且 X~∗Ax=X~∗(λx)=λX~∗x=0, 故
X∗AX=[λ0x∗AX~X~∗AX~]≜[λ0A~12A~22], 其中 A~22∈C(n−1)×(n−1) . 根据归纳假设, 存在酉矩阵 U~∈C(n−1)×(n−1) , 使得 U~∗A22U~=R~∈C(n−1)×(n−1) 是一个上三角矩阵. 令
U=X[100U~], 则有
U∗AU=[100U~∗]X∗AX[100U~]=[100U~∗][λ0A~12A~22][100U~]=[λ0A~12U~U~∗A~22U~]=[λ0A~12U~R~]≜R. 由于 R~ 是上三角矩阵, 故 R 也是一个上三角矩阵, 其对角线元素即为 A 的特征值.
由归纳法可知, 定理结论成立.
关于Schur分解的几点说明
该结论告诉我们, 任意一个矩阵都可以酉三角化.
三角矩阵可以说是一般矩阵在酉相似变化下的最简形式.
定理中的 U 和 R 不是唯一的.
R 的对角线元素可以按任意顺序排列, 特别地, 可以按模从大到小排列.
推论1.48 设 A∈Cn×n , 则
(1) A 是正规矩阵当且仅当 R 是对角矩阵, 即 A 可酉对角化当且仅当 A 是正规矩阵;
(2) A 是Hermite矩阵当且仅当 R 是实对角矩阵
众所周知, 当 A 是实矩阵时, 其特征值和特征向量仍可能是复的. 在计算实矩阵的特征值时, 通常希望尽可能地避免复数运算. 这时, 我们就需要用到下面的实 Schur 分解 (或拟 Schur 分解).
定理1.49 设 A∈Rn×n , 则存在正交矩阵 Q∈Rn×n , 使得
QTAQ=T,(1.10) 其中 T∈Rn×n 是拟上三角矩阵, 即 T 是块上三角的, 且对角块为 1×1 或 2×2 的块矩阵. 若对角块是 1×1 的, 则其就是 A 的一个特征值, 若对角块是 2×2 的, 则其特征值是 A 的一对共轭复特征值. (板书)
证明. 同样对 n 使用数学归纳法
当 n=1 时,结论显然成立
假定结论对所有不超过 n−1 阶的矩阵都成立. 考虑 n 阶实矩阵 A . 设 λ 是 A 的一个特征值. 若 λ 是实的, 则存在一个对应的实特征向量, 后面的证明与定理 1.47 的证明类似.
若 λ 是复数 (虚部不为 0), 设其对应的单位复特征向量为 u . 由于
λˉuˉ=λu=Auˉ=Aˉuˉ=Auˉ, 故 (λˉ,uˉ) 也是 A 的一个特征对,且 u 和 uˉ 线性无关.令
u~=21(u+uˉ),v~=2i1(u−uˉ), 即 u~,v~ 分别为 u 的实部与虚部,于是 u~∈Rn,v~∈Rn .由定理1.22可知, span{u~,v~}=span{u,uˉ} 是 A 的一个不变子空间.将 {u~,v~} 进行正交化(利用Gram-Schmidt正交化过程):可得列正交矩阵 Q~∈Rn×2 和非奇异上三角矩阵 R~∈R2×2 ,使得 [u~,v~]=Q~R~ .于是 span{Q~}=span{u~,v~} 也是 A 的不变子空间.
根据定理1.23,存在矩阵 B∈R2×2 使得 AQ~=Q~B 将 Q~ 扩充成一个正交矩阵,即构造矩阵 Q^∈Rn×(n−2) ,使得 [Q~,Q^] 是正交矩阵.于是有
[Q~,Q^]TA[Q~,Q^]=[Q~TAQ~Q^TAQ~Q~TAQ^Q^TAQ^]=[B0Q~TAQ^Q^TAQ^], 其中 Q^TAQ^∈R(n−2)×(n−2) 对 Q^TAQ^ 使用归纳假设, 即可证明定理结论成立.