矩阵相似
定义 设 A,B 都是 n 阶矩阵, 若有可逆矩阵 P, 使
P−1AP=B 则称 B 是 A 的相似矩阵,记做A∼B, 或者说矩阵 A 与 B 相似. 对 A 进行运算 P−1AP 称为对A 进行相似变换。
可逆矩阵 P 称为把 A 变成 B 的相似变换矩阵.
既然定义有了,现在有一个问题:给你一个矩阵A,如何求的他的相似矩阵B和P, 此时前面学的特征值和特征向量的作用就可以用上了。换句话说,学习特征值与特征向量,是为这里做准备的。
矩阵相似的求法
例 求 A=724−1−1−87−57 的相似矩阵
解:只需求 1 个相似矩阵时,不妨令 P=112(∣P∣=0) ,
则 112724−1−1−87−57111/2 即为所球
若需求所有的相似矩阵,对于矩阵 P 满足 ∣P∣=0
∣p∣p∗AP 即为所求 (p∗=p−1∣p∣)
从这里可以看到,如果任给一个矩阵A,要求他的相似矩阵,可以有无数个,因此,单纯的说求一个矩阵的相似矩阵,意义不大。
但是,如果我们把B限制为对角形矩阵,则情况立刻不一样,此时变换唯一,且可求解
矩阵相似对角形的求法
先给一个公式,后面 矩阵与对角形相似 会介绍,
P−1AP=Λ 把上面这个公式稍微变形一下,左乘P,右乘 P−1,就得到
A=PΛP−1 这说明任意给一个矩阵A,可以找到一个对角形矩阵Λ (有些找不到), 接下来一个问题,怎么找到这里的P和Λ ? 答案就是特征值与特征向量。
例 设矩阵
A=−20−4121103 求他的相似矩阵P和Λ
解: 先求 A 的特征值.
∣A−λE∣=−2−λ0−412−λ1103−λ=(2−λ)−2−λ−413−λ=(2−λ)(λ2−λ−2)=−(λ+1)(λ−2)2, 所以 A 的特征值为 λ1=−1,λ2=λ3=2 .
再求 A 的特征向量.
当 λ1=−1 时,解方程 (A+E)x=0 .由
A+E=−10−4131104∼100010−100 得对应的特征向量
p1=101 当 λ2=λ3=2 时,解方程 (A−2E)x=0 .由
A−2E=−40−4101101≃−400100100, 得对应的线性无关特征向量
p2=01−1,p3=104 分析上面的结论:
通过上面的解,我们找到3个特征值和3个特征向量:
λ1=−1,λ2=λ3=2
p1=101,p2=01−1,p3=104 我们只要把他们按照对应的位置排好即可,就可以找到相似矩阵。
排法1:使用 λ1=−1,λ2=λ3=2
即
若记
Λ1=(λ1,λ2,λ3)=−101020002 P1=(p1,p2,p3)=10101−1104 这样A就可以表示为 A=P1Λ1P1−1
排法2:使用 λ2=λ3=2,λ1=−1,
排列,若记
Λ2=(λ2,λ3,λ1)=20002000−1 P2=(p2,p3,p1)=01−1104101 这样A就可以表示为 A=P2Λ2P2−1
可以看到,因为排法不同,其结果也不同,但是本质是一样的。
相似的几何意义
想在捋一捋矩阵相似的几何有意义,我们说过,一个矩阵相当于一个坐标系(不是坐标系里的值), 你原来在A空间,通过相似映射后,你变成了Λ 空间, 在Λ的空间里,因为 λ1=−1 所以,沿x方向方向相反,而 λ2=2,λ3=2, 所以,沿着y,z方向,进行了拉伸,参考下图。
通过变换后,下图右图小男孩看起来就漂亮多了
所以,矩阵相似可以理解为换个空间角度观察人物,而特征向量相当于找到了一个新的空间,特征值是新空间对应维度的伸缩率。

矩阵相似的一些定理
定理 1
若 n 阶矩阵 A 与 B 相似,则 A 与 B 有相同的特征多项式,从而 A 与 B 有相同的特征值.
证明 因 A 与 B 相似,即有可逆矩阵 P ,使 P−1AP=B, 故
∣B−λE∣=P−1AP−P−1(λE)P=P−1(A−λE)P=P−1⋅∣A−λE∣⋅∣P∣=∣A−λE∣. 推论
若 n 阶矩阵 A 与对角阵
Λ=λ1λ2⋱λn 相似,则 λ1,λ2,⋯,λn 即是 A 的 n 个特征值.
证明:若 n 阶矩阵 A 与 B 相似,即 P−1AP=B ,则 Ak=(PBP−1)k=PBkP−1 ,并且 A 的多项式
φ(A)=amAm+⋯+a1A+a0E=am(PBP−1)m+⋯+a1(PBP−1)+a0E=am(PBmP−1)+⋯+a1(PBP−1)+a0E=P(amBm)P−1+⋯+P(a1B)P−1+P(a0E)P−1=P(amBm+⋯+a1B+a0E) 特别地,若有可逆矩阵 P ,使 P−1AP=Λ 为对角阵,则Ak=PΛkP−1,φ(A)=Pφ(Λ)P−1
而对于对角阵 Λ=diag(λ1,λ2,⋯,λn) ,有
Λk=λ1kλ2k⋱λnk,φ(Λ)=φ(λ1)φ(λ2)⋱φ(λn), 由此可方便地计算 A 的高次幕 Akˉ 及 A 的多项式 φˉ(A).
推广
设 f(λ) 是矩阵 A 的特征多项式,则
f(A)=O. 这个结论的证明比较困难,但若 A 与对角阵相似,则容易证明此结论.
这是因为: 若 A 与对角阵相似,即有可逆矩阵 P ,使 P−1AP=Λ=diag(λ1,λ2,⋯,λn) ,其中 λi 为 A 的特征值,有 f(λi)=0.
于是由上面的讨论可得:
f(A)=Pf(Λ)P−1=Pf(λ1)f(λ2)⋱f(λn)P−1=POP−1=O. 矩阵相似的性质
1.相似矩阵的行列式相同
若 A 和 B 相似,则:A 和 B 的行列式值相同;
Det(A)=Det(B) ,也记作:∣A∣=∣B∣ 。
2.相似矩阵的特征值相同
若 A 和 B 相似,则:A 和 B 的特征方程相同;
∣A−λE∣=0⇔∣B−λE∣=0 这意味着:A 和 B 的特征值(特征根)相同。
注意:特征值相同,不意味着对应的特征向量相同
3.相似矩阵的秩相同
若 A 和 B 相似,则:A 和 B 的秩相同。
r(A)=r(B)
4.相似矩阵的迹相同
若A和B相似,则:A 和 B 的迹相同;
矩阵(方阵)的迹为主对角线元素之和;
tr(A)=tr(B)
5.相似矩阵的可逆性相同
若A和B相似,则:A和B的可逆性相同;
若 A 可逆,则 B 也可逆。若 B 可逆,则 A 也可逆;
若 A 不可逆,则 B 也不可逆。若 B 不可逆,则 A 也不可逆。
6.相似矩阵的可对角化性相同
如果矩阵A可对角化,那么和它相似的所有矩阵也都可以对角化。
7.相似的传递性
若 A 相似于 B ,而 B 相似于 C ,则 A 相似于 C 。
例题
例已知矩阵 A=−2230x1021 与 B=−10002000y 相似,求 x 与 y 的值.
解 由题意, A 与 B 相似,相似矩阵有相同的特征多项式.我们可由此来求解:
∣λI−A∣==λ+2−2−30λ−x−10−2λ−1=(λ+2)[(λ−x)(λ−1)−2](λ+2)[λ2−(x+1)λ+(x−2)],∣λI−B∣=(λ+1)(λ−2)(λ−y), 即
(λ+2)[λ2−(x+1)λ+(x−2)]=(λ+1)(λ−2)(λ−y). 比较两边同次幂的系数,可求出 x=0,y=−2 .
例已知二阶方阵 A 的两个特征值为 λ1=1,λ2=2 ,其对应的特征向量分别为 x1=[11],x2=[1−1] ,试求 A2014 .
解:由 Ax1=λ1x1,Ax2=λ2x2 ,可知
A[x1x2]=[x1x2][λ100λ2] 因此可知 A=[x1x2][λ100λ2][x1x2]−1 ,
A2014=[x1x2][λ100λ2]2014[x1x2]−1=[111−1][10022014][212121−21]=[21+2201321−2201321−2201321+22013] 例已知 ξ=[1,1,−1]T 是矩阵 A=25−1−1ab23−2 的一个特征向量.
(1)确定参数 a,b 及 ξ 对应的特征值 λ ;
(2) A 是否相似于对角矩阵?说明理由.
解(1)设 A 的特征向量 ξ 所对应的特征值为 λ ,则有 Aξ=λξ ,即
25−1−1ab23−211−1=λ11−1 即
⎩⎨⎧2−1−2=λ,5+a−3=λ,−1+b+2=−λ, 解得 λ=−1,a=−3,b=0 .
(2)当 a=−3,b=0 时,令
∣λE−A∣=λ−2−511λ+30−2−3λ+2=(λ+1)3=0 可知 λ=−1 是 A 的三重特征值,但
−E−A=−3−51120−2−31,r(−E−A)=2 当 λ=−1 时,对应的线性无关特征向量只有一个,因此 A 不能相似于对角矩阵.
相似的几何意义
对于初学者而言,看到矩阵相似会很疑惑,为什么要给出这个定义。其实,矩阵相似反应的是从不同“视角(坐标系)”里查看同一个视图。
比如,有一张照片,可以从不同视角进行观看,如果把每一个视角视为一个矩阵“基”,那么这些视角(矩阵)就是相似的。
在这些视角里,会有一个比较好的视角(矩阵),如下图,毫无疑问 B图效果最好,因为他不失真,而我们要做的工作是:给你一个矩阵,怎么找到最好的“基坐标”。
{width=500px}
关于矩阵相似的几何意义更详细介绍,请参考下一节 矩阵相似的几何意义