8._矩阵相似

矩阵相似

定义A,BA, B 都是 nn 阶矩阵, 若有可逆矩阵 PP, 使

P1AP=B\boxed{ \boldsymbol{P}^{-1} \boldsymbol{A P}=\boldsymbol{B} }

则称 BBAA 的相似矩阵,记做AB A \sim B, 或者说矩阵 AABB 相似. 对 AA 进行运算 P1APP^{-1} A P 称为对A\boldsymbol{A} 进行相似变换

可逆矩阵 PP 称为把 A\boldsymbol{A} 变成 B\boldsymbol{B} 的相似变换矩阵.

既然定义有了,现在有一个问题:给你一个矩阵AA,如何求的他的相似矩阵BBPP, 此时前面学的特征值和特征向量的作用就可以用上了。换句话说,学习特征值与特征向量,是为这里做准备的。

矩阵相似的求法

A=(717215487)A=\left(\begin{array}{ccc}7 & -1 & 7 \\ 2 & -1 & -5 \\ 4 & -8 & 7\end{array}\right) 的相似矩阵

解:只需求 1 个相似矩阵时,不妨令 P=[112](P0)P=\left[\begin{array}{lll}1 & & \\ & 1 & \\ & & 2\end{array}\right](|P| \neq 0) , 则 [112][717215487][111/2]\left[\begin{array}{lll}1 & & \\ & 1 & \\ & & 2\end{array}\right]\left[\begin{array}{ccc}7 & -1 & 7 \\ 2 & -1 & -5 \\ 4 & -8 & 7\end{array}\right]\left[\begin{array}{lll}1 & & \\ & 1 & \\ & & 1/2\end{array}\right] 即为所球

若需求所有的相似矩阵,对于矩阵 PP 满足 P0|P| \neq 0 ppAP\frac{p^*}{|p|} A P 即为所求 (p=p1p)\left(p^*=p^{-1}|p|\right)

从这里可以看到,如果任给一个矩阵AA,要求他的相似矩阵,可以有无数个,因此,单纯的说求一个矩阵的相似矩阵,意义不大。

但是,如果我们把B限制为对角形矩阵,则情况立刻不一样,此时变换唯一,且可求解

矩阵相似对角形的求法

先给一个公式,后面 矩阵与对角形相似 会介绍,

P1AP=Λ\boxed{ P^{-1}AP=\Lambda }

把上面这个公式稍微变形一下,左乘PP,右乘 P1P^{-1},就得到

A=PΛP1\boxed{ A=P \Lambda P^{-1} }

这说明任意给一个矩阵A,可以找到一个对角形矩阵Λ\Lambda (有些找不到), 接下来一个问题,怎么找到这里的PPΛ\Lambda ? 答案就是特征值与特征向量。

设矩阵

A=(211020413)A=\left(\begin{array}{rrr} -2 & 1 & 1 \\ 0 & 2 & 0 \\ -4 & 1 & 3 \end{array}\right)

求他的相似矩阵PPΛ\Lambda

解: 先求 AA 的特征值.

AλE=2λ1102λ0413λ=(2λ)2λ143λ=(2λ)(λ2λ2)=(λ+1)(λ2)2,\begin{aligned} |A-\lambda E| & =\left|\begin{array}{ccc} -2-\lambda & 1 & 1 \\ 0 & 2-\lambda & 0 \\ -4 & 1 & 3-\lambda \end{array}\right|=(2-\lambda)\left|\begin{array}{cc} -2-\lambda & 1 \\ -4 & 3-\lambda \end{array}\right| \\ & =(2-\lambda)\left(\lambda^2-\lambda-2\right)=-(\lambda+1)(\lambda-2)^2, \end{aligned}

所以 AA 的特征值为 λ1=1,λ2=λ3=2\lambda_1=-1, \lambda_2=\lambda_3=2 . 再求 AA 的特征向量. 当 λ1=1\lambda_1=-1 时,解方程 (A+E)x=0(A+E) x=0 .由

A+E=(111030414)(101010000)A+E=\left(\begin{array}{rrr} -1 & 1 & 1 \\ 0 & 3 & 0 \\ -4 & 1 & 4 \end{array}\right) \sim\left(\begin{array}{rrr} 1 & 0 & -1 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \end{array}\right)

得对应的特征向量

p1=(101)p _1=\left(\begin{array}{l} 1 \\ 0 \\ 1 \end{array}\right)

λ2=λ3=2\lambda_2=\lambda_3=2 时,解方程 (A2E)x=0( A -2 E ) x = 0 .由

A2E=(411000411)(411000000),A -2 E =\left(\begin{array}{rrr} -4 & 1 & 1 \\ 0 & 0 & 0 \\ -4 & 1 & 1 \end{array}\right) \simeq\left(\begin{array}{rrr} -4 & 1 & 1 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{array}\right),

得对应的线性无关特征向量

p2=(011),p3=(104)\begin{aligned} &p_2=\left(\begin{array}{r} 0 \\ 1 \\ -1 \end{array}\right), p_3=\left(\begin{array}{l} 1 \\ 0 \\ 4 \end{array}\right) \end{aligned}

分析上面的结论

通过上面的解,我们找到3个特征值和3个特征向量:

λ1=1,λ2=λ3=2\lambda_1=-1, \lambda_2=\lambda_3=2

p1=(101),p2=(011),p3=(104)\begin{aligned} &p_1=\left(\begin{array}{r} 1 \\ 0 \\ 1 \end{array}\right), &p_2=\left(\begin{array}{r} 0 \\ 1 \\ -1 \end{array}\right), \quad &p_3=\left(\begin{array}{r} 1 \\ 0 \\ 4 \end{array}\right) \end{aligned}

我们只要把他们按照对应的位置排好即可,就可以找到相似矩阵

排法1:使用 λ1=1,λ2=λ3=2\lambda_1=-1, \lambda_2=\lambda_3=2 即 若记

Λ1=(λ1,λ2,λ3)=(100020102)\Lambda_1 =\left( \lambda_1, \lambda_2, \lambda_3 \right)=\left(\begin{array}{rrr} -1 & 0 & 0 \\ 0 & 2 & 0 \\ 1 & 0 & 2 \end{array}\right)
P1=(p1,p2,p3)=(101010114)P_1 =\left( p _1, p _2, p _3\right)=\left(\begin{array}{rrr} 1 & 0 & 1 \\ 0 & 1 & 0 \\ 1 & -1 & 4 \end{array}\right)

这样AA就可以表示为 A=P1Λ1P11A=P_1 \Lambda_1 P_1^{-1}

排法2:使用 λ2=λ3=2,λ1=1,\lambda_2=\lambda_3=2,\lambda_1=-1, 排列,若记

Λ2=(λ2,λ3,λ1)=(200020001)\Lambda_2 =\left( \lambda_2, \lambda_3, \lambda_1 \right)=\left(\begin{array}{rrr} 2 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & -1 \end{array}\right)
P2=(p2,p3,p1)=(011100141)P_2 =\left( p_2, p _3, p _1\right)=\left(\begin{array}{rrr} 0 & 1 & 1 \\ 1 & 0 & 0 \\ -1 & 4 & 1 \\ \end{array}\right)

这样AA就可以表示为 A=P2Λ2P21A=P_2 \Lambda_2 P_2^{-1}

可以看到,因为排法不同,其结果也不同,但是本质是一样的。

相似的几何意义

想在捋一捋矩阵相似的几何有意义,我们说过,一个矩阵相当于一个坐标系(不是坐标系里的值), 你原来在AA空间,通过相似映射后,你变成了Λ\Lambda 空间, 在Λ\Lambda的空间里,因为 λ1=1\lambda_1=-1 所以,沿xx方向方向相反,而 λ2=2,λ3=2\lambda_2=2, \lambda_3=2, 所以,沿着y,zy,z方向,进行了拉伸,参考下图。

通过变换后,下图右图小男孩看起来就漂亮多了

所以,矩阵相似可以理解为换个空间角度观察人物,而特征向量相当于找到了一个新的空间,特征值是新空间对应维度的伸缩率。

图片

矩阵相似的一些定理

定理 1

nn 阶矩阵 AABB 相似,则 AABB 有相同的特征多项式,从而 AABB 有相同的特征值. 证明 因 A\boldsymbol{A}B\boldsymbol{B} 相似,即有可逆矩阵 PP ,使 P1AP=B\boldsymbol{P}^{-1} \boldsymbol{A P}=\boldsymbol{B}, 故

BλE=P1APP1(λE)P=P1(AλE)P=P1AλEP=AλE.|\boldsymbol{B}-\lambda \boldsymbol{E}|=\left|\boldsymbol{P}^{-1} \boldsymbol{A} \boldsymbol{P}-\boldsymbol{P}^{-1}(\lambda \boldsymbol{E}) \boldsymbol{P}\right|=\left|\boldsymbol{P}^{-1}(\boldsymbol{A}-\lambda \boldsymbol{E}) \boldsymbol{P}\right|=\left|\boldsymbol{P}^{-1}\right| \cdot|\boldsymbol{A}-\lambda \boldsymbol{E}| \cdot|\boldsymbol{P}|=|\boldsymbol{A}-\lambda \boldsymbol{E}| .

推论

nn 阶矩阵 AA 与对角阵

Λ=(λ1λ2λn)\Lambda=\left(\begin{array}{llll} \lambda_1 & & & \\ & \lambda_2 & & \\ & \ddots & \\ & & \lambda_n \end{array}\right)

相似,则 λ1,λ2,,λn\lambda_1, \lambda_2, \cdots, \lambda_n 即是 AAnn 个特征值. 证明:若 nn 阶矩阵 AABB 相似,即 P1AP=BP^{-1} A P=B ,则 Ak=(PBP1)k=PBkP1A^k=\left(P B P^{-1}\right)^k=P B^k P^{-1} ,并且 AA 的多项式

φ(A)=amAm++a1A+a0E=am(PBP1)m++a1(PBP1)+a0E=am(PBmP1)++a1(PBP1)+a0E=P(amBm)P1++P(a1B)P1+P(a0E)P1=P(amBm++a1B+a0E)\begin{aligned} & \varphi(A)=a_m A^m+\cdots+a_1 A+a_0 E=a_m\left(P B P^{-1}\right)^m+\cdots+a_1\left(P B P^{-1}\right)+a_0 E=a_m\left(P B^m P^{-1}\right)+\cdots+a_1\left(P B P^{-1}\right)+a_0 E \\ &=P\left(a_m B^m\right) P^{-1}+\cdots+P\left(a_1 B\right) P^{-1}+P\left(a_0 E\right) P^{-1}=P\left(a_m B^m+\cdots+a_1 B+a_0 E\right) \end{aligned}

特别地,若有可逆矩阵 PP ,使 P1AP=ΛP^{-1} A P=\Lambda 为对角阵,则Ak=PΛkP1,φ(A)=Pφ(Λ)P1A^k=P \Lambda^k P^{-1}, \varphi(A)=P\varphi(\Lambda) P^{-1}

而对于对角阵 Λ=diag(λ1,λ2,,λn)\Lambda=\operatorname{diag}\left(\lambda_1, \lambda_2, \cdots, \lambda_n\right) ,有

Λk=(λ1kλ2kλnk),φ(Λ)=(φ(λ1)φ(λ2)φ(λn))\boldsymbol{\Lambda}^k=\left(\begin{array}{cccc} \lambda_1^k & & & \\ & \lambda_2^k & & \\ & & \ddots & \\ & & & \lambda_n^k \end{array}\right), \quad \varphi(\boldsymbol{\Lambda})=\left(\begin{array}{llll} \varphi\left(\lambda_1\right) & & & \\ & \varphi\left(\lambda_2\right) & & \\ & & \ddots & \\ & & & \varphi\left(\lambda_n\right) \end{array}\right) \text {, }

由此可方便地计算 A{\boldsymbol{A}} 的高次幕 Akˉ\boldsymbol{A}^{\bar{k}}A\boldsymbol{A} 的多项式 φˉ(A)\bar{\varphi}({\boldsymbol{A}}).

推广

f(λ)f(\lambda) 是矩阵 A\boldsymbol{A} 的特征多项式,则

f(A)=O.f(\boldsymbol{A})=\boldsymbol{O} .

这个结论的证明比较困难,但若 AA 与对角阵相似,则容易证明此结论. 这是因为: 若 AA 与对角阵相似,即有可逆矩阵 PP ,使 P1AP=Λ=diag(λ1,λ2,,λn)P^{-1} A P=\Lambda=\operatorname{diag}\left(\lambda_1, \lambda_2, \cdots, \lambda_n\right) ,其中 λi\lambda_iA\boldsymbol{A} 的特征值,有 f(λi)=0f\left(\lambda_i\right)=0. 于是由上面的讨论可得:

f(A)=Pf(Λ)P1=P(f(λ1)f(λ2)f(λn))P1=POP1=O.f(\boldsymbol{A})=\boldsymbol{P} f(\boldsymbol{\Lambda}) \boldsymbol{P}^{-1}=\boldsymbol{P}\left(\begin{array}{llll} f\left(\lambda_1\right) & & & \\ & f\left(\lambda_2\right) & & \\ & & \ddots & \\ & & & f\left(\lambda_n\right) \end{array}\right) \boldsymbol{P}^{-1}=\boldsymbol{P} \boldsymbol{O} \boldsymbol{P}^{-1}=\boldsymbol{O} .

矩阵相似的性质

1.相似矩阵的行列式相同

AABB 相似,则:AABB 的行列式值相同; Det(A)=Det(B)\operatorname{Det}(A)=\operatorname{Det}(B) ,也记作:A=B|A|=|B|

2.相似矩阵的特征值相同

AABB 相似,则:AABB 的特征方程相同;

AλE=0BλE=0|A-\lambda E|=0 \Leftrightarrow|B-\lambda E|=0

这意味着:AABB 的特征值(特征根)相同。

注意:特征值相同,不意味着对应的特征向量相同

3.相似矩阵的秩相同

AABB 相似,则:AABB 的秩相同。 r(A)=r(B)r(A)=r(B)

4.相似矩阵的迹相同

若A和B相似,则:AABB 的迹相同;

矩阵(方阵)的迹为主对角线元素之和; tr(A)=tr(B)\operatorname{tr}(A)=\operatorname{tr}(B)

5.相似矩阵的可逆性相同 若A和B相似,则:A和B的可逆性相同;

AA 可逆,则 BB 也可逆。若 BB 可逆,则 AA 也可逆; 若 AA 不可逆,则 BB 也不可逆。若 BB 不可逆,则 AA 也不可逆。

6.相似矩阵的可对角化性相同 如果矩阵A可对角化,那么和它相似的所有矩阵也都可以对角化。

7.相似的传递性AA 相似于 BB ,而 BB 相似于 CC ,则 AA 相似于 CC

例题

已知矩阵 A=[2002x2311]A =\left[\begin{array}{ccc}-2 & 0 & 0 \\ 2 & x & 2 \\ 3 & 1 & 1\end{array}\right]B=[10002000y]B =\left[\begin{array}{ccc}-1 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & y\end{array}\right] 相似,求 xxyy 的值.

解 由题意, AABB 相似,相似矩阵有相同的特征多项式.我们可由此来求解:

λIA=λ+2002λx231λ1=(λ+2)[(λx)(λ1)2]=(λ+2)[λ2(x+1)λ+(x2)],λIB=(λ+1)(λ2)(λy),\begin{aligned} |\lambda I - A |= & \left|\begin{array}{ccc} \lambda+2 & 0 & 0 \\ -2 & \lambda-x & -2 \\ -3 & -1 & \lambda-1 \end{array}\right|=(\lambda+2)[(\lambda-x)(\lambda-1)-2] \\ = & (\lambda+2)\left[\lambda^2-(x+1) \lambda+(x-2)\right], \\ & |\lambda I - B |=(\lambda+1)(\lambda-2)(\lambda-y), \end{aligned}

(λ+2)[λ2(x+1)λ+(x2)]=(λ+1)(λ2)(λy).(\lambda+2)\left[\lambda^2-(x+1) \lambda+(x-2)\right]=(\lambda+1)(\lambda-2)(\lambda-y) .

比较两边同次幂的系数,可求出 x=0,y=2x=0, y=-2

已知二阶方阵 AA 的两个特征值为 λ1=1,λ2=2\lambda_1=1, \lambda_2=2 ,其对应的特征向量分别为 x1=[11],x2=[11]x_1=\left[\begin{array}{l}1 \\ 1\end{array}\right], x_2=\left[\begin{array}{c}1 \\ -1\end{array}\right] ,试求 A2014A^{2014}

解:由 Ax1=λ1x1,Ax2=λ2x2A x_1=\lambda_1 x_1, A x_2=\lambda_2 x_2 ,可知

A[x1x2]=[x1x2][λ100λ2]A\left[\begin{array}{ll} x_1 & x_2 \end{array}\right]=\left[\begin{array}{ll} x_1 & x_2 \end{array}\right]\left[\begin{array}{cc} \lambda_1 & 0 \\ 0 & \lambda_2 \end{array}\right]

因此可知 A=[x1x2][λ100λ2][x1x2]1A=\left[\begin{array}{ll}x_1 & x_2\end{array}\right]\left[\begin{array}{cc}\lambda_1 & 0 \\ 0 & \lambda_2\end{array}\right]\left[\begin{array}{ll}x_1 & x_2\end{array}\right]^{-1}

A2014=[x1x2][λ100λ2]2014[x1x2]1=[1111][10022014][12121212]=[12+220131222013122201312+22013]\begin{aligned} & A^{2014}=\left[\begin{array}{ll} x_1 & x_2 \end{array}\right]\left[\begin{array}{cc} \lambda_1 & 0 \\ 0 & \lambda_2 \end{array}\right]^{2014}\left[\begin{array}{ll} x_1 & x_2 \end{array}\right]^{-1} \\ &= {\left[\begin{array}{cc} 1 & 1 \\ 1 & -1 \end{array}\right]\left[\begin{array}{cc} 1 & 0 \\ 0 & 2^{2014} \end{array}\right]\left[\begin{array}{ll} \frac{1}{2} & \frac{1}{2} \\ \frac{1}{2} & -\frac{1}{2} \end{array}\right]=\left[\begin{array}{ll} \frac{1}{2}+2^{2013} & \frac{1}{2}-2^{2013} \\ \frac{1}{2}-2^{2013} & \frac{1}{2}+2^{2013} \end{array}\right] } \end{aligned}

已知 ξ=[1,1,1]T\xi =[1,1,-1]^{ T } 是矩阵 A=[2125a31b2]A =\left[\begin{array}{ccc}2 & -1 & 2 \\ 5 & a & 3 \\ -1 & b & -2\end{array}\right] 的一个特征向量. (1)确定参数 a,ba, bξ\xi 对应的特征值 λ\lambda ; (2) AA 是否相似于对角矩阵?说明理由.

解(1)设 AA 的特征向量 ξ\xi 所对应的特征值为 λ\lambda ,则有 Aξ=λξA \xi =\lambda \xi ,即

[2125a31b2][111]=λ[111]\left[\begin{array}{ccc} 2 & -1 & 2 \\ 5 & a & 3 \\ -1 & b & -2 \end{array}\right]\left[\begin{array}{c} 1 \\ 1 \\ -1 \end{array}\right]=\lambda\left[\begin{array}{c} 1 \\ 1 \\ -1 \end{array}\right]

{212=λ,5+a3=λ,1+b+2=λ,\left\{\begin{array}{l} 2-1-2=\lambda, \\ 5+a-3=\lambda, \\ -1+b+2=-\lambda, \end{array}\right.

解得 λ=1,a=3,b=0\lambda=-1, a=-3, b=0 . (2)当 a=3,b=0a=-3, b=0 时,令

λEA=λ2125λ+3310λ+2=(λ+1)3=0|\lambda E - A |=\left|\begin{array}{ccc} \lambda-2 & 1 & -2 \\ -5 & \lambda+3 & -3 \\ 1 & 0 & \lambda+2 \end{array}\right|=(\lambda+1)^3=0

可知 λ=1\lambda=-1AA 的三重特征值,但

EA=[312523101],r(EA)=2- E - A =\left[\begin{array}{ccc} -3 & 1 & -2 \\ -5 & 2 & -3 \\ 1 & 0 & 1 \end{array}\right], \quad r(- E - A )=2

λ=1\lambda=-1 时,对应的线性无关特征向量只有一个,因此 AA 不能相似于对角矩阵.

相似的几何意义

对于初学者而言,看到矩阵相似会很疑惑,为什么要给出这个定义。其实,矩阵相似反应的是从不同“视角(坐标系)”里查看同一个视图。 比如,有一张照片,可以从不同视角进行观看,如果把每一个视角视为一个矩阵“基”,那么这些视角(矩阵)就是相似的。

在这些视角里,会有一个比较好的视角(矩阵),如下图,毫无疑问 B图效果最好,因为他不失真,而我们要做的工作是:给你一个矩阵,怎么找到最好的“基坐标”。

图片{width=500px}

关于矩阵相似的几何意义更详细介绍,请参考下一节 矩阵相似的几何意义

8._矩阵相似 - 线性代数 | OpenTech