15._实对称矩阵的对角化_λ

本章内容总体概述:假设有一头猪,我们要给他拍照,首先会选一个视角,这个视角就是矩阵(你也可以把这个矩阵理解为一个“参照物”),我们可以从不同视角给猪拍照,这些不同的视角和最初的视角是彼此相似的,如何找到不同的视角利用的就是特征值与特征向量。在这些视角里,会有一个比较好的视角(你可以理解为给猪正面拍照),这就是矩阵的对角化。 我们发现不是每个矩阵都可以对角化的,但是实对称矩阵一定可以对角化,所以,我们提出了正交相似(矩阵是一个微维表格,如果是对称矩阵,则他相当于对x,yx,y轴进行了同比例缩放,自然图像不会坍塌)。如果这个对称矩阵的行列式的值为1或者-1,这个矩阵就是正交矩阵。使用正交矩阵产生的变换就是正交变换。当使用正交变换时,图像不变(长度、角度都不变),进一步可以简单的理解为正交变换就是坐标轴的旋转。

从上面的介绍,可以看到,在对矩阵的变换里,我们是层层推进的 (1)先找相似矩阵 (2)在找相似对角化 (3)再找对称矩阵的对角化 (4)再找行列式的值为1或者-1的对称矩阵的对角化,即正交矩阵。 而普通矩阵转为正交矩阵使用的是 施密特正交化工具。

知识总结

有时候我们学习的顺序和最终使用的目的正好相反。如果站在全局看本章内容,本章的核心是:对角形矩阵Λ\Lambda,即:任给一个矩阵AA,研究它是否和Λ\Lambda相似。整个流程图大致如下:

核心工具: 我们首先给出了特征值和特征向量,利用他可以找到矩阵AA的相似矩阵。然后在研究矩阵AA和对角形相似的条件。

图片

此时,矩阵分为两大类:一般矩阵AA和对称矩阵AA

第一类: 一般矩阵A要和对角形Λ\Lambda相似分为两种情况 (i) 含有n个不同的特征值,此时A一定相似对角形矩阵Λ\Lambda 相似, 具体见 特征值的求法

(ii) 特征方程含有重根,此时A即可能相似对角形也可能不相似对角形,因此需要验证他的n个特征向量是否线性相关。 怎么验证呢? 假设在解特征方程 AλE=0|A- \lambda E|=0 时,得到的 重根 λ\lambdarr 次的, 我们就要判断秩 r(AλE)r(|A- \lambda E|) 是否和 nrn-r 相等,如果相等他就能和对角形相似,如果不等就不能和对角形相似。具体可以参考 思维导图版本2 的总结

第二类: 实对称矩阵A一定和对角形相似,此时考察的是2个重点: (i) 让你求可逆矩阵P 这里只要求出他的特征值和对应的特征向量,然后把特征向量按照顺序排好,就可以得到他的可逆矩阵PP, 详见 矩阵与对角形相似 (ii)让你求正交矩阵Q. 关于如何求QQ,他是在上一步求出PP的基础上,进行施密特正交化即可,具体如何正交化会在 下一节 向量内积与正交化里的 正交变换 里介绍。本节仅是仅是介绍正交矩阵Q的基本概念,不会深入涉及

实对称矩阵的对角化

由前面介绍知道,一个 nn 阶矩阵能否对角化取决于它是否有 nn 个线性无关的特征向量。那么什么样的矩阵一定有 nn 个线性无关的特征向量呢?下面我们就来证明任一 nn 阶实对称矩阵一定存在 nn 个线性无关的特征向量,从而可以对角化.也就是说,存在可逆阵 PP ,使得 P1AP=ΛP ^{-1} A P = \Lambda 为对角阵。进一步,我们还可证明存在正交矩阵 QQ ,使得 Q1AQ=QTAQ=ΛQ ^{-1} A Q = Q^{ T } A Q= \Lambda 为对角阵。为此,我们先引人如下概念。

实对称矩阵具有非常优良的性质,他是线性代数里最为重要的矩阵。不是每个矩阵都可以对角化,但是实对称矩阵一定可以对角化。

下面我们不加证明引入一个重要结论

定理AAnn 阶实对称矩阵,则必存在正交矩阵 QQ ,使得

Q1AQ=Λ=[λ1λ2λn]Q ^{-1} A Q = \Lambda =\left[\begin{array}{llll} \lambda_1 & & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & & \lambda_n \end{array}\right]

为对角阵,其中 λ1,,λn\lambda_1, \cdots, \lambda_nAA 的特征值.且QT=Q1Q^{T}=Q^{-1}

上面这个结论告诉我们,任给一个实对称矩阵AA,一定可以找到一个矩阵QQ,这个矩阵QQ是对称的,且 Q1AQ=QAQ=ΛQ^{-1} A Q=Q^{\top} A Q=\Lambda

如果你比较上面最后一个等式,即 Q1AQ=QAQ=ΛQ^{-1} A Q=Q^{\top} A Q=\Lambda 就可以得到Q1=QTQ^{-1}=Q^{T}也就是我们找到的这个矩阵Q同时满足了他的转置等于他的逆

实对称矩阵的性质

性质1 nn阶实对称矩阵,有nn个实数特征值,其特征向量也是实数。

性质2 实对称矩阵的特征向量互相正交。

证明:设 A\boldsymbol{A} 为实对称矩阵,λ1\lambda_1λ2\lambda_2A\boldsymbol{A} 的两个不同的特征值, α1\boldsymbol{\alpha}_1α2\boldsymbol{\alpha}_2 分别为属于 λ1\lambda_1λ2\lambda_2 的实特征向量,则有

Aα1=λ1α1,Aα2=λ2α2.\boldsymbol{A} \boldsymbol{\alpha}_1=\lambda_1 \boldsymbol{\alpha}_1, \boldsymbol{A} \boldsymbol{\alpha}_2=\lambda_2 \boldsymbol{\alpha}_2 .

α1TAα2=α1T(Aα2)=λ2α1Tα2,α1TAα2=(Aα1)Tα2=λ1α1Tα2,\begin{gathered} \boldsymbol{\alpha}_1^{\mathrm{T}} \boldsymbol{A} \boldsymbol{\alpha}_2=\boldsymbol{\alpha}_1^{\mathrm{T}}\left(\boldsymbol{A} \boldsymbol{\alpha}_2\right)=\lambda_2 \boldsymbol{\alpha}_1^{\mathrm{T}} \boldsymbol{\alpha}_2, \\ \boldsymbol{\alpha}_1^{\mathrm{T}} \boldsymbol{A} \boldsymbol{\alpha}_2=\left(\boldsymbol{A} \boldsymbol{\alpha}_1\right)^{\mathrm{T}} \boldsymbol{\alpha}_2=\lambda_1 \boldsymbol{\alpha}_1^{\mathrm{T}} \boldsymbol{\alpha}_2, \end{gathered}

(λ1λ2)α1Tα2=0.\left(\lambda_1-\lambda_2\right) \boldsymbol{\alpha}_1^{\mathrm{T}} \boldsymbol{\alpha}_2=0 .

由于 λ1λ2\lambda_1 \neq \lambda_2 ,所以一定有

α1Tα2=(α1,α2)=0,\boldsymbol{\alpha}_1^{\mathrm{T}} \boldsymbol{\alpha}_2=\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2\right)=0,

因此,特征向量 α1\boldsymbol{\alpha}_1α2\boldsymbol{\alpha}_2 正交.

性质3 实对称矩阵必定相似对角形。

A=[1224]A=\left[\begin{array}{ll}1 & 2 \\ 2 & 4\end{array}\right] 求他的特征值与特征向量。 解:容易知道他的特征值为0和5,特征向量是p1=(2,1)p_1=(2,-1)p2=(1,2)p_2=(1,2)p1p_1p2p_2 互相垂直化,如果再坐标系里画出他的特征向量类似如下

图片

一个 2×22 \times 2 对称矩阵的特征向量有一个特殊形式: S=[abbc]\quad S=\left[\begin{array}{ll}a & b \\ b & c\end{array}\right]x1=[bλ1a]x _1=\left[\begin{array}{c}b \\ \lambda_1-a\end{array}\right]x2=[λ2cb]x _2=\left[\begin{array}{c}\lambda_2-c \\ b\end{array}\right]这个在问题集里面。是 x1x _1x2x _2 垂直:

实对称矩阵对角化的步骤如下

求特征值; 求特征向量; 将同一个特征值所对应的不同特征向量正交化(施密特正交化方法); 将所有正交特征向量规范化 得到 QQDD

注意:本文涉及到后面的施密特正交化,建议学完后 正交矩阵 后,再来看本文

A=(422242224)A=\left(\begin{array}{lll}4 & 2 & 2 \\ 2 & 4 & 2 \\ 2 & 2 & 4\end{array}\right) ,求正交矩阵 QQ ,使得 Q1AQ=DQ^{-1} A Q=D

第一步,是求特征值,

AλI=4λ2224λ2224λ=8λ8λ8λ24λ2224λ=(8λ)11124λ2224λ=(8λ)11102λ2002λ=(8λ)(2λ)2=0\begin{aligned} |A-\lambda I| & =\left|\begin{array}{ccc} 4-\lambda & 2 & 2 \\ 2 & 4-\lambda & 2 \\ 2 & 2 & 4-\lambda \end{array}\right|=\left|\begin{array}{ccc} 8-\lambda & 8-\lambda & 8-\lambda \\ 2 & 4-\lambda & 2 \\ 2 & 2 & 4-\lambda \end{array}\right| \\ & =(8-\lambda)\left|\begin{array}{ccc} 1 & 1 & 1 \\ 2 & 4-\lambda & 2 \\ 2 & 2 & 4-\lambda \end{array}\right|=(8-\lambda)\left|\begin{array}{ccc} 1 & 1 & 1 \\ 0 & 2-\lambda & 2 \\ 0 & 0 & 2-\lambda \end{array}\right| \\ & =(8-\lambda)(2-\lambda)^2=0 \end{aligned}

我们得到特征值 λ1=8,λ2,3=2\lambda_1=8, \lambda_{2,3}=2

λ=8\lambda=8 时,

AλI=(422242224)(422242000)(242422000)(242066000)(242011000)(101011000)\begin{aligned} A-\lambda I & =\left(\begin{array}{ccc} -4 & 2 & 2 \\ 2 & -4 & 2 \\ 2 & 2 & -4 \end{array}\right) \sim\left(\begin{array}{ccc} -4 & 2 & 2 \\ 2 & -4 & 2 \\ 0 & 0 & 0 \end{array}\right) \\ & \sim\left(\begin{array}{ccc} 2 & -4 & 2 \\ -4 & 2 & 2 \\ 0 & 0 & 0 \end{array}\right) \sim\left(\begin{array}{ccc} 2 & -4 & 2 \\ 0 & -6 & 6 \\ 0 & 0 & 0 \end{array}\right) \\ & \sim\left(\begin{array}{ccc} 2 & -4 & 2 \\ 0 & 1 & -1 \\ 0 & 0 & 0 \end{array}\right) \sim\left(\begin{array}{ccc} 1 & 0 & -1 \\ 0 & 1 & -1 \\ 0 & 0 & 0 \end{array}\right) \end{aligned}

特征向量为 x1=(111)\vec{x}_1=\left(\begin{array}{l}1 \\ 1 \\ 1\end{array}\right)

λ=2\lambda=2 时,

AλI=(222222222)(111000000)A-\lambda I=\left(\begin{array}{lll} 2 & 2 & 2 \\ 2 & 2 & 2 \\ 2 & 2 & 2 \end{array}\right) \sim\left(\begin{array}{lll} 1 & 1 & 1 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{array}\right)

特征向量为 x2=(110),x3=(101)\vec{x}_2=\left(\begin{array}{c}-1 \\ 1 \\ 0\end{array}\right), \vec{x}_3=\left(\begin{array}{c}-1 \\ 0 \\ 1\end{array}\right)

第四步,是通过施密特正交化,把他正交化,然后再单位化 (3)将 x1,x2,x3\vec{x}_1, \vec{x}_2, \vec{x}_3 规范正交化。令 b1=x1,b1=3\vec{b}_1=\vec{x}_1,\left\|\vec{b}_1\right\|=\sqrt{3} ,因为 x1\vec{x}_1x2,x3\vec{x}_2, \vec{x}_3 正交,我们只需要对它规范化就可以了。

e1=b1b1=(131313)\vec{e}_1=\frac{\vec{b}_1}{\left\|\vec{b}_1\right\|}=\left(\begin{array}{c} \frac{1}{\sqrt{3}} \\ \frac{1}{\sqrt{3}} \\ \frac{1}{\sqrt{3}} \end{array}\right)

我们对 x2,x3\vec{x}_2, \vec{x}_3 规范正交化。令 b2=x2,b2=2\vec{b}_2=\vec{x}_2,\left\|\vec{b}_2\right\|=\sqrt{2} ,单位化可得

e2=b2b2=(12120)\vec{e}_2=\frac{\vec{b}_2}{\left\|\vec{b}_2\right\|}=\left(\begin{array}{c} -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} \\ 0 \end{array}\right)

x3b2=1,b22=2\vec{x}_3 \cdot \vec{b}_2=1,\left\|\vec{b}_2\right\|^2=2 ,所以

b3=x3x3b2b22b2=(101)12(110)=(12121)\overrightarrow{b_3}=\vec{x}_3-\frac{\vec{x}_3 \cdot \vec{b}_2}{\left\|\vec{b}_2\right\|^2} \vec{b}_2=\left(\begin{array}{c} -1 \\ 0 \\ 1 \end{array}\right)-\frac{1}{2}\left(\begin{array}{c} -1 \\ 1 \\ 0 \end{array}\right)=\left(\begin{array}{c} -\frac{1}{2} \\ -\frac{1}{2} \\ 1 \end{array}\right)
b3=32, 将 b3 单位化。 e3=b3b3=(162616) 第四步,Q=(e1,e2,e3)=(12131212132601316),D=(822)\begin{aligned} &\left\|\vec{b}_3\right\|=\sqrt{\frac{3}{2}}, \text { 将 } \vec{b}_3 \text { 单位化。 }\\ &\vec{e}^3=\frac{\vec{b}_3}{\left\|\vec{b}_3\right\|}=\left(\begin{array}{c} \frac{1}{\sqrt{6}} \\ -\frac{2}{\sqrt{6}} \\ \frac{1}{\sqrt{6}} \end{array}\right)\\ &\text { 第四步,}\\ &Q=\left(\vec{e}_1, \vec{e}_2, \vec{e}_3\right)=\left(\begin{array}{ccc} -\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{3}} & \frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{\sqrt{2}}} & \frac{1}{\sqrt{3}} & -\frac{2}{\sqrt{6}} \\ 0 & \frac{1}{\sqrt{3}} & \frac{1}{\sqrt{6}} \end{array}\right), \quad D=\left(\begin{array}{ll} 8 & \\ & 2 \\ & 2 \end{array}\right) \end{aligned}

在《线性代数》里接下来应该介绍 正交矩阵和 正交相似,这部分内容涉及到向量,所以,转入到下一节里 正交矩阵

特征值与特征向量的矩阵性质总结

图片

15._实对称矩阵的对角化_λ - 概率论与数理统计 | OpenTech