14._对称矩阵的特征值与特征向量

请跟上我们的步骤:本章内容大致架构如下:给出一个矩阵AA,这个矩阵A是任意的,然后介绍如何找到他的特征值与特征向量,然后给出矩阵相似的定义(ABA \sim B),有了特征值与特征向量可以很容易找到矩阵的相似矩阵。 进一步的,在相似里我们希望矩阵A可以和对角形相似,即AΛA \sim \Lambda,然后我们研究后发现,不是每个矩阵都可以和对角形相似,我们得到的一个结论:如果AA有不同特征值,肯定可以和对角形相似。但是这个条件还是太强不容易发现。我们进行研究,最后发现如果矩阵A是对称矩阵,则他一定可以和对角形相似,因此,我们专门把对称矩阵拿过来研究。

对称矩阵

首先,让我们回顾一下什么是对称矩阵。我希望你已经熟悉了这个概念。对称矩阵在线性代数处理中,占据非常重要的位置。 先看定义:

AT=AA^T=A

一个矩阵如果转置后是他本身,那么这个矩阵就是对称矩阵。 让我们举一个简单的例子来确保你明白这个概念。

A=[131320104]A=\left[\begin{array}{ccc} 1 & 3 & -1 \\ 3 & 2 & 0 \\ -1 & 0 & 4 \end{array}\right]

转置后,也可以理解为通过对角线进行旋转得到。

AT=[131320104]A^T=\left[\begin{array}{ccc} 1 & 3 & -1 \\ 3 & 2 & 0 \\ -1 & 0 & 4 \end{array}\right]

可以看到转置后的矩阵 ATA ^T 和原矩阵 AA 相同。 那么问题来了,为什么我们现在要重温这个基本概念呢? 问题在于, 如果矩阵是对称的, 那么在我们进行特征值分解时, 它就具有一个非常有用的性质。在说明它如何有用之前,让我们先了解矩阵对称时的基本特性。

如果 AA 是对称矩阵,那么:1. 矩阵 AA 特征值为实数2. 矩阵 AA 的特征向量是正交向量。

我们会在下一节会专门介绍实对称矩阵的对角化。总之,本节你需要记住三个核心结论即可:

(1)对称矩阵的特征值都是实数。 (2)对称矩阵的特征向量互相垂直。 (3) 实对称矩阵必定相似对角形。

为什么矩阵对称时会有这样的特性?让我们来看看证明。

证明1:对称矩阵特征值为实数

Ax=λxA x=\lambda x

基本概念与定理:

  1. 如果矩阵 AA 的元素是实数(即 AA 是实矩阵), 则特征方程的系数也都是实数。这时,复特征值成对出现,且互为复共轴。例如:如果 λ1=a+bi\lambda_1=a+b i 是特征值,则 λ2=abi\lambda_2=a-b i 也是特征值

  2. 向量的复共轭定义 vi=a+bivi=abiv_i=a+b i \quad \Rightarrow \quad \overline{v_i}=a-b i

证明: ① 特征方程左右都乘 xˉT\bar{x}^T 得:

xˉTAx=xˉTλx\bar{x}^T A x=\bar{x}^T \lambda x

② 特征方程左右都取共轭得:

Ax=λˉxAxˉ=λˉxˉA 为实矩阵 \begin{aligned} & \overline{A x}=\bar{\lambda} x \\ & A \bar{x}=\bar{\lambda} \bar{x} \quad A \text { 为实矩阵 } \end{aligned}
xˉTAT=xˉTλˉ 转置 xˉTA=xˉTλˉA 对称 xˉTAx=xˉTλˉx 乘 x\begin{gathered} \bar{x}^T A^T=\bar{x}^T \bar{\lambda} \quad \text { 转置 } \\ \bar{x}^T A=\bar{x}^T \bar{\lambda} \quad A \text { 对称 } \\ \bar{x}^T A x=\bar{x}^T \bar{\lambda} x \quad \text { 乘 } x \end{gathered}

综合①和②:

λ=λˉ\lambda=\bar{\lambda}

所以, λ\lambda 为实数 因此, 这个证明表明, 特征值必须是实数, 才能满足等号的要求。

第 2 个性质的证明实际上要麻烦一些。下面是第二条性质的证明。

证明2:对称矩阵 AA 的特征向量是正交向量

基本概念与定理:

内积:

  1. vvww 的内积:

v,w=vTw\langle v, w\rangle=v^T w
  1. 如果 AA 是对称矩阵

Av,w=(Av)Tw=vTATw=vTAw=v,Aw\begin{aligned} \langle A v, w\rangle & =(A v)^T w \\ & =v^T A^T w \\ & =v^T A w \\ & =\langle v, A w\rangle \end{aligned}

由此得出:

λi!=λjλixi,xj=λixi,xj\begin{aligned} \lambda_{i}! & =\lambda_j \\ \lambda_i\left\langle x_i, x_j\right\rangle & =\left\langle\lambda_i x_i, x_j\right\rangle \end{aligned}
=Axi,xj=xi,Axj=λjxi,xjλixi,xj=λjxi,xjλixi,xjλjxi,xj=0(λiλj)xi,xj=0xi,xj=0\begin{aligned} & =\left\langle A x_i, x_j\right\rangle \\ & =\left\langle x_i, A x_j\right\rangle \\ & =\lambda_j\left\langle x_i, x_j\right\rangle \\ \lambda_i\left\langle x_i, x_j\right\rangle & =\lambda_j\left\langle x_i, x_j\right\rangle \\ \lambda_i\left\langle x_i, x_j\right\rangle-\lambda_j\left\langle x_i, x_j\right\rangle & =0 \\ \left(\lambda_i-\lambda_j\right)\left\langle x_i, x_j\right\rangle & =0 \\ \left\langle x_i, x_j\right\rangle=0 & \end{aligned}

所以, 特征向量 xixjx_i x_j 正交向量 这就是矩阵对称时特征值和特征向量的特殊性质。利用这些性质,我们实际上可以以更有用的方式修改特征分解。让我们在下一节一探究竟。

证明3:对称矩阵必定存在正交矩阵

λ1,λ2,,λn\lambda_1, \lambda_2, \ldots, \lambda_nAA 的特征值(重数计入),并选取对应的单位正交特征向量 q1,q2,,qn\mathbf{q}_1, \mathbf{q}_2, \ldots, \mathbf{q}_n(即 qi=1\|\mathbf{q}_i\| = 1 且两两正交)。构造正交矩阵:

Q=[q1,q2,,qn]Q = [\mathbf{q}_1, \mathbf{q}_2, \ldots, \mathbf{q}_n]

QTQ=IQ^T Q = I(因为列向量单位正交)。

简单证明如下:构造矩阵QQ

AQ=A[q1,q2,,qn]=[λ1q1,λ2q2,,λnqn]=QΛA Q = A [\mathbf{q}_1, \mathbf{q}_2, \ldots, \mathbf{q}_n] = [\lambda_1 \mathbf{q}_1, \lambda_2 \mathbf{q}_2, \ldots, \lambda_n \mathbf{q}_n] = Q \Lambda

其中 Λ=diag(λ1,λ2,,λn)\Lambda = \text{diag}(\lambda_1, \lambda_2, \ldots, \lambda_n)。 左乘 QTQ^T

QTAQ=QTQΛ=ΛQ^T A Q = Q^T Q \Lambda = \Lambda 即:

QTAQ=ΛQ^T A Q = \Lambda

因此,AA 被正交矩阵 QQ 对角化。

结论: 对于任意实对称矩阵 AA,存在正交矩阵QQ 使得QTAQ=ΛQ^T A Q = \Lambda ,又因为 Q1AQ=ΛQ^{-1} A Q = \Lambda 所以 QT=Q1Q^T=Q^{-1}

上面这个结论告诉我们:对于一个实对称矩阵AA,我们可以找到一个矩阵QQ,这个矩阵QQ是对称的,而且QQ的逆等于QQ的转置。

实对称矩阵为什么可以对角化?

我们可以这样理解,方阵是一个行列式。每个行或者每个列相当于对坐标系进行缩放的倍数,如果是方程,相当于x,yx,y 都放大同样的倍数,自然图像不会变形(比如圆,同时放大或者缩小仍然是圆。 如果放大倍数不同,圆可能变成椭圆,甚至是直线,而一旦变速直线,显然他就坍塌为一维空间了,也就无法再还原了。)

14._对称矩阵的特征值与特征向量 - 线性代数 | OpenTech