请跟上我们的步骤:本章内容大致架构如下:给出一个矩阵A,这个矩阵A是任意的,然后介绍如何找到他的特征值与特征向量,然后给出矩阵相似的定义(A∼B),有了特征值与特征向量可以很容易找到矩阵的相似矩阵。
进一步的,在相似里我们希望矩阵A可以和对角形相似,即A∼Λ,然后我们研究后发现,不是每个矩阵都可以和对角形相似,我们得到的一个结论:如果A有不同特征值,肯定可以和对角形相似。但是这个条件还是太强不容易发现。我们进行研究,最后发现如果矩阵A是对称矩阵,则他一定可以和对角形相似,因此,我们专门把对称矩阵拿过来研究。
对称矩阵
首先,让我们回顾一下什么是对称矩阵。我希望你已经熟悉了这个概念。对称矩阵在线性代数处理中,占据非常重要的位置。 先看定义:
一个矩阵如果转置后是他本身,那么这个矩阵就是对称矩阵。
让我们举一个简单的例子来确保你明白这个概念。
A=13−1320−104 转置后,也可以理解为通过对角线进行旋转得到。
AT=13−1320−104 可以看到转置后的矩阵 AT 和原矩阵 A 相同。
那么问题来了,为什么我们现在要重温这个基本概念呢?
问题在于, 如果矩阵是对称的, 那么在我们进行特征值分解时, 它就具有一个非常有用的性质。在说明它如何有用之前,让我们先了解矩阵对称时的基本特性。
如果 A 是对称矩阵,那么:1. 矩阵 A 特征值为实数2. 矩阵 A 的特征向量是正交向量。
我们会在下一节会专门介绍实对称矩阵的对角化。总之,本节你需要记住三个核心结论即可:
(1)对称矩阵的特征值都是实数。
(2)对称矩阵的特征向量互相垂直。
(3) 实对称矩阵必定相似对角形。
为什么矩阵对称时会有这样的特性?让我们来看看证明。
证明1:对称矩阵特征值为实数
基本概念与定理:
如果矩阵 A 的元素是实数(即 A 是实矩阵), 则特征方程的系数也都是实数。这时,复特征值成对出现,且互为复共轴。例如:如果 λ1=a+bi 是特征值,则 λ2=a−bi 也是特征值
向量的复共轭定义 vi=a+bi⇒vi=a−bi
证明:
① 特征方程左右都乘 xˉT 得:
xˉTAx=xˉTλx ② 特征方程左右都取共轭得:
Ax=λˉxAxˉ=λˉxˉA 为实矩阵 xˉTAT=xˉTλˉ 转置 xˉTA=xˉTλˉA 对称 xˉTAx=xˉTλˉx 乘 x 综合①和②:
λ=λˉ 所以, λ 为实数
因此, 这个证明表明, 特征值必须是实数, 才能满足等号的要求。
第 2 个性质的证明实际上要麻烦一些。下面是第二条性质的证明。
证明2:对称矩阵 A 的特征向量是正交向量
基本概念与定理:
内积:
v 和 w 的内积:
⟨v,w⟩=vTw 如果 A 是对称矩阵
⟨Av,w⟩=(Av)Tw=vTATw=vTAw=⟨v,Aw⟩ 由此得出:
λi!λi⟨xi,xj⟩=λj=⟨λixi,xj⟩ λi⟨xi,xj⟩λi⟨xi,xj⟩−λj⟨xi,xj⟩(λi−λj)⟨xi,xj⟩⟨xi,xj⟩=0=⟨Axi,xj⟩=⟨xi,Axj⟩=λj⟨xi,xj⟩=λj⟨xi,xj⟩=0=0 所以, 特征向量 xixj 正交向量
这就是矩阵对称时特征值和特征向量的特殊性质。利用这些性质,我们实际上可以以更有用的方式修改特征分解。让我们在下一节一探究竟。
证明3:对称矩阵必定存在正交矩阵
令 λ1,λ2,…,λn 为 A 的特征值(重数计入),并选取对应的单位正交特征向量 q1,q2,…,qn(即 ∥qi∥=1 且两两正交)。构造正交矩阵:
Q=[q1,q2,…,qn] 则 QTQ=I(因为列向量单位正交)。
简单证明如下:构造矩阵Q
AQ=A[q1,q2,…,qn]=[λ1q1,λ2q2,…,λnqn]=QΛ 其中 Λ=diag(λ1,λ2,…,λn)。
左乘 QT:
QTAQ=QTQΛ=Λ
即:
QTAQ=Λ 因此,A 被正交矩阵 Q 对角化。
结论: 对于任意实对称矩阵 A,存在正交矩阵Q 使得QTAQ=Λ ,又因为 Q−1AQ=Λ 所以 QT=Q−1
上面这个结论告诉我们:对于一个实对称矩阵A,我们可以找到一个矩阵Q,这个矩阵Q是对称的,而且Q的逆等于Q的转置。
实对称矩阵为什么可以对角化?
我们可以这样理解,方阵是一个行列式。每个行或者每个列相当于对坐标系进行缩放的倍数,如果是方程,相当于x,y 都放大同样的倍数,自然图像不会变形(比如圆,同时放大或者缩小仍然是圆。 如果放大倍数不同,圆可能变成椭圆,甚至是直线,而一旦变速直线,显然他就坍塌为一维空间了,也就无法再还原了。)