1.1 特征值-特征向量方程
1.1.1 记号 我们用 Mn(F) 表示域 F 上的 n×n 矩阵,通常 F 取实数域 R 或复数域 C 。所讨论的问题几乎常常是一些适合于复数矩阵的情形,这时 Mn(C) 简记作 Mn ,对于复数矩阵的一般性质不感兴趣的读者,无论用实数代替复数来阐述什么内容,都很少在表述中,在代数中或在实际中做出本质区别。但是应注意,常常在讨论多项式的根和其他与“较大”的复数域有关的灵活性问题时, R 与 C 之间存在着较大的差别。通常,最好把实数矩阵看成具有特定元的复数矩阵。我们知道,有 n 个实分量(相应地,复分量)的所有向量组成的集合(向量空间)用 Rn (相应地 Cn )表示,并且都把它们看作列向量。最后, A=[aij]∈Mn(F) 的转置(0.2.5)是矩阵 [aij]∈Mn(F) ,记作 AT ,而当 F⊆C 时,Hermite 伴随是 A 的共轭转置 [aij] ,记作 A∗ 。类似地,如果 x∈Fn ,则 xT 表示与 x 有相同分量的行向量,而当 F⊆C 时, x∗ 表示其分量为 x 的相应分量取复共轭后的行向量。这里,“·”上加一杠一表示一个复纯量的复共轭(见附录 A),或者表示一个向量或矩阵按分量取复共轭。
矩阵 A∈Mn 可看作从 Cn 到 Cn 的线性变换(对于 Cn 的某个给定的基),不过把它看作数的一个阵列也是有用的。 A 的这两个概念是相互影响的,数的阵列能告诉有关线性变换的信息,而这正是矩阵理论的实质和应用的关键。或许,矩阵理论中最重要的概念应该是与 A 相关联的 n 个数的集合 σ(A) ,这就是 A 的特征值集合。
1.1.2 定义 设 A∈Mn , x∈Cn ,考虑方程
Ax=λx,x=0,(1.1.3) 其中 λ 是纯量。如果纯量 λ 和非零向量 x 恰好满足这个方程,那么 λ 称为 A 的一个特征值,而 x 称为 A 的属于 λ 的特征向量。注意,这两个概念不可避免地要成对出现,并且,特征向量不能是零向量。
1.1.4 定义 A∈Mn 的所有特征值 λ∈C 的集合称为 A 的谱,记作 σ(A) 。 A 的谱半径是非负实数 ρ(A)=max{λ:λ∈σ(A)} ,这正是包含 A 的所有特征值的、圆心在复平面原点的最小圆盘的半径。
练习 如果 x 是 A 的、属于 λ 的特征向量,证明 x 的任一非零纯量倍数也是特征向量.
几不说特征值和特征向量有无其他用场,仅从代数上看,它们也有意义,因为,根据(1.1.3),特征向量是这样一些向量,将它们乘以 A 后有非常简单的形式——同乘以一个纯量(特征值)效果一样。
例 考虑矩阵
A−[7−4−21]∈M2. 因为
A[2][1]=[36]=3[12], 于是,有 3∈σ(A) 及相应的特征向量 [12] ,同时, 5∈σ(A) ,可以求得相应于特征值 5 的特征向量。
我们知道,多项式
p(t)=aktk+ak−1tk−1+⋯+a1t+a0 在矩阵 A∈Mn 处取值是有明确定义的,这是因为可以自乘方阵得到一个正整数幂,并且可以作出同阶矩阵的线性组合,于是,
p(A)≡akAk+ak−1Ak−1+⋯+a1A+a0I.(1.1.5) 请注意一个有用的事实,通过多项式的关系得到的与 A∈Mn 相关的矩阵与 A 有相同的特征向量;它的诸特征值与 A 的特征值有简单的关系。
1.1.6 定理 设 p(⋅) 是给定的多项式。如果 λ 是 A∈Mn 的特征值,而 x 是相应的特征向量,那么 p(λ) 是矩阵 p(A) 的特征值,并且 x 是属于 p(λ) 的特征向量。
证明:考虑 p(A)x ,首先,
p(A)x≡akAkx+ak−1Ak−1x+⋯+a1Ax+a0x. 其次,反复应用特征值-特征向量方程便有 A′x=A′1Ax=Aj−1λx−λAj−1x=⋯=λ′x. 因此,
p(A)x=akλkx+⋯+a0x=(akλk+⋯+a0)x=p(λ)x. 练习 如果 σ(A)={−1,2} , A∈M2 , σ(A2) 是什么?
练习 如果 D=diag(d1,d2,…,dn) 是对角矩阵(0.9.1), σ(D) 是什么?给出每一个特征值的相应的特征向量。提示:考虑标准基向量 e1,i=1,2,…,n 。
1.1.7 论断 矩阵 A∈Mn 是奇异的,当且仅当 0∈σ(A) .
证明:矩阵 A 是奇异的,当且仅当对某个 x=0,Ax=0 。这个关系式成立,当且仅当对某个 x=0,Ax=0⋅x ,即当且仅当 λ=0 是特征值。
习题
假定 A∈Mn 是非奇异的,根据(1.1.7),这等价于说 A 没有等于零的特征值。如果 λ∈σ(A) ,证明 λ−1∈σ(A−1) 。如果 Ax=λx ,且 x=0 ,给出 A−1 的属于 λ−1 的一个特征向量。
如果 A∈Mn 的每一行的各分量之和(简称为行和)是 1,证明 1∈σ(A) ,提示:考虑向量 e=[1,1,…,1]T ,然后说明, A 的行和都相等,当且仅当 e 是 A 的特征向量。如果 A 是非奇异的,证明 A−1 的行和也是 1。给定多项式 p(t) ,证明 p(A) 的行和都相等。它等于什么?
设 A∈Mn(R) ,如果 λ 是 A 的一个实特征值,且 Ax=λx , 0=x∈Cn ,设 x=ξ+iη ,其中 ξ,η∈Rn 是 x 的实部和虚部。证明 Aξ=λξ 和 Aη=λη ;由此推出存在 A 的属于 λ 的实特征向量。 ξ 和 η 都是 A 的特征向量吗?可能有 A 的属于一个复的非实特征值的实特征向量吗?
考虑分块对角矩阵(0.9.2)
A=[A1100A22],An∈Mn, 证明 A 的特征值由 A11 的特征值和 A22 的特征值组成。提示:先用 A11 和 A22 的特征向量表示 A 的特征向量。
设 A∈Mn , 如果 A2=A , 就称 A 为幂等矩阵, 证明幂等矩阵的每一个特征值是 0 或 1.
设 A∈Mn , 如果对于某个正整数 q , Aq=0 , 就称 A 为幂零矩阵, 上述最小的 q 称为幂零指标. 证明幂零矩阵的所有特征值都是 0. 顺便给出一个其特征值都是 0 的非零矩阵的例子.
我们将看到,在集中要讨论的有限维结构中,每个复的或实的方阵都有一个复特征值。但是,对于一个无限维向量空间上的线性变换,就可能没有任何特征值。设 V 是由诸复数的形式无限序列组成的向量空间:
V={(a1,a2,…,ak,…):ai∈C,i=1,2,…}, 并且定义 V 上的线性变换 S 为
S(a1,a2,…)=(0,a1,a2,…). 这个线性变换有时称为移位算子,验证 S 是线性变换,并证明 S 没有任何特征值。提示:证明,如果一个向量是特征向量,它的所有分量必须相同,而这个公共值只能是0。因此,所给出的向量必须是零向量,它不可能是特征向量。
设矩阵 A∈Mn ,如果 A′=A (见0.2.5),就称 A 为Hermite矩阵,如果 A 是Hermite的,证明 A 的所有特征值都是实数。提示:设 λ∈σ(A) 是任意的,并且设 x 是相应的特征向量,于是(1.1.3)推出 x∗Ax=λx∗x 。但是 x∗Ax=x∗A∗x=x∗Ax ,所以 x∗Ax 是实数。因为 x∗x 是正的,所以 λ=x∗Ax/x∗x 也是实数。