1.1_特征值-特征向量方程

1.1 特征值-特征向量方程

1.1.1 记号 我们用 Mn(F)M_{n}(\mathbf{F}) 表示域 F\mathbf{F} 上的 n×nn \times n 矩阵,通常 F\mathbf{F} 取实数域 R\mathbf{R} 或复数域 C\mathbf{C} 。所讨论的问题几乎常常是一些适合于复数矩阵的情形,这时 Mn(C)M_{n}(\mathbf{C}) 简记作 MnM_{n} ,对于复数矩阵的一般性质不感兴趣的读者,无论用实数代替复数来阐述什么内容,都很少在表述中,在代数中或在实际中做出本质区别。但是应注意,常常在讨论多项式的根和其他与“较大”的复数域有关的灵活性问题时, R\mathbf{R}C\mathbf{C} 之间存在着较大的差别。通常,最好把实数矩阵看成具有特定元的复数矩阵。我们知道,有 nn 个实分量(相应地,复分量)的所有向量组成的集合(向量空间)用 Rn\mathbb{R}^{n} (相应地 Cn\mathbb{C}^{n} )表示,并且都把它们看作列向量。最后, A=[aij]Mn(F)A = [a_{ij}] \in M_{n}(\mathbf{F}) 的转置(0.2.5)是矩阵 [aij]Mn(F)[a_{ij}] \in M_{n}(\mathbf{F}) ,记作 ATA^{T} ,而当 FC\mathbb{F} \subseteq \mathbb{C} 时,Hermite 伴随是 AA 的共轭转置 [aij][a_{ij}] ,记作 AA^{*} 。类似地,如果 xFnx \in \mathbb{F}^{n} ,则 xTx^{T} 表示与 xx 有相同分量的行向量,而当 FC\mathbb{F} \subseteq \mathbb{C} 时, xx^{*} 表示其分量为 xx 的相应分量取复共轭后的行向量。这里,“·”上加一杠一表示一个复纯量的复共轭(见附录 A),或者表示一个向量或矩阵按分量取复共轭。

矩阵 AMnA \in M_{n} 可看作从 Cn\mathbf{C}^{n}Cn\mathbf{C}^{n} 的线性变换(对于 Cn\mathbf{C}^{n} 的某个给定的基),不过把它看作数的一个阵列也是有用的。 AA 的这两个概念是相互影响的,数的阵列能告诉有关线性变换的信息,而这正是矩阵理论的实质和应用的关键。或许,矩阵理论中最重要的概念应该是与 AA 相关联的 nn 个数的集合 σ(A)\sigma(A) ,这就是 AA 的特征值集合。

1.1.2 定义 设 AMnA \in M_{n}xCnx \in \mathbf{C}^{n} ,考虑方程

Ax=λx,x0,(1.1.3)A x = \lambda x, \quad x \neq 0, \tag {1.1.3}

其中 λ\lambda 是纯量。如果纯量 λ\lambda 和非零向量 xx 恰好满足这个方程,那么 λ\lambda 称为 AA 的一个特征值,而 xx 称为 AA 的属于 λ\lambda 的特征向量。注意,这两个概念不可避免地要成对出现,并且,特征向量不能是零向量。

1.1.4 定义 AMnA \in M_{n} 的所有特征值 λC\lambda \in \mathbf{C} 的集合称为 AA 的谱,记作 σ(A)\sigma(A)AA 的谱半径是非负实数 ρ(A)=max{λ:λσ(A)}\rho(A) = \max\{\lambda : \lambda \in \sigma(A)\} ,这正是包含 AA 的所有特征值的、圆心在复平面原点的最小圆盘的半径。

练习 如果 xxAA 的、属于 λ\lambda 的特征向量,证明 xx 的任一非零纯量倍数也是特征向量.

几不说特征值和特征向量有无其他用场,仅从代数上看,它们也有意义,因为,根据(1.1.3),特征向量是这样一些向量,将它们乘以 AA 后有非常简单的形式——同乘以一个纯量(特征值)效果一样。

例 考虑矩阵

A[7241]M2.A - \left[ \begin{array}{l l} 7 & - 2 \\ - 4 & 1 \end{array} \right] \in M _ {2}.

因为

A[2][1]=[36]=3[12],A _ {[ 2 ]} ^ {[ 1 ]} = \left[ \begin{array}{l} 3 \\ 6 \end{array} \right] = 3 \left[ \begin{array}{l} 1 \\ 2 \end{array} \right],

于是,有 3σ(A)3 \in \sigma(A) 及相应的特征向量 [12]\left[ \begin{array}{l}1 \\ 2 \end{array} \right] ,同时, 5σ(A)5 \in \sigma(A) ,可以求得相应于特征值 5 的特征向量。

我们知道,多项式

p(t)=aktk+ak1tk1++a1t+a0p (t) = a _ {k} t ^ {k} + a _ {k - 1} t ^ {k - 1} + \dots + a _ {1} t + a _ {0}

在矩阵 AMnA \in M_{n} 处取值是有明确定义的,这是因为可以自乘方阵得到一个正整数幂,并且可以作出同阶矩阵的线性组合,于是,

p(A)akAk+ak1Ak1++a1A+a0I.(1.1.5)p (A) \equiv a _ {k} A ^ {k} + a _ {k - 1} A ^ {k - 1} + \dots + a _ {1} A + a _ {0} I. \tag {1.1.5}

请注意一个有用的事实,通过多项式的关系得到的与 AMnA \in M_{n} 相关的矩阵与 AA 有相同的特征向量;它的诸特征值与 AA 的特征值有简单的关系。

1.1.6 定理 设 p()p(\cdot) 是给定的多项式。如果 λ\lambdaAMnA \in M_n 的特征值,而 xx 是相应的特征向量,那么 p(λ)p(\lambda) 是矩阵 p(A)p(A) 的特征值,并且 xx 是属于 p(λ)p(\lambda) 的特征向量。

证明:考虑 p(A)xp(A)x ,首先,

p(A)xakAkx+ak1Ak1x++a1Ax+a0x.p (A) x \equiv a _ {k} A ^ {k} x + a _ {k - 1} A ^ {k - 1} x + \dots + a _ {1} A x + a _ {0} x.

其次,反复应用特征值-特征向量方程便有 Ax=A1Ax=Aj1λxλAj1x==λx.A^{\prime}x = A^{\prime 1}Ax = A^{j - 1}\lambda x - \lambda A^{j - 1}x = \dots = \lambda^{\prime}x. 因此,

p(A)x=akλkx++a0x=(akλk++a0)x=p(λ)x.p (A) x = a _ {k} \lambda^ {k} x + \dots + a _ {0} x = \left(a _ {k} \lambda^ {k} + \dots + a _ {0}\right) x = p (\lambda) x.

练习 如果 σ(A)={1,2}\sigma(A) = \{-1, 2\} , AM2A \in M_2 , σ(A2)\sigma(A^2) 是什么?

练习 如果 D=diag(d1,d2,,dn)D = \mathrm{diag}(d_1, d_2, \dots, d_n) 是对角矩阵(0.9.1), σ(D)\sigma(D) 是什么?给出每一个特征值的相应的特征向量。提示:考虑标准基向量 e1,i=1,2,,ne_1, i = 1, 2, \dots, n

1.1.7 论断 矩阵 AMnA \in M_{n} 是奇异的,当且仅当 0σ(A)0 \in \sigma(A) .

证明:矩阵 AA 是奇异的,当且仅当对某个 x0,Ax=0x \neq 0, Ax = 0 。这个关系式成立,当且仅当对某个 x0,Ax=0xx \neq 0, Ax = 0 \cdot x ,即当且仅当 λ=0\lambda = 0 是特征值。

习题

  1. 假定 AMnA \in M_n 是非奇异的,根据(1.1.7),这等价于说 AA 没有等于零的特征值。如果 λσ(A)\lambda \in \sigma(A) ,证明 λ1σ(A1)\lambda^{-1} \in \sigma(A^{-1}) 。如果 Ax=λxAx = \lambda x ,且 x0x \neq 0 ,给出 A1A^{-1} 的属于 λ1\lambda^{-1} 的一个特征向量。

  2. 如果 AMnA \in M_{n} 的每一行的各分量之和(简称为行和)是 1,证明 1σ(A)1 \in \sigma(A) ,提示:考虑向量 e=[1,1,,1]Te = [1, 1, \dots, 1]^{\mathrm{T}} ,然后说明, AA 的行和都相等,当且仅当 eeAA 的特征向量。如果 AA 是非奇异的,证明 A1A^{-1} 的行和也是 1。给定多项式 p(t)p(t) ,证明 p(A)p(A) 的行和都相等。它等于什么?

  3. AMn(R)A \in M_{n}(\mathbf{R}) ,如果 λ\lambdaAA 的一个实特征值,且 Ax=λxAx = \lambda x0xCn0 \neq x \in \mathbf{C}^{n} ,设 x=ξ+iηx = \xi + i\eta ,其中 ξ,ηRn\xi, \eta \in \mathbb{R}^{n}xx 的实部和虚部。证明 Aξ=λξA\xi = \lambda \xiAη=ληA\eta = \lambda \eta ;由此推出存在 AA 的属于 λ\lambda 的实特征向量。 ξ\xiη\eta 都是 AA 的特征向量吗?可能有 AA 的属于一个复的非实特征值的实特征向量吗?

  4. 考虑分块对角矩阵(0.9.2)

A=[A1100A22],AnMn,A = \left[ \begin{array}{l l} A _ {1 1} & 0 \\ 0 & A _ {2 2} \end{array} \right], \quad A _ {n} \in M _ {n},

证明 AA 的特征值由 A11A_{11} 的特征值和 A22A_{22} 的特征值组成。提示:先用 A11A_{11}A22A_{22} 的特征向量表示 AA 的特征向量。

  1. AMnA \in M_{n} , 如果 A2=AA^{2} = A , 就称 AA 为幂等矩阵, 证明幂等矩阵的每一个特征值是 0 或 1.

  2. AMnA \in M_{n} , 如果对于某个正整数 qq , Aq=0A^{q} = 0 , 就称 AA 为幂零矩阵, 上述最小的 qq 称为幂零指标. 证明幂零矩阵的所有特征值都是 0. 顺便给出一个其特征值都是 0 的非零矩阵的例子.

  3. 我们将看到,在集中要讨论的有限维结构中,每个复的或实的方阵都有一个复特征值。但是,对于一个无限维向量空间上的线性变换,就可能没有任何特征值。设 VV 是由诸复数的形式无限序列组成的向量空间:

V={(a1,a2,,ak,):aiC,i=1,2,},V = \{(a _ {1}, a _ {2}, \dots , a _ {k}, \dots): a _ {i} \in \mathbf {C}, i = 1, 2, \dots \},

并且定义 VV 上的线性变换 SS

S(a1,a2,)=(0,a1,a2,).S \left(a _ {1}, a _ {2}, \dots\right) = \left(0, a _ {1}, a _ {2}, \dots\right).

这个线性变换有时称为移位算子,验证 SS 是线性变换,并证明 SS 没有任何特征值。提示:证明,如果一个向量是特征向量,它的所有分量必须相同,而这个公共值只能是0。因此,所给出的向量必须是零向量,它不可能是特征向量。

  1. 设矩阵 AMnA \in M_{n} ,如果 A=AA' = A (见0.2.5),就称 AA 为Hermite矩阵,如果 AA 是Hermite的,证明 AA 的所有特征值都是实数。提示:设 λσ(A)\lambda \in \sigma(A) 是任意的,并且设 xx 是相应的特征向量,于是(1.1.3)推出 xAx=λxxx^{*}Ax = \lambda x^{*}x 。但是 xAx=xAx=xAx\overline{x^{*}Ax} = x^{*}A^{*}x = x^{*}Ax ,所以 xAxx^{*}Ax 是实数。因为 xxx^{*}x 是正的,所以 λ=xAx/xx\lambda = x^{*}Ax / x^{*}x 也是实数。