特征值与特征向量反应的是线性变换里的方向不变量,一个矩阵有3个线性无关的向量,相当于找到了三维空间里的新的坐标基,在这组基下观察几何体,更简介、漂亮。详见 为什么引入特征值与特征向量
本文摘自西安电子科技大学 B站 线帒杨 的共享资料。
线性代数化归思想
注①: 公式汇总主要参考 武忠祥 编制的 线性代数公式
注②: 图片汇总主要参考 西安电子科技大学教授杨威PPT,详见B站 线帒杨
特征值与特征向量的性质 (1) 设 λ 1 , λ 2 , ⋯ , λ n \lambda_1, \lambda_2, \cdots, \lambda_n λ 1 , λ 2 , ⋯ , λ n 是 n n n 阶方阵 A \boldsymbol{A} A 的 n n n 个特征值, 则
①λ 1 + λ 2 + ⋯ + λ n = a 11 + a 22 + ⋯ + a n n \lambda_1+\lambda_2+\cdots+\lambda_n=a_{11}+a_{22}+\cdots+a_{n n} λ 1 + λ 2 + ⋯ + λ n = a 11 + a 22 + ⋯ + a nn .
② λ 1 λ 2 ⋯ λ n = ∣ A ∣ \lambda_1 \lambda_2 \cdots \lambda_n=|\boldsymbol{A}| λ 1 λ 2 ⋯ λ n = ∣ A ∣ .
公式释义:公式①反应和的不变性,即特征值之和等于主对角线元素的和,而②式反应的是积的不变性,即特征值之积为行列式的值。其实在 行列式 就介绍过,n n n 阶行列式的值就是n n n 个向量围成的体积,在特征向量坐标系,这个体积直接是对角线乘积。而和的值可以理解为距离,空间2个物体不管使用什么坐标系,尽管坐标值不懂,但是他们的距离是相同的。
(2) 矩阵 A \boldsymbol{A} A 对应于不同特征值的特征向量线性无关.
(3) 矩阵 A \boldsymbol{A} A 的 k k k 重特征值 λ \lambda λ 至多有 k k k 个线性无关的特征向量. 特别地, 当 A \boldsymbol{A} A 有 n n n 个 不同的特征值时 (没有重根), A \boldsymbol{A} A 有 n n n 个线性无关的特征向量.
(4) 设 n n n 阶方阵 A \boldsymbol{A} A 的特征值为 λ , A \lambda, \boldsymbol{A} λ , A 的属于特征值 λ \lambda λ 的特征向量为 α \boldsymbol{\alpha} α , 则
A A + k E k A A k f ( A ) A − 1 A ∗ A T P − 1 A P λ λ + k k λ λ k f ( λ ) 1 λ ∣ A ∣ λ λ λ α α α α α α α 不确 定 P − 1 α \begin{array}{|c|c|c|c|c|c|c|c|c|}
\hline \boldsymbol{A} & \boldsymbol{A}+k \boldsymbol{E} & k \boldsymbol{A} & \boldsymbol{A}^k & f(\boldsymbol{A}) & \boldsymbol{A}^{-1} & \boldsymbol{A}^* & \boldsymbol{A}^{\mathrm{T}} & \boldsymbol{P}^{-1} \boldsymbol{A} \boldsymbol{P} \\
\hline \lambda & \lambda+k & k \lambda & \lambda^k & f(\lambda) & \frac{1}{\lambda} & \frac{|\boldsymbol{A}|}{\lambda} & \lambda & \lambda \\
\hline \boldsymbol{\alpha} & \boldsymbol{\alpha} & \boldsymbol{\alpha} & \boldsymbol{\alpha} & \boldsymbol{\alpha} & \boldsymbol{\alpha} & \boldsymbol{\alpha} & \begin{array}{c}
\text { 不确 定}
\end{array} & \boldsymbol{P}^{-1} \boldsymbol{\alpha} \\
\hline
\end{array} A λ α A + k E λ + k α k A kλ α A k λ k α f ( A ) f ( λ ) α A − 1 λ 1 α A ∗ λ ∣ A ∣ α A T λ 不确 定 P − 1 A P λ P − 1 α 相似矩阵的性质 A \boldsymbol{A} A 与 B \boldsymbol{B} B 相似
⇒ A \Rightarrow \boldsymbol{A} ⇒ A 与 B \boldsymbol{B} B 有相同的特征多项式, 即 ∣ A − λ E ∣ = ∣ B − λ E ∣ |\boldsymbol{A}-\lambda \boldsymbol{E}|=|\boldsymbol{B}-\lambda \boldsymbol{E}| ∣ A − λ E ∣ = ∣ B − λ E ∣
⇒ A \Rightarrow \boldsymbol{A} ⇒ A 与 B \boldsymbol{B} B 有完全相同的特征值 (但是特征向量不一定相同)
⇒ ∣ A ∣ = ∣ B ∣ = λ 1 λ 2 ⋯ λ n , ∑ a i i = ∑ b i i \Rightarrow|\boldsymbol{A}|=|\boldsymbol{B}|=\lambda_1 \lambda_2 \cdots \lambda_n, \quad \sum a_{i i}=\sum b_{i i} ⇒ ∣ A ∣ = ∣ B ∣ = λ 1 λ 2 ⋯ λ n , ∑ a ii = ∑ b ii
⇒ A \Rightarrow \boldsymbol{A} ⇒ A 与 B \boldsymbol{B} B 等价, r ( A ) = r ( B ) \mathrm{r}(\boldsymbol{A})=\mathrm{r}(\boldsymbol{B}) r ( A ) = r ( B ) .
⇒ A T \Rightarrow \boldsymbol{A}^{\mathrm{T}} ⇒ A T 与 B T \boldsymbol{B}^{\mathrm{T}} B T 相似, A − 1 \boldsymbol{A}^{-1} A − 1 与 B − 1 \boldsymbol{B}^{-1} B − 1 相似
⇒ f ( A ) \Rightarrow f(A) ⇒ f ( A ) 与 f ( B ) f(B) f ( B ) 相似 ( f f f 为多项式)
矩阵可相似对角化的条件 (1) n n n 阶矩阵 A \boldsymbol{A} A 可以对角化的充分必要条件是: A \boldsymbol{A} A 有 n n n 个线性无关的特征向量 (即 A \boldsymbol{A} A 的 k k k 重特征值 λ \lambda λ 有 k k k 个线性无关的特征向量).
(2) n n n 阶矩阵 A \boldsymbol{A} A 可以对角化的充分条件:
① A \boldsymbol{A} A 有 n n n 个不同的特征值, 则 A \boldsymbol{A} A 一定能对角化.
② A \boldsymbol{A} A 为实对称矩阵, 则 A \boldsymbol{A} A 一定能对角化.
对角化的步骤 (1) 求出 A \boldsymbol{A} A 的特征值 λ 1 , λ 2 , ⋯ , λ n \lambda_1, \lambda_2, \cdots, \lambda_n λ 1 , λ 2 , ⋯ , λ n ;
(2) 求出 A \boldsymbol{A} A 的 n n n 个线性无关的特征向量 α 1 , α 2 , ⋯ , α n \boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n α 1 , α 2 , ⋯ , α n ;
(3) 令 P = ( α 1 , α 2 , ⋯ , α n ) , A = ( λ 1 0 λ 2 ⋱ 0 λ n ) \boldsymbol{P}=\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n\right), \boldsymbol{A}=\left(\begin{array}{cccc}\lambda_1 & & & 0 \\ & \lambda_2 & & \\ & & \ddots & \\ 0 & & & \lambda_n\end{array}\right) P = ( α 1 , α 2 , ⋯ , α n ) , A = λ 1 0 λ 2 ⋱ 0 λ n , 则 P − 1 A P = A \boldsymbol{P}^{-1} \boldsymbol{A P}=\boldsymbol{A} P − 1 AP = A .
注意α i \boldsymbol{\alpha_i} α i 的次序与λ i \lambda_i λ i 的次序一定要一致
标准正交化 将一线性无关的向量组 (以 α 1 , α 2 , α 3 \alpha_1, \alpha_2, \alpha_3 α 1 , α 2 , α 3 为例) 化为标准正交向量组的方法:
步骤 1. 施密特正交化:
β 1 = α 1 , β 2 = α 2 − ( α 2 , β 1 ) ( β 1 , β 1 ) β 1 , β 3 = α 3 − ( α 3 , β 1 ) ( β 1 , β 1 ) β 1 − ( α 3 , β 2 ) ( β 2 , β 2 ) β 2 . \begin{aligned}
& \boldsymbol{\beta}_1=\boldsymbol{\alpha}_1, \\
& \boldsymbol{\beta}_2=\boldsymbol{\alpha}_2-\frac{\left(\boldsymbol{\alpha}_2, \boldsymbol{\beta}_1\right)}{\left(\boldsymbol{\beta}_1, \boldsymbol{\beta}_1\right)} \boldsymbol{\beta}_1, \\
& \boldsymbol{\beta}_3=\boldsymbol{\alpha}_3-\frac{\left(\boldsymbol{\alpha}_3, \boldsymbol{\beta}_1\right)}{\left(\boldsymbol{\beta}_1, \boldsymbol{\beta}_1\right)} \boldsymbol{\beta}_1-\frac{\left(\boldsymbol{\alpha}_3, \boldsymbol{\beta}_2\right)}{\left(\boldsymbol{\beta}_2, \boldsymbol{\beta}_2\right)} \boldsymbol{\beta}_2 .
\end{aligned} β 1 = α 1 , β 2 = α 2 − ( β 1 , β 1 ) ( α 2 , β 1 ) β 1 , β 3 = α 3 − ( β 1 , β 1 ) ( α 3 , β 1 ) β 1 − ( β 2 , β 2 ) ( α 3 , β 2 ) β 2 . 步骤 2. 规范化(单位化):
γ 1 = β 1 ∥ β 1 ∥ , γ 2 = β 2 ∥ β 2 ∥ , γ 3 = β 3 ∥ β 3 ∥ . \gamma_1=\frac{\boldsymbol{\beta}_1}{\left\|\boldsymbol{\beta}_1\right\|}, \gamma_2=\frac{\boldsymbol{\beta}_2}{\left\|\boldsymbol{\beta}_2\right\|}, \boldsymbol{\gamma}_3=\frac{\boldsymbol{\beta}_3}{\left\|\boldsymbol{\beta}_3\right\|} . γ 1 = ∥ β 1 ∥ β 1 , γ 2 = ∥ β 2 ∥ β 2 , γ 3 = ∥ β 3 ∥ β 3 . 用正交阵将对称阵对角化的步骤 (1) 求出对称阵 A \boldsymbol{A} A 的特征值 λ 1 , λ 2 , ⋯ , λ n \lambda_1, \lambda_2, \cdots, \lambda_n λ 1 , λ 2 , ⋯ , λ n ;
(2) 求出 A \boldsymbol{A} A 的 n n n 个线性无关的特征向量 α 1 , α 2 , ⋯ , α n \boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n α 1 , α 2 , ⋯ , α n ;
(3) 将 α 1 , α 2 , ⋯ , α n \boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n α 1 , α 2 , ⋯ , α n 正交化和单位化, 得到 β 1 , β 2 , ⋯ , β n \boldsymbol{\beta}_1, \boldsymbol{\beta}_2, \cdots, \boldsymbol{\beta}_n β 1 , β 2 , ⋯ , β n ;
(4) 令 Q = ( β 1 , β 2 , ⋯ , β n ) , Λ = ( λ 1 0 λ 2 ⋱ 0 λ n ) \boldsymbol{Q}=\left(\boldsymbol{\beta}_1, \boldsymbol{\beta}_2, \cdots, \boldsymbol{\beta}_n\right), \boldsymbol{\Lambda}=\left(\begin{array}{llll}\lambda_1 & & & 0 \\ & \lambda_2 & & \\ & & \ddots & \\ 0 & & & \lambda_n\end{array}\right) Q = ( β 1 , β 2 , ⋯ , β n ) , Λ = λ 1 0 λ 2 ⋱ 0 λ n , 则 Q − 1 A Q = Q T A Q = Λ \boldsymbol{Q}^{-1} \boldsymbol{A} \boldsymbol{Q}=\boldsymbol{Q}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{Q}=\boldsymbol{\Lambda} Q − 1 A Q = Q T A Q = Λ .