3.2 Jordan标准形:若干论断和应用 3.2.1 Jordan 矩阵的结构 Jordan 矩阵
J = [ J n 1 ( λ 1 ) 0 J n 2 ( λ 2 ) ⋱ 0 J n k ( λ k ) ] , n 1 ∣ n 2 ∣ ⋯ ∣ n k = n (3.2.1.1) J = \left[ \begin{array}{c c c} J _ {n _ {1}} (\lambda_ {1}) & & 0 \\ & J _ {n _ {2}} (\lambda_ {2}) & \\ & & \ddots \\ 0 & & J _ {n _ {k}} (\lambda_ {k}) \end{array} \right], \quad n _ {1} \mid n _ {2} \mid \dots \mid n _ {k} = n \tag {3.2.1.1} J = J n 1 ( λ 1 ) 0 J n 2 ( λ 2 ) 0 ⋱ J n k ( λ k ) , n 1 ∣ n 2 ∣ ⋯ ∣ n k = n ( 3.2.1.1 ) 有一个确定的结构,它使得该矩阵以及与其相似的任一矩阵的某些基本性质变得更加明显。
Jordan 块的个数 k k k (相同的子块计重复出现的次数) 是 J J J 的线性无关特征值向量的个数.
矩阵 J J J 可对角化,当且仅当 k = n k = n k = n .
相应于一个已知特征值的 Jordan 块的个数是该特征值的几何重数。它是相应的特征空间的维数。相应于一个已知特征值的所有 Jordan 块的阶数之和是该特征值的代数重数。
知道了诸特征值以及它们的代数重数和几何重数,一般不能完全确定一个 Jordan 矩阵。我们还需知道相应于每个特征值的各 Jordan 块的阶数,相应于一个特征值 λ \lambda λ 的最大 Jordan 块的阶数是 λ \lambda λ 作为其极小多项式的一个根的重数(3.3.6)。
相应于某个特征值的诸 Jordan 块的阶数可以通过计算某些幂的秩来确定。例如,如果
j = [ 2 1 0 0 2 1 0 0 0 2 2 1 0 2 2 1 0 0 2 2 ] . j = \left[ \begin{array}{c c c c c c c} 2 & 1 & 0 & & & & \\ 0 & 2 & 1 & & & 0 & \\ 0 & 0 & 2 & & & \\ & & & 2 & 1 & & \\ & & & 0 & 2 & & \\ & & & & & 2 & 1 \\ & & 0 & & & 0 & 2 \\ & & & & & & 2 \end{array} \right]. j = 2 0 0 1 2 0 0 1 2 0 2 0 1 2 0 2 0 1 2 2 . 经计算
J − 2 I = [ 0 1 0 0 0 1 0 0 0 0 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ 0 1 0 0 ⋮ ⋮ ⋮ ⋮ ⋮ 0 1 0 0 0 0 0 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ 0 0 0 0 0 ] . J - 2 I = \left[ \begin{array}{c c c c c c c c} 0 & 1 & 0 & & & & \\ 0 & 0 & 1 & & & & \\ 0 & 0 & 0 & & & & 0 \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ & & 0 & 1 & & & \\ & & 0 & 0 & & & \\ & & \vdots & \vdots & \vdots & \vdots & \vdots \\ & & & 0 & 1 & \\ 0 & 0 & 0 & 0 & 0 & \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ 0 & 0 & 0 & 0 & 0 \end{array} \right]. J − 2 I = 0 0 0 ⋮ 0 ⋮ 0 1 0 0 ⋮ 0 ⋮ 0 0 1 0 ⋮ 0 0 ⋮ 0 ⋮ 0 ⋮ 1 0 ⋮ 0 0 ⋮ 0 ⋮ ⋮ 1 0 ⋮ 0 ⋮ ⋮ ⋮ 0 ⋮ ⋮ . ( J − 2 I ) 2 = [ 0 0 1 0 0 0 0 0 0 ⋮ 0 … … … … … ⋮ 0 0 ⋮ 0 0 ⋮ ⋮ 0 0 0 ⋮ 0 0 ⋮ ⋮ ⋮ ⋮ 0 ] (J - 2 I) ^ {2} = \left[ \begin{array}{c c c c c c c c c} 0 & 0 & 1 & & & & & \\ 0 & 0 & 0 & & & & & \\ 0 & 0 & 0 & \vdots & & & 0 & \\ \dots & \dots & \dots & \dots & \dots & \vdots & \\ & & 0 & 0 & \vdots & & \\ & & 0 & 0 & \vdots & \\ & & & \vdots & 0 & 0 \\ & 0 & & \vdots & 0 & 0 \\ & & \vdots & \vdots & \vdots & \vdots & 0 \end{array} \right] ( J − 2 I ) 2 = 0 0 0 … 0 0 0 … 0 1 0 0 … 0 0 ⋮ ⋮ … 0 0 ⋮ ⋮ ⋮ … ⋮ ⋮ 0 0 ⋮ ⋮ 0 0 ⋮ 0 0 和 ( J − 2 I ) − 1 = 0 (J - 2I)^{-1} = 0 ( J − 2 I ) − 1 = 0 ,因此,我们知道
( J − 2 I ) 4 = 0 , (J - 2 I) ^ {4} = 0, ( J − 2 I ) 4 = 0 , rank ( J − 2 I ) 2 = 1 , \operatorname {r a n k} (J - 2 I) ^ {2} = 1, rank ( J − 2 I ) 2 = 1 , rank ( J − 2 I ) = 4 , \operatorname {r a n k} (J - 2 I) = 4, rank ( J − 2 I ) = 4 , ( J − 2 I ) (J - 2I) ( J − 2 I ) 是 8 × 8 8 \times 8 8 × 8 矩阵.
这组数足以确定 J J J 的分块结构。事实上, ( J − 2 I ) 3 = 0 (J - 2I)^3 = 0 ( J − 2 I ) 3 = 0 说明最大子块的阶是3。 ( J − 2 I ) 2 (J - 2I)^2 ( J − 2 I ) 2 的秩就是3阶子块的个数,因而只有一个3阶子块。 ( J − 2 I ) (J - 2I) ( J − 2 I ) 的秩是3阶子块的个数的2倍加上2阶子块的个数,因而有两个2阶子块。1阶子块的个数是 8 − ( 2 × 2 ) − 3 = 1 8 - (2 \times 2) - 3 = 1 8 − ( 2 × 2 ) − 3 = 1 。可以把同样的手续应用于具有任意阶数的若干Jordan块的直和,只要它们是相应于同一个特征值的所有子块。如果 J J J 是相应子特征值 λ \lambda λ 的这样一个直和,那么使 ( J − λ I ) k 1 = 0 (J - \lambda I)^{k_1} = 0 ( J − λ I ) k 1 = 0 的最小整数 k 1 k_1 k 1 便是最大子块的阶数。 ( J − λ I ) k 1 (J - \lambda I)^{k_1} ( J − λ I ) k 1 的秩是 k 1 k_1 k 1 阶子块的个数, ( J − λ I ) k 1 (J - \lambda I)^{k_1} ( J − λ I ) k 1 的秩是 k 1 k_1 k 1 阶子块的个数的2倍再加上 k 1 − 1 k_1 - 1 k 1 − 1 阶子块的个数,如此等等。对于 i = 0 , 1 , 2 , … , k 1 − 1 i = 0, 1, 2, \dots, k_1 - 1 i = 0 , 1 , 2 , … , k 1 − 1 , ( J − λ I ) k 1 − i (J - \lambda I)^{k_1 - i} ( J − λ I ) k 1 − i 的秩序列递归地确定出 J J J 中所有子块的阶数。
在一般的 Jordan 矩阵 (3.1.1.1) 中的所有 Jordan 子块的阶数可以通过分析某些幂的秩来确定。如果 λ 1 \lambda_{1} λ 1 是 Jordan 矩阵 J ∈ M n J \in M_{n} J ∈ M n 的特征值,那么,当我们取幂 ( J − λ 1 I ) (J - \lambda_{1}I) ( J − λ 1 I ) , ( J − λ 1 I ) 2 (J - \lambda_{1}I)^{2} ( J − λ 1 I ) 2 ,…时,只有相应子 λ 1 \lambda_{1} λ 1 的诸 Jordan 块会变成零,因为 J − λ 1 I J - \lambda_{1}I J − λ 1 I 中的其他子块都有非零对角元。最终, ( J − λ 1 I ) k (J - \lambda_{1}I)^{k} ( J − λ 1 I ) k 的秩将停止下降(不必考察任一 k > n k > n k > n );使 ( J − λ 1 I ) k (J - \lambda_{1}I)^{k} ( J − λ 1 I ) k 的秩达到它的极小值的那个最小的 k k k 值是相应于 λ 1 \lambda_{1} λ 1 的最大子块的阶。这个极小值称为特征值 λ 1 \lambda_{1} λ 1 的指标。对 ( J − λ 1 I ) (J - \lambda_{1}I) ( J − λ 1 I ) 的各次幂组成的序列的秩进行分析,就足以确定相应于 λ 1 \lambda_{1} λ 1 的诸 Jordan 块的阶数与个数,然后再对 λ 2 , λ 3 \lambda_{2}, \lambda_{3} λ 2 , λ 3 ,等等作同样的分析,因而确定出所有的子块。
131
虽然上述各个论断是针对Jordan矩阵 J J J 作出的,然而,每一个论断也同样适用于任一相似于 J J J 的矩阵。因此,如果已知矩阵 A ∈ M n A \in M_n A ∈ M n ,那么 A A A 的Jordan标准形(而不是把 A A A 变换成Jordan标准形的相似)可以通过下述步骤来确定:
求出 A A A 的所有不同的特征值,或许这可以通过求特征多项式的根来办到。
对 A A A 的每个不同的特征值 λ i \lambda_{i} λ i ,作 ( A − λ i I ) k (A - \lambda_{i}I)^{k} ( A − λ i I ) k ,其中 k = 1 , 2 , … , n k = 1, 2, \dots, n k = 1 , 2 , … , n ,然后分析这些矩阵的秩所组成的序列便可看出 A A A 的相应于特征值 λ i \lambda_{i} λ i 的所有 Jordan 块的阶数与个数。
这个算法对于手算一些简单形式的小矩阵可能是有用的,但是用计算机计算就可能失效,因为确定一个矩阵的秩的过程本来就是一个不稳定的过程。例如, Λ ε = [ 1 0 0 ε ] \Lambda_{\varepsilon} = \begin{bmatrix} 1 & 0 \\ 0 & \varepsilon \end{bmatrix} Λ ε = [ 1 0 0 ε ] 就可以使我们看清这一点;对所有 ε ≠ 0 \varepsilon \neq 0 ε = 0 , A ε A_{\varepsilon} A ε 有秩2。但对 ε = 0 \varepsilon = 0 ε = 0 ,它有秩1。
例如,这个算法在下述情形是有用的,假定有这样一个问题,要确定 Jordan 块 J k ( 0 ) ∈ M k J_{k}(0) \in M_{k} J k ( 0 ) ∈ M k 的平方的 Jordan 标准形:
A = [ 0 1 0 ⋱ ⋱ 1 0 0 ] 2 = [ 0 0 1 … 0 ⋱ ⋮ ⋱ 1 ⋱ ⋱ 0 ⋱ 0 0 ] . A = \left[ \begin{array}{c c c c} 0 & 1 & & 0 \\ & & \ddots & \\ & & \ddots & 1 \\ 0 & & & 0 \end{array} \right] ^ {2} = \left[ \begin{array}{c c c c c} 0 & 0 & 1 & \dots & 0 \\ & & & \ddots & \vdots \\ & & \ddots & & 1 \\ & & \ddots & \ddots & \\ & 0 & & \ddots & 0 \\ & & & & 0 \end{array} \right]. A = 0 0 1 ⋱ ⋱ 0 1 0 2 = 0 0 0 1 ⋱ ⋱ … ⋱ ⋱ ⋱ 0 ⋮ 1 0 0 . Λ \Lambda Λ 的各特征值都是零,对 m − [ ( k + 1 ) / 2 ] = ( k + 1 ) / 2 m - [(k + 1) / 2] = (k + 1) / 2 m − [( k + 1 ) /2 ] = ( k + 1 ) /2 的整数部分, A m = 0 A^m = 0 A m = 0 ,而如果 p = 1 , 2 , … , m − 1 p = 1, 2, \dots, m - 1 p = 1 , 2 , … , m − 1 ,则 A p ≠ 0 A^p \neq 0 A p = 0 。对于 p − 1 , 2 , … , m − 2 p - 1, 2, \dots, m - 2 p − 1 , 2 , … , m − 2 ,每个幂 A p + 1 A^{p+1} A p + 1 的秩比它的前一个幂 Λ p \Lambda^p Λ p 的秩少 2。如果 k k k 是偶数,则 Λ m − 1 \Lambda^{m-1} Λ m − 1 有秩 2,而如果 k k k 为奇数,则 A m − 1 A^{m-1} A m − 1 有秩 1。因此, A = J k 2 ( 0 ) A = J_k^2(0) A = J k 2 ( 0 ) 的 Jordan 标准形是
− J m ( 0 ) 0 − 0 J m ( 0 ) ] , k = 2 m 是 偶 数 ; \begin{array}{r} {\left. \begin{array}{l l} {- J _ {m} (0)} & {0} \\ {- 0} & {J _ {m} (0)} \end{array} \right], \quad k = 2 m \text {是 偶 数};} \end{array} − J m ( 0 ) − 0 0 J m ( 0 ) ] , k = 2 m 是 偶 数 ; 以及
[ J m ( 0 ) 0 0 J m − 1 ( 0 ) ] , k − 2 m − 1 是 奇 数 . \left[ \begin{array}{l l} J _ {m} (0) & 0 \\ 0 & J _ {m - 1} (0) \end{array} \right], \quad k - 2 m - 1 \text {是 奇 数}. [ J m ( 0 ) 0 0 J m − 1 ( 0 ) ] , k − 2 m − 1 是 奇 数 . 这一结果对于确定一个已知矩阵是否有平方根是有用的。比如,它说明不存在使 A 2 − [ 0 1 0 0 ] A^2 - \left[ \begin{array}{ll}0 & 1\\ 0 & 0 \end{array} \right] A 2 − [ 0 0 1 0 ] 的矩阵 A ∈ M 2 A \in M_2 A ∈ M 2 。
3.2.2 常系数线性微分方程组 在理论上具有重要意义的 Jordan 标准形的一个应用是分析常系数微分方程组的解。设 A ∈ M n A \in M_n A ∈ M n 是已知的,且考虑一阶初值问题
λ ′ ( t ) A x ( t ) . x ( 0 ) = x 0 是 已 知 的 , (3.2.2.1) \begin{array}{l} \lambda^ {\prime} (t) \quad A x (t). \\ x (0) = x _ {0} \text {是 已 知 的}, \tag {3.2.2.1} \\ \end{array} λ ′ ( t ) A x ( t ) . x ( 0 ) = x 0 是 已 知 的 , ( 3.2.2.1 ) 其中 x ( t ) = [ x 1 ( t ) , x 2 ( t ) , … , x n ( t ) ] T x(t) = [x_1(t), x_2(t), \dots, x_n(t)]^T x ( t ) = [ x 1 ( t ) , x 2 ( t ) , … , x n ( t ) ] T ,且撇号 ( ′ ) (^{\prime}) ( ′ ) 表示对 t t t 微分。如果 A A A 不是对角矩阵,则这个方程组是耦合的;即 x i ( t ) x_i(t) x i ( t ) 不仅与 x j ( t ) x_j(t) x j ( t ) 有关,而且还与向量 x ( t ) x(t) x ( t ) 的其他分量有关。这种耦合情形使问题变得难以解决,但是,如果可以把 A A A 变成对角(或近乎对角)的形式,那么耦合的影响可以减弱,或者甚至可以消除,因而可以很容易地求解。如果 A = S J S − 1 A = SJS^{-1} A = S J S − 1 ,其中 J J J 是 A A A 的Jordan标准形,那么(3.2.2.1)变成
y ′ ( t ) − J y ( t ) , y ( 0 ) − y 0 是 已 知 的 , (3.2.2.2) \begin{array}{l} y ^ {\prime} (t) - J y (t), \\ y (0) - y _ {0} \text {是 已 知 的}, \tag {3.2.2.2} \\ \end{array} y ′ ( t ) − J y ( t ) , y ( 0 ) − y 0 是 已 知 的 , ( 3.2.2.2 ) 其中 x ( t ) = S y ( t ) x(t) = S y(t) x ( t ) = S y ( t ) ,且 y 0 = S − 1 x 0 y_{0} = S^{-1} x_{0} y 0 = S − 1 x 0 。如果可以解出问题(3.2.2.2),那么(3.2.2.1)的解的每个分量就是(3.2.2.2)的解的诸分量的一个线性组合,且这个线性组合是由 S S S 给出的。
如果 Λ \pmb{\Lambda} Λ 是可对角化的,那么 J J J 是对角矩阵,且(3.2.2.2)正好是一个形如 y k ′ ( t ) = λ k y k ( t ) y_{k}^{\prime}(t) = \lambda_{k}y_{k}(t) y k ′ ( t ) = λ k y k ( t ) 的非耦合方程组,它有解 y k ( t ) − y k ( 0 ) e λ k t y_{k}(t) - y_{k}(0)e^{\lambda_{k}t} y k ( t ) − y k ( 0 ) e λ k t 。如果特征值 λ k \lambda_{k} λ k 是实的,这是一个简单的幂,而如果 λ k = a k + i b k \lambda_{k} = a_{k} + ib_{k} λ k = a k + i b k 是复数,它则是一个振动项 y k ( t ) = y k ( 0 ) e a k t [ cos ( b k t ) + i sin ( b k t ) ] y_{k}(t) = y_{k}(0)e^{a_{k}t}\left[\cos (b_{k}t) + i\sin (b_{k}t)\right] y k ( t ) = y k ( 0 ) e a k t [ cos ( b k t ) + i sin ( b k t ) ] 。
如果 J J J 是非对角的,解就更复杂了。相应于 J J J 中的不同Jordan块的 y ( t ) y(t) y ( t ) 的诸分量是非耦合的,因此只要考虑 J J J 是单独的Jordan块
J = [ λ 1 0 ⋱ ⋱ 1 0 λ ] ∈ M m J = \left[ \begin{array}{c c c c} \lambda & 1 & & 0 \\ & & \ddots & \\ & \ddots & & 1 \\ 0 & & & \lambda \end{array} \right] \in M _ {m} J = λ 0 1 ⋱ ⋱ 0 1 λ ∈ M m 的情形就可以了。方程组(3.2.2.2)是
y 1 ′ ( t ) = λ y 1 ( t ) + y 2 ( t ) , ⋮ ⋮ ⋮ y m − 1 ′ ( t ) = λ y m − 1 ( t ) + y m ( t ) , y m ′ ( t ) = λ y m ( t ) , \begin{array}{l} y _ {1} ^ {\prime} (t) = \lambda y _ {1} (t) + y _ {2} (t), \\ \vdots \qquad \vdots \qquad \vdots \\ y _ {m - 1} ^ {\prime} (t) = \lambda y _ {m - 1} (t) + y _ {m} (t), \\ y _ {m} ^ {\prime} (t) = \lambda y _ {m} (t), \\ \end{array} y 1 ′ ( t ) = λ y 1 ( t ) + y 2 ( t ) , ⋮ ⋮ ⋮ y m − 1 ′ ( t ) = λ y m − 1 ( t ) + y m ( t ) , y m ′ ( t ) = λ y m ( t ) , [133
它可以由下往上直接求解。从最后一个方程开始,得到
y m ( t ) = y m ( 0 ) e a , y _ {m} (t) = y _ {m} (0) e ^ {a}, y m ( t ) = y m ( 0 ) e a , 于是
y m − 1 ′ ( t ) = λ y m − 1 ( t ) + y m ( 0 ) e λ t . y _ {m - 1} ^ {\prime} (t) = \lambda y _ {m - 1} (t) + y _ {m} (0) e ^ {\lambda t}. y m − 1 ′ ( t ) = λ y m − 1 ( t ) + y m ( 0 ) e λ t . 它有解
y m − 1 ( t ) = y m ( 0 ) t e λ t + y m − 1 ( 0 ) e λ t , y _ {m - 1} (t) = y _ {m} (0) t e ^ {\lambda t} + y _ {m - 1} (0) e ^ {\lambda t}, y m − 1 ( t ) = y m ( 0 ) t e λ t + y m − 1 ( 0 ) e λ t , 于是可以把它用于下一个方程,它变成
y m − 2 ′ ( t ) = λ y m − 2 ( t ) + y m ( 0 ) t e i t + y m − 1 ( 0 ) e i t . y _ {m - 2} ^ {\prime} (t) = \lambda y _ {m - 2} (t) + y _ {m} (0) t e ^ {i t} + y _ {m - 1} (0) e ^ {i t}. y m − 2 ′ ( t ) = λ y m − 2 ( t ) + y m ( 0 ) t e i t + y m − 1 ( 0 ) e i t . 它有解
y m − 2 ( t ) = y m ( 0 ) t 2 2 e u + y m − 1 ( 0 ) t e u + y m − 2 ( 0 ) e u , y _ {m - 2} (t) = y _ {m} (0) \frac {t ^ {2}}{2} e ^ {u} + y _ {m - 1} (0) t e ^ {u} + y _ {m - 2} (0) e ^ {u}, y m − 2 ( t ) = y m ( 0 ) 2 t 2 e u + y m − 1 ( 0 ) t e u + y m − 2 ( 0 ) e u , 如此等等。显然解的每一个分量具有形式
y k ( t ) = e λ t q k ( t ) , y _ {k} (t) = e ^ {\lambda t} q _ {k} (t), y k ( t ) = e λ t q k ( t ) , 其中 q k ( t ) q_{k}(t) q k ( t ) 是次数至多为 m − 1 m - 1 m − 1 的多项式.
从上述分析可以知道,对于任一给定的初始条件 x 0 x_0 x 0 ,问题(3.2.2.1)的解 x ( t ) x(t) x ( t ) 的各个分量有形式
x t ( t ) = p 1 ( t ) e λ 1 t + p 2 ( t ) e λ 2 t + ⋯ + p k ( t ) e λ k t , x _ {t} (t) = p _ {1} (t) e ^ {\lambda_ {1} t} + p _ {2} (t) e ^ {\lambda_ {2} t} + \dots + p _ {k} (t) e ^ {\lambda_ {k} t}, x t ( t ) = p 1 ( t ) e λ 1 t + p 2 ( t ) e λ 2 t + ⋯ + p k ( t ) e λ k t , 其中 λ 1 , λ 2 , … , λ t \lambda_1, \lambda_2, \dots, \lambda_t λ 1 , λ 2 , … , λ t 是 A A A 的不同的特征值,而每个 p i ( t ) p_i(t) p i ( t ) 是多项式,它的次数严格小于相应于 λ i \lambda_i λ i 的最大 Jordan 块的阶数。实特征值产生纯指数项,而复特征值可以产生混合指数和振动项。
3.2.3 矩阵与它的转置的相似性 每个 Jordan 块置换相似于它的转置,因为从相似性可以看出
[ 0 1 ⋱ 1 1 0 ] [ λ 1 0 ⋱ ⋱ 1 0 λ ] [ 0 1 ⋱ 1 1 0 ] = [ λ 0 1 ⋱ ⋱ 0 1 λ ] . \left[ \begin{array}{c c c c} 0 & & & 1 \\ & & \ddots & \\ & 1 & & \\ 1 & & & 0 \end{array} \right] \left[ \begin{array}{c c c c} \lambda & 1 & & 0 \\ & & \ddots & \\ & & \ddots & 1 \\ 0 & & & \lambda \end{array} \right] \left[ \begin{array}{c c c c} 0 & & & 1 \\ & & \ddots & \\ & 1 & & \\ 1 & & & 0 \end{array} \right] = \left[ \begin{array}{c c c c} \lambda & & & 0 \\ 1 & & \ddots & \\ & \ddots & & \\ 0 & & 1 & \lambda \end{array} \right]. 0 1 1 ⋱ 1 0 λ 0 1 ⋱ ⋱ 0 1 λ 0 1 1 ⋱ 1 0 = λ 1 0 ⋱ ⋱ 1 0 λ . 因此,如果 A ∈ M n A \in M_{n} A ∈ M n 是已知的,且 A = S J S 1 A = SJS^{1} A = S J S 1 是它的Jordan标准形,那么, A A A 相似于 J J J ,而 J J J 相似于 J T J^{T} J T , J T J^{T} J T 又相似于 A T = ( S T ) − 1 J T ( S T ) A^{T} = (S^{T})^{-1}J^{T}(S^{T}) A T = ( S T ) − 1 J T ( S T ) 。结论是,每个复矩阵相似于它的转置。由此推出,一个复矩阵的行秩(线性无关行的最大个数)等于它的列秩(线性无关列的最大个数),这是因为秩是相似不变量。同时也推出, A A A 和 A T A^{T} A T 有相同的特征值,不过,直接作出所有这些推论也是比较容易的。
对任意的域 F \mathbf{F} F ,情形也是这样, M n ( F ) M_{n}(\mathbf{F}) M n ( F ) 中的每个矩阵都可经 M n ( F ) M_{n}(\mathbf{F}) M n ( F ) 中的一个矩阵相似于它的转置;且不必假定 F = C \mathbf{F} = \mathbf{C} F = C 。实际上,相似矩阵可以取为对称矩阵。
[134]
3.2.4 交换矩阵和非减次矩阵 如果 p ( t ) p(t) p ( t ) 是多项式,而 A ∈ M n A \in M_n A ∈ M n 是已知矩阵,显然 p ( A ) p(A) p ( A ) 与 A A A 可交换,这是一个有用的事实。可是反过来又如何呢?如果 A , B ∈ M n A, B \in M_n A , B ∈ M n 是已知的,且 A A A 与 B B B 可交换, B B B 必定是关于 A A A 的多项式吗?当然不是这样,因为如果取 A = I A = I A = I ,则 A A A 与每个矩阵都可交换, p ( I ) = p ( 1 ) I p(I) = p(1)I p ( I ) = p ( 1 ) I 不可能产生任何非纯量矩阵。问题是 A A A 这一形式使它能与许多矩阵可交换,但又只允许它产生少数形如 p ( A ) p(A) p ( A ) 的矩阵。为了得到这方面的任何结果,必须寻求协调这两种能力之间的关系的某个折中办法。
3.2.4.1 定义 矩阵 A ∈ M n A \in M_{n} A ∈ M n 叫做非减次矩阵,是指 A A A 的每个特征值有几何重数 1.
因为 Jordan 矩阵的一个特征值的几何重数等于相应于该特征值的 Jordan 块的个数,所以,一个矩阵是非减次的,当且仅当相应于每个不同的特征值恰好有 - 个 Jordan 块。例如,如果 A ∈ M n A \in M_n A ∈ M n 有 n n n 个不同的特征值,或者 A A A 只有一个特征值,而该特征值有几何重数 1,那么它是非减次的。纯量矩阵不是非减次矩阵。
3.2.4.2 定理 设 A ∈ M n A \in M_{n} A ∈ M n 是给定的非减次矩阵,矩阵 B ∈ M n B \in M_{n} B ∈ M n 与 A A A 可交换,当且仅当存在一个次数至多为 n − 1 n - 1 n − 1 的多项式 p ( ⋅ ) p(\cdot) p ( ⋅ ) 使得 B = p ( A ) B = p(A) B = p ( A ) .
证明:如果 B = p ( A ) B = p(A) B = p ( A ) ,那么 B B B 一定与 B B B 可交换.关于逆命题,设 A = S J S − 1 A = SJS^{-1} A = S J S − 1 是 A A A 的Jordan标准形.如果 B A = A B BA = AB B A = A B ,那么 B S J S − 1 = S J S − 1 B BSJS^{-1} = SJS^{-1}B BS J S − 1 = S J S − 1 B 且 ( S − 1 B S ) J = J ( S − 1 B S ) (S^{-1}BS)J = J(S^{-1}BS) ( S − 1 BS ) J = J ( S − 1 BS ) ,如果能够证明 S − 1 B S = p ( J ) S^{-1}BS = p(J) S − 1 BS = p ( J ) ,那么 B − S p ( J ) S − 1 = p ( S J S − 1 ) = p ( A ) B - Sp(J)S^{-1} = p(SJS^{-1}) = p(A) B − Sp ( J ) S − 1 = p ( S J S − 1 ) = p ( A ) ,因此,只要假定 A A A 本身就是一个Jordan矩阵就可以了.因为 A A A 是非减次的,所以可以假定
A = [ J n 1 ( λ 1 ) 0 J n 2 ( λ 2 ) ⋱ 0 J n k ( λ k ) ] , A = \left[ \begin{array}{c c c c} J _ {n _ {1}} (\lambda_ {1}) & & & 0 \\ & J _ {n _ {2}} (\lambda_ {2}) & & \\ & & \ddots & \\ 0 & & & J _ {n _ {k}} (\lambda_ {k}) \end{array} \right], A = J n 1 ( λ 1 ) 0 J n 2 ( λ 2 ) ⋱ 0 J n k ( λ k ) , 其中 λ 1 , λ 2 , … , λ k \lambda_1, \lambda_2, \dots, \lambda_k λ 1 , λ 2 , … , λ k 是 A A A 的 k k k 个不同的特征值,如果把 B B B 写成与 A A A 的上述形式相同的分块形式 B = ( B n ) B = (B_n) B = ( B n ) ,那么 A B − B A AB - BA A B − B A 的相应非对角子块具有形式
J n ( λ i ) B i j − B i j J n j ( λ j ) = 0 , i ≠ j . J _ {n} \left(\lambda_ {i}\right) B _ {i j} - B _ {i j} J _ {n _ {j}} \left(\lambda_ {j}\right) = 0, \quad i \neq j. J n ( λ i ) B ij − B ij J n j ( λ j ) = 0 , i = j . 因为特征值 λ 1 \lambda_{1} λ 1 和 λ j \lambda_{j} λ j 是不同的,由此可以得出[见(2.4)节习题9], B i j = 0 B_{ij} = 0 B ij = 0 是这些方程的唯一解,因此矩阵 B B B 必须是分块对角矩阵
B = [ B 1 0 B 2 ⋱ 0 B k ] , B = \left[ \begin{array}{c c c c} B _ {1} & & & 0 \\ & B _ {2} & & \\ & & \ddots & \\ 0 & & & B _ {k} \end{array} \right], B = B 1 0 B 2 ⋱ 0 B k , 其中每个 B i ∈ M n i B_{i} \in M_{n_{i}} B i ∈ M n i 。交换性假设是说,对于所有 i = 1 , 2 , … , k i = 1, 2, \dots, k i = 1 , 2 , … , k ,有 B i J n i ( λ i ) = J n i ( λ i ) B i B_{i} J_{n_{i}}(\lambda_{i}) = J_{n_{i}}(\lambda_{i}) B_{i} B i J n i ( λ i ) = J n i ( λ i ) B i 。如果记 J n i ( λ i ) = λ i I + N i J_{n_{i}}(\lambda_{i}) = \lambda_{i} I + N_{i} J n i ( λ i ) = λ i I + N i ,其中
N i = [ 0 1 0 ⋱ ⋱ 1 0 0 ] ∈ M n , N _ {i} = \left[ \begin{array}{c c c} 0 & 1 & 0 \\ & \ddots & \\ & \ddots & 1 \\ 0 & & 0 \end{array} \right] \in M _ {n}, N i = 0 0 1 ⋱ ⋱ 0 1 0 ∈ M n , 那么这些恒等式变成 B i N i = N i B i B_{i}N_{i} = N_{i}B_{i} B i N i = N i B i , i = 1 i = 1 i = 1 ,2,…,k.直接计算可知,由于 N i N_{i} N i 的特殊形式每个 B i B_{i} B i 必须是具有Toeplitz形式(0.9.7)的上三角矩阵,即
B t = [ b 1 ( t ) b 2 ( t ) … b n 1 ( t ) b 1 ( t ) ⋱ ⋮ 0 ⋱ b 2 ( t ) b 1 ( t ) ] , (3.2.4.3) B _ {t} = \left[ \begin{array}{c c c c} b _ {1} ^ {(t)} & b _ {2} ^ {(t)} & \dots & b _ {n _ {1}} ^ {(t)} \\ & b _ {1} ^ {(t)} & \ddots & \vdots \\ 0 & & \ddots & b _ {2} ^ {(t)} \\ & & & b _ {1} ^ {(t)} \end{array} \right], \tag {3.2.4.3} B t = b 1 ( t ) 0 b 2 ( t ) b 1 ( t ) … ⋱ ⋱ b n 1 ( t ) ⋮ b 2 ( t ) b 1 ( t ) , ( 3.2.4.3 ) 136
其中沿着各对角线的诸元素取常值。如果可以构造出一些次数至多是 n − 1 n - 1 n − 1 的多项式 p i ( t ) p_{i}(t) p i ( t ) ,且具有性质:对所有 i ≠ j i \neq j i = j , p i ( J κ i ( λ j ) ) = 0 p_{i}(J_{\kappa_{i}}(\lambda_{j})) = 0 p i ( J κ i ( λ j )) = 0 而 p i ( J κ i ( λ i ) ) = B i p_{i}(J_{\kappa_{i}}(\lambda_{i})) = B_{i} p i ( J κ i ( λ i )) = B i ,那么
p ( t ) = p 1 ( t ) + ⋯ + p k ( t ) p (t) = p _ {1} (t) + \dots + p _ {k} (t) p ( t ) = p 1 ( t ) + ⋯ + p k ( t ) 将满足定理的论断. 定义
q t ( t ) = ∏ i = 1 j = 1 k ( t − λ j ) n i , q t ( t ) 的 次 数 = n − n i , q _ {t} (t) = \prod_ {\substack {i = 1 \\ j = 1}} ^ {k} (t - \lambda_ {j}) ^ {n _ {i}}, \quad q _ {t} (t) \text {的 次 数} = n - n _ {i}, q t ( t ) = i = 1 j = 1 ∏ k ( t − λ j ) n i , q t ( t ) 的 次 数 = n − n i , 由此可见,对所有 i ≠ j i \neq j i = j 有 q i ( J n j ( λ j ) ) = 0 q_{i}(J_{n_{j}}(\lambda_{j})) = 0 q i ( J n j ( λ j )) = 0 ,这是因为 ( J n j ( λ j ) − λ j I ) n j = 0 (J_{n_{j}}(\lambda_{j}) - \lambda_{j}I)^{n_{j}} = 0 ( J n j ( λ j ) − λ j I ) n j = 0 。显然 q i ( J n i ( λ i ) ) q_{i}(J_{n_{i}}(\lambda_{i})) q i ( J n i ( λ i )) 不一定等于 B i B_{i} B i ,可是它是非奇异矩阵(因为诸 λ i \lambda_{i} λ i 是各不相同的),且像关于 J n i ( λ i ) J_{n_{i}}(\lambda_{i}) J n i ( λ i ) 的任一个多项式那样,具有形式(3.2.4.3).
因为形如(3.2.4.3)的任一非奇异矩阵的逆具有同一形式,又因为这种形式的任意两个矩阵的乘积还是这同一形式,所以矩阵
[ q i ( J n ( λ i ) ) ] − 1 B i \left[ q _ {i} \left(J _ {n} (\lambda_ {i})\right) \right] ^ {- 1} B _ {i} [ q i ( J n ( λ i ) ) ] − 1 B i 是具有Toeplitz形式(3.2.4.3)的上三角矩阵,每个这样的矩阵可以写成关于 J n i ( λ i ) J_{n_i}(\lambda_i) J n i ( λ i ) 的一个多项式.例如
B t − b 1 ( 1 ) ( J n t ( λ t ) − λ t I ) c + b 2 ( 1 ) ( J n t ( λ t ) λ t I ) 1 + ⋯ − b n t ( 1 ) ( J n t ( λ t ) λ t I ) n t . B _ {t} - b _ {1} ^ {(1)} \left(J _ {n _ {t}} (\lambda_ {t}) - \lambda_ {t} I\right) ^ {c} + b _ {2} ^ {(1)} \left(J _ {n _ {t}} (\lambda_ {t}) \quad \lambda_ {t} I\right) ^ {1} + \dots - b _ {n _ {t}} ^ {(1)} \left(J _ {n _ {t}} (\lambda_ {t}) \quad \lambda_ {t} I\right) ^ {n _ {t}}. B t − b 1 ( 1 ) ( J n t ( λ t ) − λ t I ) c + b 2 ( 1 ) ( J n t ( λ t ) λ t I ) 1 + ⋯ − b n t ( 1 ) ( J n t ( λ t ) λ t I ) n t . 因此,存在一个次数至多是 n i − 1 n_{i} - 1 n i − 1 的多项式 r i ( t ) r_i(t) r i ( t ) ,使得
[ q i ( J n 1 ( λ i ) ) ] 1 B i = r i ( J n i ( λ i ) ) . \left[ q _ {i} \left(J _ {n _ {1}} (\lambda_ {i})\right) \right] ^ {1} B _ {i} = r _ {i} \left(J _ {n _ {i}} (\lambda_ {i})\right). [ q i ( J n 1 ( λ i ) ) ] 1 B i = r i ( J n i ( λ i ) ) . 如果现在令 p i ( t ) = q i ( t ) r i ( t ) p_{i}(t) = q_{i}(t)r_{i}(t) p i ( t ) = q i ( t ) r i ( t ) , p i ( t ) p_{i}(t) p i ( t ) 的次数至多是 n − 1 n - 1 n − 1 。
p r ( J n i ( λ j ) ) − q r ( J n j ( λ j ) ) r r ( J n j ( λ j ) ) = 0 r r ( J n j ( λ j ) ) = 0 , p _ {r} \left(J _ {n _ {i}} \left(\lambda_ {j}\right)\right) - q _ {r} \left(J _ {n _ {j}} \left(\lambda_ {j}\right)\right) r _ {r} \left(J _ {n _ {j}} \left(\lambda_ {j}\right)\right) = 0 r _ {r} \left(J _ {n _ {j}} \left(\lambda_ {j}\right)\right) = 0, p r ( J n i ( λ j ) ) − q r ( J n j ( λ j ) ) r r ( J n j ( λ j ) ) = 0 r r ( J n j ( λ j ) ) = 0 , 如果 i ≠ j i \neq j i = j ,则 p i ( J n i ( λ i ) ) − q i ( J n i ( λ i ) ) r i ( J n i ( λ i ) ) = B i p_{i}(J_{n_{i}}(\lambda_{i})) - q_{i}(J_{n_{i}}(\lambda_{i}))r_{i}(J_{n_{i}}(\lambda_{i})) = B_{i} p i ( J n i ( λ i )) − q i ( J n i ( λ i )) r i ( J n i ( λ i )) = B i 。
定理的逆命题也同样成立,因而导出非减次矩阵的一个特征:矩阵 A ∈ M n A \in M_{n} A ∈ M n 是非减次的,当且仅当每个与 A A A 可交换的矩阵是 A A A 的一个多项式.
3.2.5 收敛矩阵 矩阵 A ∈ M n A \in M_{n} A ∈ M n 如果有具性质:当 m → ∞ m \to \infty m → ∞ 时, A m A^{m} A m 的所有元素都趋于零,就称 A A A 为收敛矩阵。这样的矩阵在数值线性代数的算法分析中起着重要的作用。如果 A A A 是对角矩阵,那么显然有: A A A 收敛,当且仅当 A A A 的所有特征值的模都严格小于 1,并且同样的结果可以推广到可对角化矩阵。
[137]
由于涉及极限运算,如何运用扰动理论把这一结果推广到未必是对角化矩阵的一般情形是不明显的。但是,可以利用Jordan标准形,如果 A = S J S − 1 A = SJS^{-1} A = S J S − 1 是 A A A 的Jordan标准形,那么 A m = S J m S − 1 A^{m} = SJ^{m}S^{-1} A m = S J m S − 1 ,因而,当 m → ∞ m \to \infty m → ∞ 时 A m → 0 A^{m} \to 0 A m → 0 当且仅当 m → ∞ m \to \infty m → ∞ 时 J m → 0 J^{m} \to 0 J m → 0 。因为 J J J 是诸Jordan块的直和,
所以只要考虑Jordan块
J k ( λ ) = [ λ 1 0 ⋱ ⋱ 1 0 λ ] = [ λ 0 ⋱ 0 λ ] + [ 0 1 0 ⋱ ⋱ 1 0 0 ] = λ I ⋅ N k ∈ M k , 其 中 N k = J k ( 0 ) \begin{array}{l} J _ {k} (\lambda) = \left[ \begin{array}{c c c} \lambda & 1 & 0 \\ & \ddots & \\ & \ddots & 1 \\ 0 & & \lambda \end{array} \right] = \left[ \begin{array}{c c c} \lambda & & 0 \\ & \ddots & \\ 0 & & \lambda \end{array} \right] + \left[ \begin{array}{c c c} 0 & 1 & 0 \\ & & \\ & \ddots & \\ & \ddots & 1 \\ 0 & & 0 \end{array} \right] \\ = \lambda I \cdot N _ {k} \in M _ {k}, \quad \text {其 中} N _ {k} = J _ {k} (0) \\ \end{array} J k ( λ ) = λ 0 1 ⋱ ⋱ 0 1 λ = λ 0 ⋱ 0 λ + 0 0 1 ⋱ ⋱ 0 1 0 = λ I ⋅ N k ∈ M k , 其 中 N k = J k ( 0 ) 的各次幂的性质就可以了,因为,对所有 m ≥ k m \geq k m ≥ k , N k m = 0 \mathbf{N}_k^m = 0 N k m = 0 ,有
[ J k ( λ ) ] m = ( λ I + N k ) m = ∑ i = 1 m ( m i ) λ i N k m − i = ∑ i = m m ( m i ) λ i N k m − i . \left[ J _ {k} (\lambda) \right] ^ {m} = \left(\lambda I + N _ {k}\right) ^ {m} = \sum_ {i = 1} ^ {m} \binom {m} {i} \lambda^ {i} N _ {k} ^ {m - i} = \sum_ {i = m} ^ {m} \binom {m} {i} \lambda^ {i} N _ {k} ^ {m - i}. [ J k ( λ ) ] m = ( λ I + N k ) m = i = 1 ∑ m ( i m ) λ i N k m − i = i = m ∑ m ( i m ) λ i N k m − i . 对所有的 m ⩾ k m \geqslant k m ⩾ k 成立,因为各对角元都为 λ m \lambda^m λ m ,如果 J m → 0 J^{m} \to 0 J m → 0 ,则必定有 λ m → 0 \lambda^m \to 0 λ m → 0 ,这说明 ∣ λ ∣ < 1 |\lambda| < 1 ∣ λ ∣ < 1 。反过来,如果 ∣ λ ∣ < 1 |\lambda| < 1 ∣ λ ∣ < 1 ,我们想证明,对每个 j = 0 , 1 , 2 , … , k − 1 j = 0, 1, 2, \dots, k-1 j = 0 , 1 , 2 , … , k − 1 ,
当 m → : × ; 时 , ( m m − j ) λ m − j → 0. \text {当} m \rightarrow : \times ; \text {时}, \quad \binom {m} {m - j} \lambda^ {m - j} \rightarrow 0. 当 m →: × ; 时 , ( m − j m ) λ m − j → 0. 然而,
∣ ( m m − j ) λ m − 1 ∣ = ∣ m ( m − 1 ) ( m − 2 ) ⋯ ( m − j + 1 ) λ m j ! λ j ∣ ⩽ ∣ m ′ λ m j ! λ j ∣ , \left| \binom {m} {m - j} \lambda^ {m - 1} \right| = \left| \frac {m (m - 1) (m - 2) \cdots (m - j + 1) \lambda^ {m}}{j ! \lambda^ {j}} \right| \leqslant \left| \frac {m ^ {\prime} \lambda^ {m}}{j ! \lambda^ {j}} \right|, ( m − j m ) λ m − 1 = j ! λ j m ( m − 1 ) ( m − 2 ) ⋯ ( m − j + 1 ) λ m ⩽ j ! λ j m ′ λ m , 因此,只要证明当 m → ∞ m \to \infty m → ∞ 时有 m ′ ∣ λ m → 0 m^{\prime} \mid \lambda^{m} \to 0 m ′ ∣ λ m → 0 就够了。看出这个关系的一个简单办法是取对数,并且注意到,因为 log ∣ λ ∣ < 0 \log |\lambda| < 0 log ∣ λ ∣ < 0 ,又根据L'Hopital法则,当 x → ∞ x \to \infty x → ∞ 时 ( log x ) / x → 0 (\log x) / x \to 0 ( log x ) / x → 0 ,所以当 m → ∞ m \to \infty m → ∞ 时,
j log m ∣ m log ∣ λ ∣ → − ∞ . j \log m \mid m \log | \lambda | \rightarrow - \infty . j log m ∣ m log ∣ λ ∣ → − ∞. 上述证法主要是利用A的Jordan标准形来证明,当 m → + ∞ m \rightarrow +\infty m → + ∞ 时有 A m → 0 A^{m} \rightarrow 0 A m → 0 。当且仅当A的所有特征值有小于1的模。另一个证明将在(5.6.12)中给出,它根本不依赖Jordan标准形。
3.2.6 几何重数-代数重数不等式 矩阵 A ∈ M n A \in M_{n} A ∈ M n 的一个特征值的几何重数是 A 的相应于该特征值的 Jordan 块的个数。这个数小于或等于相应于该特征值的所有 Jordan 块的阶数的和。这个和是代数重数。因此一个特征值的几何重数不大于它的代数重数;试与(1.4.9)比较。
3.2.7 可对角化矩阵和幂零矩阵 一个矩阵 A ∈ M n A \in M_{n} A ∈ M n 是幂零的,是指对某个正整数 k k k ,有 A k = 0 A^{k} = 0 A k = 0 。任一Jordan块 J k ( λ ) J_{k}(\lambda) J k ( λ ) 可以写成 J k ( λ ) = λ I + N k J_{k}(\lambda) = \lambda I + N_{k} J k ( λ ) = λ I + N k ,其中, ( N k ) k = 0 (N_{k})^{k} = 0 ( N k ) k = 0 。因此,任一Jordan块是一个对角矩阵矩与一个幂零矩阵的和。
更一般地,一个Jordan矩阵(3.2.1.1)可以写成 J = D + N J = D + N J = D + N ,其中 D D D 是对角矩阵,它的主对角线与 J J J 的主对角线相同,且 N = J − D N = J - D N = J − D 。矩阵 N N N 是幂零的,且只要 k k k 是 J J J 的最大Jordan块的阶,就有 N k = 0 N^{k} = 0 N k = 0 。
最后,如果 A ∈ M n A \in M_{n} A ∈ M n 是任一给定的矩阵,且 A = S J S − 1 A = SJS^{-1} A = S J S − 1 是Jordan标准形,那么 A = S D S − 1 + S N S − 1 = A D + A N A = SDS^{-1} + SNS^{-1} = A_{D} + A_{N} A = S D S − 1 + SN S − 1 = A D + A N ,其中 A D A_{D} A D 可对角化, A N A_{N} A N 是幂零的,且 A D A N = A N A D A_{D}A_{N} = A_{N}A_{D} A D A N = A N A D ,这是因为 D D D 和 N N N 都是具有相应的同阶子块的分块对角矩阵,且 D D D 的诸子块是纯量矩阵。
我们得出,任一 A ∈ M n A \in M_{n} A ∈ M n 可以表示成一个可对角化矩阵与一个幂零矩阵的和,且这两个被
加矩阵可交换.
习题 设 r ˉ = { A α : α ∈ f } ⊂ M n \bar{r} = \{A_{\alpha} : \alpha \in f\} \subset M_{n} r ˉ = { A α : α ∈ f } ⊂ M n 是给定的矩阵族,且附以指标集 y ˉ \bar{y} y ˉ ,又假定存在非减次矩阵 A 1 ∈ y ˉ A_{1} \in \bar{y} A 1 ∈ y ˉ ,使得对所有 α ∈ f \alpha \in f α ∈ f ,有 A α A α = A α A α A_{\alpha} A_{\alpha} = A_{\alpha} A_{\alpha} A α A α = A α A α ,证明,对每个 α ∈ y ˉ \alpha \in \bar{y} α ∈ y ˉ ,都存在一个次数至多为 n − 1 n - 1 n − 1 的多项式 p α ( t ) p_{\alpha}(t) p α ( t ) 使得 A α = p α ( A α ) A_{\alpha} = p_{\alpha}(A_{\alpha}) A α = p α ( A α ) ,因而 y ˉ \bar{y} y ˉ 是一个交换族。
设 A ∈ M n A \in M_{n} A ∈ M n 是已知的, λ i \lambda_{i} λ i 是 A A A 的一个特征值。证明 A A A 的相应于特征值 λ i \lambda_{i} λ i 的最大 Jordan 块的阶数 ( λ i \lambda_{i} λ i 的指标) 是使 rank ( A − λ i I ) k = rank ( A − λ i I ) k + 1 \operatorname{rank}(A - \lambda_{i}I)^{k} = \operatorname{rank}(A - \lambda_{i}I)^{k + 1} rank ( A − λ i I ) k = rank ( A − λ i I ) k + 1 的 k = 1 , 2 , … , n − 1 k = 1, 2, \dots, n - 1 k = 1 , 2 , … , n − 1 的最小值。
如果对某个 k ≥ n k \geq n k ≥ n , A ∈ M n A \in M_{n} A ∈ M n 有 A k = 0 A^{k} = 0 A k = 0 , 证明, 对某个 r ≤ n r \leq n r ≤ n , 有 A r = 0 A^{r} = 0 A r = 0 , 因此每个幂零矩阵有一个次数不大于其阶数的等于零的幂. 提示: 证明 0 是 A A A 仅有的特征值. 想一想 A A A 的 Jordan 标准形是什么样子? 再取幂.
设 J k ( 0 ) J_{k}(0) J k ( 0 ) 是一个已知的 Jordan 块。试利用(3.2.1)末尾的证法确定矩阵 J k 3 ( 0 ) J_{k}^{3}(0) J k 3 ( 0 ) 的三种可能的 Jordan 标准形。
设 A ∈ M n A \in M_{n} A ∈ M n 是幂零矩阵,因而对某个 k k k 有 A k = 0 A^{k} = 0 A k = 0 。证明, A A A 的特征多项式是 p A ( t ) = t n p_{A}(t) = t^{n} p A ( t ) = t n 。
作用在次数至多为3的全体多项式所组成的向量空间上的线性变换 d / d t \mathrm{d} / \mathrm{d}t d / d t : p ( t ) → p ′ ( t ) p(t) \rightarrow p'(t) p ( t ) → p ′ ( t ) ,在基 β = { 1 , t , t 2 , t 3 } \beta = \{1, t, t^2, t^3\} β = { 1 , t , t 2 , t 3 } 下有基表示
[ 0 1 0 0 0 0 2 0 0 0 0 3 0 0 0 0 ] . \left[ \begin{array}{c c c c} 0 & 1 & 0 & 0 \\ 0 & 0 & 2 & 0 \\ 0 & 0 & 0 & 3 \\ 0 & 0 & 0 & 0 \end{array} \right]. 0 0 0 0 1 0 0 0 0 2 0 0 0 0 3 0 . 这个矩阵的Jordan标准形是什么?
使 A δ = I A^{\delta} = I A δ = I 的矩阵 A ∈ M n A \in M_{n} A ∈ M n 的各种可能的 Jordan 形是什么?
只有特征多项式 p 1 ( t ) = ( t + 3 ) t ( t − 4 ) 2 p_1(t) = (t + 3)^t (t - 4)^2 p 1 ( t ) = ( t + 3 ) t ( t − 4 ) 2 的矩阵 A ∈ M 0 A \in M_0 A ∈ M 0 的各种可能的 Jordan 标准形是什么?
试用(3.2.1)中所叙述的方法确定
A = [ i 1 1 − i ] A = \left[ \begin{array}{c c} i & 1 \\ 1 & - i \end{array} \right] A = [ i 1 1 − i ] 的Jordan标准形,
试证定理(3.2.4.2)的证明中的论断:形如(3.2.4.3)的两个矩阵的乘积有同一形式,再证明一个形如(3.2.4.3)的非奇异矩阵的逆有同一形式。提示: A A A 的逆是一个关于 A A A 的多项式。
设 A , B ∈ M n A, B \in M_{n} A , B ∈ M n , 试用定理(1.3.20)的证明中的恒等式证明, A B AB A B 和 B A BA B A 的 Jordan 形中的各非奇异子块是恒等的. 这能说明 A B AB A B 与 B A BA B A 相似吗? 如果 A B AB A B 与 B A BA B A 不相似, 讨论这与它们能够相似有多大差别.
假定 A 1 , ⋯ , A k A_{1}, \cdots, A_{k} A 1 , ⋯ , A k 是已知矩阵,其中, A i ∈ M n A_{i} \in M_{n} A i ∈ M n , i = 1 , 2 , ⋯ , k i = 1, 2, \cdots, k i = 1 , 2 , ⋯ , k ,又假定 J 1 , ⋯ , J k J_{1}, \cdots, J_{k} J 1 , ⋯ , J k 是它们的相应 Jordan 标准形。证明直和
[ A 1 0 A 2 ⋱ 0 A k ] ∈ M n , n 1 + n 2 + ⋯ + n k = n \left[ \begin{array}{c c c c} A _ {1} & & & 0 \\ & A _ {2} & & \\ & & \ddots & \\ 0 & & & A _ {k} \end{array} \right] \in M _ {n}, \quad n _ {1} + n _ {2} + \dots + n _ {k} = n A 1 0 A 2 ⋱ 0 A k ∈ M n , n 1 + n 2 + ⋯ + n k = n (除了差诸对角子块的一个排列以外)有Jordan标准形
[ J 1 0 J 2 0 ⋱ J k ] . \left[ \begin{array}{c c c c} J _ {1} & & & 0 \\ & J _ {2} & & \\ 0 & & \ddots & \\ & & & J _ {k} \end{array} \right]. J 1 0 J 2 ⋱ 0 J k . 设 A ∈ M n A \in M_{n} A ∈ M n 和 B , C ∈ M m B, C \in M_{m} B , C ∈ M m 是已知的,证明,直和 [ A 0 0 B ] ∈ M n + m \left[ \begin{array}{cc} A & 0 \\ 0 & B \end{array} \right] \in M_{n+m} [ A 0 0 B ] ∈ M n + m 相似于直和 [ A 0 0 C ] \left[ \begin{array}{cc} A & 0 \\ 0 & C \end{array} \right] [ A 0 0 C ] ,当且仅当 B B B 相似于 C C C 。
设 B , C ∈ M m B, C \in M_{m} B , C ∈ M m 是已知的,证明, k k k 次直和
[ B 0 B 0 ⋱ B ] ∈ M k n 与 [ C 0 C 0 ⋱ C ] ∈ M k n , k ⩾ 1 \left[ \begin{array}{c c c c} {B} & & & {0} \\ & {B} & & \\ {0} & & {\ddots} & \\ & & & {B} \end{array} \right] \in M _ {k n} \text {与} \left[ \begin{array}{c c c c} {C} & & & {0} \\ & {C} & & \\ {0} & & {\ddots} & \\ & & & {C} \end{array} \right] \in M _ {k n}, k \geqslant 1 B 0 B ⋱ 0 B ∈ M kn 与 C 0 C ⋱ 0 C ∈ M kn , k ⩾ 1 相似,当且仅当 B B B 与 C C C 相似
设 A ∈ M n A \in M_{n} A ∈ M n 和 B , C ∈ M m B, C \in M_{m} B , C ∈ M m 是已知的,证明,直和
[ A 0 B 0 ⋱ B ] ∈ M n + k n 与 [ A 0 C 0 ⋱ C ] ∈ M n ⋅ k n , k ⩾ 1 \left[ \begin{array}{c c c c} {A} & & & {0} \\ & {B} & & \\ {0} & & {\ddots} & \\ & & & {B} \end{array} \right] \in M _ {n + k n} \text {与} \left[ \begin{array}{c c c c} {A} & & & {0} \\ & {C} & & \\ {0} & & {\ddots} & \\ & & & {C} \end{array} \right] \in M _ {n \cdot k n}, \quad k \geqslant 1 A 0 B ⋱ 0 B ∈ M n + kn 与 A 0 C ⋱ 0 C ∈ M n ⋅ kn , k ⩾ 1 相似,当且仅当 B B B 与 C C C 相似.
设 A ∈ M n A \in M_{n} A ∈ M n 有 Jordan 标准形 J n 1 ( λ 1 ) ⊕ ⋯ ⊕ J n k ( λ k ) J_{n_{1}}(\lambda_{1}) \oplus \cdots \oplus J_{n_{k}}(\lambda_{k}) J n 1 ( λ 1 ) ⊕ ⋯ ⊕ J n k ( λ k ) 。如果 A A A 是非奇异形矩阵,证明 A 2 A^{2} A 2 的 Jordan 标准形是 J n 1 ( λ 1 2 ) ⊕ ⋯ ⊕ J n k ( λ k 2 ) J_{n_{1}}(\lambda_{1}^{2}) \oplus \cdots \oplus J_{n_{k}}(\lambda_{k}^{2}) J n 1 ( λ 1 2 ) ⊕ ⋯ ⊕ J n k ( λ k 2 ) ;即 A 2 A^{2} A 2 的 Jordan 标准形恰好由与 A A A 相同的一组 Jordan 块组成,只是相应的特征值要取平方。与此类似的结论对所有幂 A k ( k ⩾ 2 ) A^{k} (k \geqslant 2) A k ( k ⩾ 2 ) 成立吗?举一个 2 × 2 2 \times 2 2 × 2 的例子说明,如果 A A A 是奇异矩阵,上述结论不成立。提示:如果 A ≠ 0 A \neq 0 A = 0 ,试证 J k 2 ( λ ) J_{k}^{2}(\lambda) J k 2 ( λ ) 的 Jordan 标准形(一个 Jordan 块)是 J k ( λ 2 ) J_{k}(\lambda^{2}) J k ( λ 2 ) 。再证明,如果 λ ≠ 0 \lambda \neq 0 λ = 0 ,
rank [ J k ( λ ) − λ I ] m = rank [ J k 2 ( λ ) − λ 2 I ] m , m = 1 , 2 , … , k \operatorname {r a n k} \left[ J _ {k} (\lambda) - \lambda I \right] ^ {m} = \operatorname {r a n k} \left[ J _ {k} ^ {2} (\lambda) - \lambda^ {2} I \right] ^ {m}, \quad m = 1, 2, \dots , k rank [ J k ( λ ) − λ I ] m = rank [ J k 2 ( λ ) − λ 2 I ] m , m = 1 , 2 , … , k 如果 A ∈ M n A \in M_{n} A ∈ M n , 证明, rank A = rank A ∗ \operatorname{rank} A = \operatorname{rank} A^{*} rank A = rank A ∗ , 当且仅当特征值 λ = 0 \lambda = 0 λ = 0 的几何重数与代数重数相等, 即 A A A 的 Jordan 标准形中相应于 λ = 0 \lambda = 0 λ = 0 的所有 Jordan 块 (如果有的话) 是 1 × 1 1 \times 1 1 × 1 的.
进一步阅读一个给定的矩阵与其转置间的相似变换矩阵总可以取为对称矩阵。该事实的证明可参看0. Taussky and H. Zassenhaus, “On the Similarity Transformation between a Matrix and Its Transpose,” Pacific J. Math. 9(1959), 893-896. 在(3.2.4)节末提到了定理(3.2.4.2)的逆命题也成立,其证明可见[HJ].