8.5 素矩阵 实际上,在Perron定理中可能用得最多的结果是定理(8.2.8)中的极限命题。定理(8.4.4)的证明说明,没有把引理(8.2.7)应用于不可约矩阵的仅有假设条件是谱半径为唯一的极大模特征值。因为 A = [ 0 1 1 0 ] A = \begin{bmatrix} 0 & 1 \\ 1 & 0 \end{bmatrix} A = [ 0 1 1 0 ] 是有两个极大模特征值的非负不可约矩阵的例子(并且对于它, lim m → + ∞ A m \lim_{m \to +\infty} A^{m} lim m → + ∞ A m 不存在),所以对不可约矩阵类作进一步的限制是必要的;而最经济的办法是缺什
么就假定什么.
8.5.0 定义 非负矩阵 A ∈ M n A \in M_{n} A ∈ M n 称为素矩阵(或本原矩阵),是指它是不可约的且只有一个极大模特征值。
素性的概念属于 Frobenius (1912). 现在, 采用与定理 (8.2.8) 相同的证明可直接由引理 (8.2.7) 得到下述极限结果.
8.5.1 定理 如果 A ∈ M n A \in M_{n} A ∈ M n 是非负素矩阵,则
lim m → [ ρ ( A ) − 1 A ] m = L > 0 , \lim _ {m \rightarrow} [ \rho (A) ^ {- 1} A ] ^ {m} = L > 0, m → lim [ ρ ( A ) − 1 A ] m = L > 0 , 其中, L = x y ′ L = xy^{\prime} L = x y ′ , A x = ρ ( A ) x Ax = \rho(A)x A x = ρ ( A ) x , Λ T y = ρ ( A ) y \Lambda^T y = \rho(A)y Λ T y = ρ ( A ) y , x > 0 x > 0 x > 0 , y > 0 y > 0 y > 0 且 x T y = 1 x^T y = 1 x T y = 1 。另外,如果 λ n − 1 \lambda_{n-1} λ n − 1 是 A A A 的特征值,且对每个特征值 λ ≠ ρ ( A ) \lambda \neq \rho(A) λ = ρ ( A ) 有 ∣ λ ∣ ⩽ ∣ λ n − 1 ∣ |\lambda| \leqslant |\lambda_{n-1}| ∣ λ ∣ ⩽ ∣ λ n − 1 ∣ ,又如果 ∣ λ n − 1 ∣ / ρ ( A ) < r < 1 |\lambda_{n-1}| / \rho(A) < r < 1 ∣ λ n − 1 ∣/ ρ ( A ) < r < 1 ,则存在常数 C = C ( r , A ) C = C(r, A) C = C ( r , A ) ,使得 ∥ [ ρ ( A ) − 1 A ] m − L ∥ ⩽ C r m \left\|[\rho(A)^{-1}A]^{m} - L\right\| \leqslant Cr^{m} [ ρ ( A ) − 1 A ] m − L ⩽ C r m 对所有 m = 1 , 2 , ⋯ m = 1, 2, \cdots m = 1 , 2 , ⋯ 成立。
我们现在已经把Perron定理的所有结果从正矩阵类推广到非负素矩阵类。但是,实际上仍然需要解决验证一个已知非负矩阵的素性问题,从理论上讲,可能希望不直接计算特征值就能做到这一点。下面的素性特征诱导出几个有用的准则,而其特征在计算上并不是有效的检验法。
8.5.2 定理 如果 A ∈ M n A \in M_{n} A ∈ M n 是非负的,则 A A A 是素矩阵,当且仅当 A m > 0 A^{m} > 0 A m > 0 对某个 m ⩾ 1 m \geqslant 1 m ⩾ 1 成立。
证明:如果 A ⩾ 0 A \geqslant 0 A ⩾ 0 ,且 Λ m > 0 \Lambda^{m} > 0 Λ m > 0 ,则从 A A A 的有向图 Γ ( A ) \Gamma(A) Γ ( A ) 的每个结点 P i P_{i} P i 到另一个结点 P j P_{j} P j 一定存在一条长恰好为 m m m 的有向道路(推论(6.2.18)).因为这是比不可约性更强的性质,所以 A A A 一定不可约.像在(8.4.3)中那样应用Perron定理(8.2.11d,e),则推出 A A A 一定是素的.反之,如果 A A A 是素矩阵,则根据定理(8.5.1)有 lim m → ∞ [ ρ ( A ) − 1 A ] m = L > 0 \lim_{m \to \infty} [\rho(A)^{-1} A]^{m} = L > 0 lim m → ∞ [ ρ ( A ) − 1 A ] m = L > 0 ,且对某个 m ⩾ 1 m \geqslant 1 m ⩾ 1 必定有 [ ρ ( A ) − 1 A ] m > 0 [\rho(A)^{-1} A]^{m} > 0 [ ρ ( A ) − 1 A ] m > 0 . □
现在联想起不可约性的图解准则,上述特征连同已有的关于非负不可约矩阵的极大模特征值的非常强的信息给我们提供了素性的图解准则。我们知道,正整数序列 k 1 , k 2 , ⋯ k_{1}, k_{2}, \cdots k 1 , k 2 , ⋯ 的最大公因子(g. c. d.)是使 k k k 为所有 k 1 , k 2 , ⋯ k_{1}, k_{2}, \cdots k 1 , k 2 , ⋯ 的因子的最大整数 k ⩾ 1 k \geqslant 1 k ⩾ 1 .
8.5.3 定理 设 A ∈ M n A \in M_{n} A ∈ M n 是不可约非负矩阵,设 { P i } \{P_{i}\} { P i } 表示有向图 Γ ( A ) \Gamma(A) Γ ( A ) 的结点集。用 L i = { k 1 ( i ) , k 2 ( i ) , … } L_{i} = \{k_{1}^{(i)}, k_{2}^{(i)}, \dots\} L i = { k 1 ( i ) , k 2 ( i ) , … } 表示 Γ ( A ) \Gamma(A) Γ ( A ) 中起点和终点都在结点 P i ( i = 1 , 2 , … , n ) P_{i} (i = 1, 2, \dots, n) P i ( i = 1 , 2 , … , n ) 的所有有向道路的长度集合。用 g i g_{i} g i 表示 L i L_{i} L i 中的所有长度的最大公因子,则 A A A 是素矩阵,当且仅当所有 g i = 1 , i = 1 , 2 , … , n g_{i} = 1, i = 1, 2, \dots, n g i = 1 , i = 1 , 2 , … , n 。
证明:我们知道,因为 Λ \pmb{\Lambda} Λ 不可约,所以其长度的集合 L i L_{i} L i 非空;对每个 i \pmb{i} i 和任意 j ≠ i j\neq i j = i ,在 Γ ( A ) \Gamma (A) Γ ( A ) 中有一条连结 P i P_{i} P i 到 P j P_{j} P j 的道路,同时在 Γ ( A ) \Gamma (A) Γ ( A ) 中也有一条连结 P j P_{j} P j 到 P i P_{i} P i 的道路.如果 A \pmb{A} A 是素矩阵,则根据定理(8.5.2),存在某个 m ⩾ 1 m\geqslant 1 m ⩾ 1 使得 A m > 0 A^{m} > 0 A m > 0 ,因而对所有 k ⩾ m k\geqslant m k ⩾ m 有 A k > 0 A^k >0 A k > 0 ,另一方面,对所有 i = 1 , … , n i = 1,\dots ,n i = 1 , … , n ,有 m , m + 1 , m + 2 , ⋯ ∈ L i m,m + 1,m + 2,\dots \in L_i m , m + 1 , m + 2 , ⋯ ∈ L i ,因而 g i = 1 g_{i} = 1 g i = 1 对所有 i = 1 , … , n i = 1,\dots ,n i = 1 , … , n 成立.
现在假设 A = [ a i j ] A = [a_{ij}] A = [ a ij ] 不是素矩阵。如果 A A A 恰好有 k > 1 k > 1 k > 1 个极大模特征值,则由推论(8.4.8)可知,对所有 i = 1 , ⋯ , n i = 1, \cdots, n i = 1 , ⋯ , n 以及所有不是 k k k 的倍数的 m m m 有 a n ( m ) ≡ 0 a_{n}^{(m)} \equiv 0 a n ( m ) ≡ 0 。因此 L i ⊂ { k , 2 k , 3 k , ⋯ } L_{i} \subset \{k, 2k, 3k, \cdots\} L i ⊂ { k , 2 k , 3 k , ⋯ } ,因而 g i ≥ k > 1 g_{i} \geq k > 1 g i ≥ k > 1 对所有 i = 1 , ⋯ , n i = 1, \cdots, n i = 1 , ⋯ , n 成立。
8.5.4 附注 比定理(8.5.3)中的论断稍微进一步的结论也成立;事实上,总有 g 1 = g 2 = ⋯ = g n g_{1} = g_{2} = \cdots = g_{n} g 1 = g 2 = ⋯ = g n ,而 g i g_{i} g i 个项的公共值恰好是 A A A 的极大模特征值的个数。这就是 Romanovsky 定理。
下面的结果在许多场合是有用的;特别是它证明了具有正主对角元的不可约非负矩阵一定是素矩阵。
8.5.5 引理 如果 A ∈ M n A \in M_{n} A ∈ M n 是不可约非负矩阵,又如果 A A A 的所有主对角元都是正的,则 A n − 1 > 0 A^{n-1} > 0 A n − 1 > 0 .
证明:如果 α = min { a 11 , a 22 , … , a n n } \alpha = \min \{a_{11}, a_{22}, \dots, a_{nn}\} α = min { a 11 , a 22 , … , a nn } ,又如果定义
B = A − diag ( a 11 , a 22 , … , a n n ) , B = A - \operatorname {d i a g} \left(a _ {1 1}, a _ {2 2}, \dots , a _ {n n}\right), B = A − diag ( a 11 , a 22 , … , a nn ) , 则 B B B 是不可约非负矩阵(因为 A A A 是不可约的),且 A ⩾ α I + B = α [ I + ( 1 / α ) B ] A \geqslant \alpha I + B = \alpha [I + (1 / \alpha)B] A ⩾ α I + B = α [ I + ( 1/ α ) B ] ,因而由引理(8.4.1)可知, A n − 1 ⩾ α n − 1 [ I + ( 1 / α ) B ] n − 1 > 0 A^{n-1} \geqslant \alpha^{n-1}[I + (1 / \alpha)B]^{n-1} > 0 A n − 1 ⩾ α n − 1 [ I + ( 1/ α ) B ] n − 1 > 0 . □
练习 试说明,当对具有正对角元的非负方阵取升幂时,变成正元的任何元在所有各次幂中仍然是正的。
虽然不可约矩阵的幂可能是可约的,但是素矩阵的所有幂都是素矩阵。
8.5.6 引理 设 A ∈ M n A \in M_{n} A ∈ M n 是非负素矩阵,则对所有 k = 1 , 2 , … , A k k = 1,2,\dots ,A^{k} k = 1 , 2 , … , A k 是不可约非负素矩阵
证明:因为 A A A 的所有充分大的幂是正的,所以对任意 k k k , A k A^k A k 也是正的.假如对某个 k k k , A k A^k A k 是可约的,则 A k A^k A k 的所有幂也是可约的,因而不可能是正的.因为这与 A A A 的所有充分大的幂是正的事实相矛盾,所以对 A A A 的任何次幂都不可能是可约的. □
从计算上考虑,定理(8.5.2)中的特征本身不是验证素性的有效方法,因为要计算的幂没有给出其上界。如果求出 m m m 使 A m > 0 A^{m} > 0 A m > 0 ,则 A A A 是素矩阵;但是,如果我们还没有得到一个正幂,那么什么时候终止这种计算呢?下述定理给出的有限界回答了这个问题。
8.5.7 定理 设 A ∈ M n A \in M_{n} A ∈ M n 是非负矩阵。如果 Λ \Lambda Λ 是素矩阵,则对某个正整数 k ⩽ ( n − 1 ) n k k \leqslant (n - 1)n^{k} k ⩽ ( n − 1 ) n k 有 A k > 0 A^{k} > 0 A k > 0 。
证明:因为 A A A 是不可约的,则在 Γ ( A ) \Gamma(A) Γ ( A ) 中存在从结点 P 1 P_{1} P 1 回到结点 P 1 P_{1} P 1 的有向道路;这样的最短道路有长 k 1 ⩽ n k_{1} \leqslant n k 1 ⩽ n 。因此矩阵 A k 1 A^{k_{1}} A k 1 在它的 1,1 位置有正元,并且 A k 1 A^{k_{1}} A k 1 的任意幂也将有正 1,1 元。因为 A A A 是素的,由引理(8.5.6)可知 A k 1 A^{k_{1}} A k 1 一定不可约,因而在 Γ ( A k 1 ) \Gamma(A^{k_{1}}) Γ ( A k 1 ) 中一定存在从结点 P 2 P_{2} P 2 回到结点 P 2 P_{2} P 2 的有向道路;这样的最短道路有长 k 2 ⩽ n k_{2} \leqslant n k 2 ⩽ n 。因此矩阵 ( A k 1 ) k 2 = A k 1 k 2 (A^{k_{1}})^{k_{2}} = A^{k_{1}k_{2}} ( A k 1 ) k 2 = A k 1 k 2 有正 1,1 元和正 2,2 元。这个过程可沿主对角线继续进行下去直到得到矩阵 A k 1 k 2 ⋯ k n A^{k_{1}k_{2}\cdots k_{n}} A k 1 k 2 ⋯ k n (其中每个 k i ⩽ n k_{i} \leqslant n k i ⩽ n )为止,这个矩阵是不可约的且有正对角元,因而由引理(8.5.5)可知 [ A k 1 k 2 ⋯ k n ] n − 1 > 0 [A^{k_{1}k_{2}\cdots k_{n}}]^{n-1} > 0 [ A k 1 k 2 ⋯ k n ] n − 1 > 0 。因为
k 2 k 2 … k n ( n − 1 ) ⩽ n ⋅ n … n ( n − 1 ) = n n ( n − 1 ) , k _ {2} k _ {2} \dots k _ {n} (n - 1) \leqslant n \cdot n \dots n (n - 1) = n ^ {n} (n - 1), k 2 k 2 … k n ( n − 1 ) ⩽ n ⋅ n … n ( n − 1 ) = n n ( n − 1 ) , 所以证毕.
如果 A A A 是给定的素矩阵,使 A k > 0 A^k > 0 A k > 0 的最小 k k k 称为 A A A 的本原指标,通常记作 γ ( A ) \gamma(A) γ ( A ) 。我们已经看到,如果 A A A 有正对角元,则 γ ( A ) ⩽ n − 1 \gamma(A) \leqslant n - 1 γ ( A ) ⩽ n − 1 ,而在一般情形下有 γ ( A ) ⩽ n n − 1 ( n − 1 ) \gamma(A) \leqslant n^{n-1}(n - 1) γ ( A ) ⩽ n n − 1 ( n − 1 ) ,后一个界可以得到显著改进。
8.5.8 定理 设 A ∈ M n A \in M_{n} A ∈ M n 是非负素矩阵,且假定 Γ ( A ) \Gamma(A) Γ ( A ) 中的最短简单有向回路有长 s s s 。则 A n − ( n − 2 ) > 0 A^{n - (n - 2)} > 0 A n − ( n − 2 ) > 0 ,即 γ ( A ) ⩽ n + s ( n − 2 ) \gamma(A) \leqslant n + s(n - 2) γ ( A ) ⩽ n + s ( n − 2 ) 。
证明:因为 A A A 是不可约的,所以 Γ ( A ) \Gamma(A) Γ ( A ) 的每个结点落在一条回路上,且从任一结点回到自身的最短回路将是长度至多为 n n n 的简单回路。经过一个置换,可以假定,在这条最短回路中的结点是 P 1 , P 2 , ⋯ , P s P_{1}, P_{2}, \cdots, P_{s} P 1 , P 2 , ⋯ , P s 。注意到 n + s ( n − 2 ) = n − s + s ( n − 1 ) n + s(n - 2) = n - s + s(n - 1) n + s ( n − 2 ) = n − s + s ( n − 1 ) 且考虑 A n − s − s ( n − 1 ) = A n − s ( A s ) n − 1 A^{n - s - s(n - 1)} = A^{n - s}(A^{s})^{n - 1} A n − s − s ( n − 1 ) = A n − s ( A s ) n − 1 ,把 A n − s A^{n - s} A n − s 写成分块形式
A n − 1 = [ X 11 X 12 X 21 X 22 ] , A ^ {n - 1} = \left[ \begin{array}{l l} X _ {1 1} & X _ {1 2} \\ X _ {2 1} & X _ {2 2} \end{array} \right], A n − 1 = [ X 11 X 21 X 12 X 22 ] , 其中 X 11 ∈ M s X_{11} \in M_s X 11 ∈ M s 和 X 22 ∈ M n X_{22} \in M_n X 22 ∈ M n ,因为结点 P 1 , ⋯ , P s P_1, \cdots, P_s P 1 , ⋯ , P s 组成 Γ ( A ) \Gamma(A) Γ ( A ) 中的一条回路,所以 X 11 X_{11} X 11 在每一行至少有一个非零元,因而从图 Γ ( A n ) \Gamma(A^n) Γ ( A n ) 中的每个结点 P i P_i P i 到 Γ ( A n ) \Gamma(A_n) Γ ( A n ) 中的某个结点 P j P_j P j (或许 P i = P j P_i = P_j P i = P j )存在某条弧;如果 1 ⩽ i , j ⩽ s 1 \leqslant i, j \leqslant s 1 ⩽ i , j ⩽ s ,这是成立的。因为从不在上述回路中的每个结点 P i − 1 , ⋯ , P n P_{i-1}, \cdots, P_n P i − 1 , ⋯ , P n ,到该回路中的某个结点,在 Γ ( A ) \Gamma(A) Γ ( A ) 中一定有一条长不超过 n − s n-s n − s (它们是不在该回路中的结点数)的有向道路,所以在 X 21 X_{21} X 21 的每一行中至少有一个非零元。当绕着回路走了足够多的附加步数时,从不在该回路中的每个结点到该回路的某个结点,显然在 Γ ( A ) \Gamma(A) Γ ( A ) 中恰好有一条长恰好为 n − s n-s n − s 的有向道路。
现在把 ( A ′ ) n − 1 (A^{\prime})^{n - 1} ( A ′ ) n − 1 写成如下的分块形式
( A ∗ ) n − 1 = [ Y 11 Y 12 Y 21 Y 22 ] , (A ^ {*}) ^ {n - 1} = \left[ \begin{array}{l l} Y _ {1 1} & Y _ {1 2} \\ Y _ {2 1} & Y _ {2 2} \end{array} \right], ( A ∗ ) n − 1 = [ Y 11 Y 21 Y 12 Y 22 ] , 其中, Y 11 ∈ M 1 Y_{11} \in M_1 Y 11 ∈ M 1 ,而 Y 22 ∈ M n Y_{22} \in M_n Y 22 ∈ M n 。因为 P 1 , ⋯ , P s P_1, \cdots, P_s P 1 , ⋯ , P s 组成 Γ ( A ) \Gamma(A) Γ ( A ) 中的一条回路,所以在 Γ ( A s ) \Gamma(A^s) Γ ( A s ) 中的每个结点 P 1 , ⋯ , P s P_1, \cdots, P_s P 1 , ⋯ , P s 有一个圈。因为 A A A 是素矩阵,所以 A s A^s A s 也是素矩阵,因而是不可约的。从 Γ ( A s ) \Gamma(A^s) Γ ( A s ) 的每个结点 P 1 , ⋯ , P s P_1, \cdots, P_s P 1 , ⋯ , P s 到任意其他结点,在 Γ ( A s ) \Gamma(A^s) Γ ( A s ) 中有一条长至多为 n − 1 n - 1 n − 1 的道路。首先绕着起点的圈走足够多次,便可以构造这样一条长恰好为 n − 1 n - 1 n − 1 的道路。这说明 Y 11 > 0 Y_{11} > 0 Y 11 > 0 和 Y 12 > 0 Y_{12} > 0 Y 12 > 0 。
为了完成证明,算出
A n ⋅ ( A n ) n − 1 = [ X 11 X 12 X 21 X 22 ] [ Y 11 Y 12 Y 21 Y 22 ] ⩾ [ X 11 Y 11 X 11 Y 12 X 21 Y 11 X 21 Y 12 ] . A ^ {n} \cdot (A ^ {n}) ^ {n - 1} = \left[ \begin{array}{l l} X _ {1 1} & X _ {1 2} \\ X _ {2 1} & X _ {2 2} \end{array} \right] \left[ \begin{array}{l l} Y _ {1 1} & Y _ {1 2} \\ Y _ {2 1} & Y _ {2 2} \end{array} \right] \geqslant \left[ \begin{array}{l l} X _ {1 1} Y _ {1 1} & X _ {1 1} Y _ {1 2} \\ X _ {2 1} Y _ {1 1} & X _ {2 1} Y _ {1 2} \end{array} \right]. A n ⋅ ( A n ) n − 1 = [ X 11 X 21 X 12 X 22 ] [ Y 11 Y 21 Y 12 Y 22 ] ⩾ [ X 11 Y 11 X 21 Y 11 X 11 Y 12 X 21 Y 12 ] . 因为在后一个表示式中的 X X X 子块的每一行至少含有一个非零元,又因为在后一个表示式中的每个 Y Y Y 子块都是正的,所以整个分块矩阵是正的,且 A n ⋅ ( A s ) n − 1 > 0 A^{n} \cdot (A^{s})^{n-1} > 0 A n ⋅ ( A s ) n − 1 > 0 .
(8.5.8)的一个推论是 H ⋅ W \mathbf{H} \cdot \mathbf{W} H ⋅ W Ielandt的著名结果,它给出了一般的素矩阵的本原指标的准确上界.
8.5.9 推论 如果 A ∈ M n A \in M_{n} A ∈ M n 是非负矩阵,则 A A A 是素矩阵,当且仅当 A n 2 = 0 A^{n^2} = 0 A n 2 = 0 .
证明:如果 A A A 的任意幂是正的,则 A A A 是素矩阵,所以,我们只要考虑逆命题。如果 n = 1 n = 1 n = 1 ,结论是显然的,因此假定 n > 1 n > 1 n > 1 。如果 A A A 是素矩阵,则 A A A 是不可约的,且在 Γ ( A ) \Gamma(A) Γ ( A ) 中有若干条回路。如果 Γ ( A ) \Gamma(A) Γ ( A ) 中最短的回路有长 n n n ,则 Γ ( A ) \Gamma(A) Γ ( A ) 中的每条回路的长是 n n n 的倍数,因而由定理(8.5.3)可知, A A A 不能是素矩阵。于是 Γ ( A ) \Gamma(A) Γ ( A ) 中最短回路的长是 n − 1 n - 1 n − 1 或者更小,因此根据定理(8.5.8)有
γ ( A ) ⩽ n + s ( n − 2 ) ⩽ n + ( n − 1 ) ( n − 2 ) = n 2 − 2 n + 2. \gamma (A) \leqslant n + s (n - 2) \leqslant n + (n - 1) (n - 2) = n ^ {2} - 2 n + 2. γ ( A ) ⩽ n + s ( n − 2 ) ⩽ n + ( n − 1 ) ( n − 2 ) = n 2 − 2 n + 2. Wielandt给出的一个例子(本节末习题4)说明,界 γ ( A ) ⩽ n 2 − 2 n + 2 \gamma (A)\leqslant n^{2} - 2n + 2 γ ( A ) ⩽ n 2 − 2 n + 2 是所有对角元全为0的矩阵的最佳界.我们知道,如果所有主对角元是正的,则 A A A 是素矩阵,当且仅当 A n > 0 A^n >0 A n > 0 如果某些主对角元为正,可能不是全部主对角元为正,则Holladay和Varga的下述结果利用定理(8.5.8)中所采用的证明思想给出了关于本原指标的一个界.
8.5.10 定理 设 A ∈ M n A \in M_{n} A ∈ M n 是不可约非负矩阵,且假定 A A A 有 d d d 个正主对角元, 1 ⩽ d ⩽ n 1 \leqslant d \leqslant n 1 ⩽ d ⩽ n 。则 A 2 n − d − 1 > 0 A^{2n - d - 1} > 0 A 2 n − d − 1 > 0 ;即 γ ( A ) ⩽ 2 n − d − 1 \gamma(A) \leqslant 2n - d - 1 γ ( A ) ⩽ 2 n − d − 1 。
证明:在所述假设下, A A A 一定是素矩阵,且在 Γ ( A ) \Gamma(A) Γ ( A ) 中极小长回路有长1,实际上有 d d d 条这样的回路。通过置换,可以假定 P 1 , … , P d P_{1},\dots,P_{d} P 1 , … , P d 是 Γ ( A ) \Gamma(A) Γ ( A ) 中的具有圈的结点。考虑 A 2 n − d = A n − d ( A 1 ) n − 1 A^{2n - d} = A^{n - d}(A^{1})^{n - 1} A 2 n − d = A n − d ( A 1 ) n − 1 ,且记
A n = [ X 11 X 12 X 21 X 22 ] , A n − 1 = [ Y 11 Y 12 Y 21 Y 22 ] , A ^ {n} = \left[ \begin{array}{l l} X _ {1 1} & X _ {1 2} \\ X _ {2 1} & X _ {2 2} \end{array} \right], \quad A ^ {n - 1} = \left[ \begin{array}{l l} Y _ {1 1} & Y _ {1 2} \\ Y _ {2 1} & Y _ {2 2} \end{array} \right], A n = [ X 11 X 21 X 12 X 22 ] , A n − 1 = [ Y 11 Y 21 Y 12 Y 22 ] , 其中, X 11 , Y 11 ∈ M d X_{11},Y_{11}\in M_d X 11 , Y 11 ∈ M d ,而 X 22 , Y 22 ∈ M n d X_{22},Y_{22}\in M_{n_d} X 22 , Y 22 ∈ M n d 采用在定理(8.5.8)证明中的相同证法来处理 A n A^n A n 和 ( A ′ ) n − 1 (A^{\prime})^{n - 1} ( A ′ ) n − 1 的对应位置的子块便可证明,子块 X 11 X_{11} X 11 和 X 21 X_{21} X 21 的每一行至少含有一个非零元,且子块 Y 11 Y_{11} Y 11 和 Y 12 Y_{12} Y 12 是正的.由定理(8.5.8)中所运用的相同推理可知,乘积 A n ⋅ A n − 1 A^n\cdot A^{n - 1} A n ⋅ A n − 1 是正矩阵. □
练习 证明矩阵 A = [ 0 1 1 1 ] A = \begin{bmatrix} 0 & 1 \\ 1 & 1 \end{bmatrix} A = [ 0 1 1 1 ] 是素矩阵。它的特征值是什么?计算由(8.5.9)和(8.5.10)给出的关于 γ ( A ) \gamma(A) γ ( A ) 的界。 γ ( A ) \gamma(A) γ ( A ) 的精确值是什么?
作为最后一个附注,我们指出,如果想证明一个给定的非负矩阵是素的,则可以验证该矩阵是不可约的且满足Wielandt条件(8.5.9)。在实际中出现的矩阵常常有特殊的结构,使我们容易看出相应的有向图是不是强连接的。另外,如果任一主对角元是正的,则该矩阵一定是素的。但是,如果矩阵很大,且没有特殊的结构或者其元素没有什么对称性,或者如果所有主对角元是零,则可能需要利用定理(8.4.1)或推论(8.5.9)来验证不可约性或素性。在这两种情形下,如果将所述矩阵反复平方若干次直到所得到的幂超过临界值(分别为 n − 1 n - 1 n − 1 或 n 2 − 2 n + 2 n^2 - 2n + 2 n 2 − 2 n + 2 )为止,则矩阵乘法所需要的次数将大大缩小。例如,如果 n = 10 n = 10 n = 10 ,则计算 ( I + A ) 2 (I + A)^2 ( I + A ) 2 , ( I + A ) 1 (I + A)^1 ( I + A ) 1 , ( I + A ) 3 (I + A)^3 ( I + A ) 3 和 ( I + A ) 16 (I + A)^{16} ( I + A ) 16 足以验证不可约性;这是4次矩阵乘法而不是直接应用引理(8.4.1)所需要的8次乘法。类似的,如果 A A A 是非负的,则计算 A 2 A^2 A 2 , A 4 A^4 A 4 , A 8 A^8 A 8 , A 16 A^{16} A 16 , A 32 A^{32} A 32 , A 64 A^{64} A 64 和 A 128 A^{128} A 128 足以验证素性;这是7次矩阵乘法而不是81次乘法。注意在这些讨论中我们未指明利用了习题3。
习题 写出定理(8.5.1)的证明.
若 A ∈ M n A \in M_{n} A ∈ M n 是非负素矩阵,证明对所有 i i i , j = 1 , ⋯ , n j = 1, \cdots, n j = 1 , ⋯ , n 有 lim m → ∞ [ a i j ( m ) ] 1 / m = ρ ( A ) \lim_{m \to \infty} [a_{ij}^{(m)}]^{1/m} = \rho(A) lim m → ∞ [ a ij ( m ) ] 1/ m = ρ ( A ) ,试把这个结果与推论(5.6.14)作一比较。可以省略掉有关素性假设的那一部分吗?
证明,如果 A ⩾ 0 A \geqslant 0 A ⩾ 0 和 A k > 0 A^k > 0 A k > 0 ,则 A m > 0 A^m > 0 A m > 0 对所有 m ⩾ k m \geqslant k m ⩾ k 成立。如果 A A A 是素矩阵,则对任意正整数 k k k , A k A^k A k 是素矩阵。但是,如果 A A A 和 B B B 都是素矩阵,则可能 A B AB A B 不是素矩阵。提示:考虑 [ 1 1 1 0 ] \left[ \begin{array}{ll}1 & 1 \\ 1 & 0 \end{array} \right] [ 1 1 1 0 ] 和 [ 0 1 1 1 ] \left[ \begin{array}{ll}0 & 1 \\ 1 & 1 \end{array} \right] [ 0 1 1 1 ] 。
试用 Γ ( A ) \Gamma(A) Γ ( A ) 证明,对 n ⩾ 3 n \geqslant 3 n ⩾ 3 ,Wielandt 矩阵
A = [ 0 1 0 1 0 ⋮ ⋱ ⋱ ⋱ ⋱ 0 0 1 1 1 0 … 0 ] ∈ M n A = \left[ \begin{array}{c c c c c c} 0 & 1 & & & & \\ 0 & & 1 & & 0 & \\ \vdots & & \ddots & \ddots & & \\ & & & \ddots & \ddots & \\ 0 & & 0 & & & 1 \\ 1 & & 1 & 0 & \dots & 0 \end{array} \right] \in M _ {n} A = 0 0 ⋮ 0 1 1 1 ⋱ 0 1 ⋱ ⋱ 0 0 ⋱ … 1 0 ∈ M n 是不可约素矩阵,然后证明 A n 2 − 2 n + 1 A^{n^2 - 2n + 1} A n 2 − 2 n + 1 的(1,1)元是零而 A n 2 − 2 n − 2 > 0 A^{n^2 - 2n - 2} > 0 A n 2 − 2 n − 2 > 0 ,提示:把 A A A 看成作用在标准基 { e 1 , … , e n } \{e_1, \dots, e_n\} { e 1 , … , e n } 上的线性变换.那么 A : e i → ? A n − 1 : e i → ? A ( n − 1 ) ( n − 1 ) : e 1 → ? A: e_i \rightarrow ? A^{n-1}: e_i \rightarrow ? A^{(n-1)(n-1)}: e_1 \rightarrow ? A : e i → ? A n − 1 : e i → ? A ( n − 1 ) ( n − 1 ) : e 1 → ?
设 A ∈ M n A \in M_{n} A ∈ M n 是不可约非负矩阵。证明,如果至少有一个主对角元是正的,则 A A A 是素矩阵。证明这个充分条件对 n = 2 n = 2 n = 2 是必要条件而对 n ⩾ 3 n \geqslant 3 n ⩾ 3 则不是。
设 A = [ a η ] ∈ M n A = [a_{\eta}] \in M_n A = [ a η ] ∈ M n 是非负的,且假定 a k k > 0 a_{kk} > 0 a kk > 0 对某个 k = 1 , 2 , … , n k = 1, 2, \dots, n k = 1 , 2 , … , n 成立。证明 Λ \Lambda Λ 的每个幂的 k , k k, k k , k 元也是正的。如果 a k k = 0 a_{kk} = 0 a kk = 0 而 Λ 2 \Lambda^2 Λ 2 的 k , k k, k k , k 元是正的, A 3 A^3 A 3 的 k , k k, k k , k 元是正的吗?
详细验证本节未提出的简便算法.
如果 Λ \Lambda Λ 是任意幂等矩阵,则 A = lim m → ∞ A m A = \lim_{m\to \infty}A^{m} A = lim m → ∞ A m 。证明,如果 A A A 是非负的,不可约的和幂等的,则 A A A 是秩1的正矩阵。
给出例子说明,即使 A ⩾ 0 A \geqslant 0 A ⩾ 0 不是素矩阵, lim m → ∞ [ ρ ( A ) − 1 A ] m \lim_{m \to \infty} [\rho(A)^{-1} A]^{m} lim m → ∞ [ ρ ( A ) − 1 A ] m 仍可能存在。实际上, A A A 可能是可约的,还可能有极大模重特征值。
证明定理(8.5.1)的下述部分逆命题:如果 A ∈ M n A \in M_{n} A ∈ M n 是非负矩阵和不可约矩阵,又如果 lim m → ∞ [ ρ ( A ) − 1 A ] m \lim_{m \to \infty} [\rho(A)^{-1} A]^{m} lim m → ∞ [ ρ ( A ) − 1 A ] m 存在,则 A A A 是素矩阵。提示:如果 ∣ μ ∣ = ρ ( A ) |\mu| = \rho(A) ∣ μ ∣ = ρ ( A ) , μ ≠ ρ ( A ) \mu \neq \rho(A) μ = ρ ( A ) ,且 Λ z = μ z \Lambda z = \mu z Λ z = μ z , z ≠ 0 z \neq 0 z = 0 ,则 [ ρ ( A ) − 1 A ] m z → ? [\rho(A)^{-1} A]^{m} z \rightarrow ? [ ρ ( A ) − 1 A ] m z → ?
证明. A = [ 0 1 1 0 ] A = \begin{bmatrix} 0 & 1 \\ 1 & 0 \end{bmatrix} A = [ 0 1 1 0 ] 是不可约的,但 A 2 A^2 A 2 是可约的。这与(8.5.6)矛盾吗?
给出一个不可约非负矩阵 A ∈ M n A \in M_{n} A ∈ M n ,使得 lim m → ∞ [ ρ ( A ) − 1 A ] m \lim_{m \to \infty} [\rho(A)^{-1} A]^{m} lim m → ∞ [ ρ ( A ) − 1 A ] m 不存在。
如果 ε > 0 \varepsilon > 0 ε > 0 ,又如果 A ∈ M n A \in M_n A ∈ M n 是非负不可约矩阵,证明 A + ε I A + \varepsilon I A + ε I 是素矩阵。
非负矩阵 A = [ a n ] A = [a_{n}] A = [ a n ] 称为组合对称的,是指 a n > 0 a_{n} > 0 a n > 0 当且仅当 a p > 0 a_{p} > 0 a p > 0 对所有 i , j = 1 , ⋯ , n i, j = 1, \cdots, n i , j = 1 , ⋯ , n 成立。证明,如果 A A A 是组合对称的素矩阵,则 A 2 n − 2 > 0 A^{2n-2} > 0 A 2 n − 2 > 0 。提示:考虑 A 2 A^2 A 2 且利用(8.5.6)和(8.5.10)。你能给出关于 Γ ( A ) \Gamma(A) Γ ( A ) 的回路结构的更多的信息来改进 γ ( A ) \gamma(A) γ ( A ) 的界吗?提示:利用(8.5.8)。
证明,如果 A ∈ M n A \in M_n A ∈ M n 是非负的,不可约的和非奇异的,且 n n n 是素数,则或者 (a) A A A 是素矩阵,或者 (b) A A A 的所有特征值有极大模且 A A A 相似于 x n − ρ ( A ) n = 0 x^n - \rho(A)^n = 0 x n − ρ ( A ) n = 0 的友矩阵。
一种计算非负矩阵 A ∈ M n A \in M_{n} A ∈ M n 的 Perron 向量和谱半径的方法是幂法:
x ( 0 ) x^{(0)} x ( 0 ) 是任意正向量, ∑ i = 1 n x i ( 0 ) = 1 ; \sum_{i = 1}^{n}x_{i}^{(0)} = 1; ∑ i = 1 n x i ( 0 ) = 1 ;
y ( m + 1 ) = A x ( m ) y^{(m + 1)} = Ax^{(m)} y ( m + 1 ) = A x ( m ) 对所有 m = 0 , 1 , 2 , … m = 0,1,2,\dots m = 0 , 1 , 2 , … 成立;
522
x ( m + 1 ) = y ( m + 1 ) ∑ i = 1 n y i ( m + 1 ) 对 所 有 m = 0 , 1 , 2 , … 成 立 . x ^ {(m + 1)} = \frac {y ^ {(m + 1)}}{\sum_ {i = 1} ^ {n} y _ {i} ^ {(m + 1)}} \quad \text {对 所 有} m = 0, 1, 2, \dots \text {成 立}. x ( m + 1 ) = ∑ i = 1 n y i ( m + 1 ) y ( m + 1 ) 对 所 有 m = 0 , 1 , 2 , … 成 立 . 如果 A A A 是素矩阵,证明,向量 x ( m ) x^{(m)} x ( m ) 的序列收敛于 A A A 的(右)Perron 向量,而数 ∑ i = 1 n y i ( m + 1 ) \sum_{i=1}^{n} y_i^{(m+1)} ∑ i = 1 n y i ( m + 1 ) 的序列收敛于 A A A 的 Perron 根。其收敛速度如何?关于素性的假设是必要的吗?
如果 A ∈ M n A \in M_{n} A ∈ M n 是非负的,证明 A A A 的素性只与零元的位置有关而与非零元的大小无关。
如果 A ∈ M n A \in M_{n} A ∈ M n 是非负的、不可约的和对称的,证明 A A A 是素矩阵当且仅当 A + ρ ( A ) I A + \rho(A)I A + ρ ( A ) I 是非奇异矩阵。特别是,如果 A A A 是半正定矩阵,这个条件被满足。以0和1为元素的对称非负矩阵常常作为无向图的邻接矩阵而出现。
如果 A ∈ M n A \in M_{n} A ∈ M n 是素矩阵且 k ⩾ γ ( A ) k \geqslant \gamma(A) k ⩾ γ ( A ) ,证明 A k > 0 A^{k} > 0 A k > 0
给出定理(8.5.10)的证明细节.
计算下列各矩阵的特征值和特征向量,并且按本章的基本概念(非负矩阵、不可约矩阵、素矩阵、正矩阵等)进行归类: [ 1 1 1 1 ] , [ 0 1 1 1 ] , [ 1 0 1 1 ] , [ 1 0 0 1 ] , [ 1 0 0 0 ] , [ 0 1 0 0 ] , \left[ \begin{array}{ll}1 & 1\\ 1 & 1 \end{array} \right],\left[ \begin{array}{ll}0 & 1\\ 1 & 1 \end{array} \right],\left[ \begin{array}{ll}1 & 0\\ 1 & 1 \end{array} \right],\left[ \begin{array}{ll}1 & 0\\ 0 & 1 \end{array} \right],\left[ \begin{array}{ll}1 & 0\\ 0 & 0 \end{array} \right],\left[ \begin{array}{ll}0 & 1\\ 0 & 0 \end{array} \right], [ 1 1 1 1 ] , [ 0 1 1 1 ] , [ 1 1 0 1 ] , [ 1 0 0 1 ] , [ 1 0 0 0 ] , [ 0 0 1 0 ] , [ 0 0 0 0 ] \left[ \begin{array}{ll}0 & 0\\ 0 & 0 \end{array} \right] [ 0 0 0 0 ] 这些矩阵为可能出现的各种可能性提供了好的实例.
在定理(8.5.8)的证明中,证明 X 11 X_{11} X 11 和 X 12 X_{12} X 12 的每一列至少含有一个非零元。证明 Y 21 > 0 Y_{21} > 0 Y 21 > 0
进一步阅读 关于(8.5.4)中提到的Romanovsky定理的证明可参看V.Romanovsky,“Recherches sur les Chaines de Markoff,"Acta Math. 66(1936),147-251.