6.4 其他包含区域 我们已经比较详细地讨论了Gersgorin圆盘。它们是平面上一类特殊的容易计算的区域,这些区域保证包含给定矩阵的各特征值。许多作者也许受Gersgorin理论的优美几何结构的启发,推广了这个理论的思想和方法,得到一些其他类型的包含区域。我们讨论其中几个已经成熟的富有特色的结果。
第一个结果给出了特征值的包含区域,像Gersgorin区域那样,它是若干个圆盘之并,不过,圆盘的半径既依赖于去心行和也依赖于去心列和。Gersgorin定理的分离行和与列和形式是作为这个结果的极限而得到的,这个结果归功于()strowski,因此它可以看成安插在(6.1.2)与(6.1.4)之间的包含区域的一个闭联集。
6.4.1 定理(Ostrowski)设 A = [ a i j ] ∈ M n A = [a_{ij}] \in M_n A = [ a ij ] ∈ M n , a ∈ [ 0 , 1 ] a \in [0, 1] a ∈ [ 0 , 1 ] 是给定的数,又设 R i ′ R_i' R i ′ 和 C i ′ C_i' C i ′ 分别表示 A A A 的去心行和与去心列和:
R 1 ′ = ∑ j = 1 j ≠ 1 n ∣ a j , ∣ (6.4.2) R _ {1} ^ {\prime} = \sum_ {j = 1 \atop j \neq 1} ^ {n} | a _ {j}, | \tag {6.4.2} R 1 ′ = j = 1 j = 1 ∑ n ∣ a j , ∣ ( 6.4.2 ) C j ′ = ∑ j = 1 n ∣ a j n ∣ (6.4.3) C _ {j} ^ {\prime} = \sum_ {j = 1} ^ {n} | a _ {j n} | \tag {6.4.3} C j ′ = j = 1 ∑ n ∣ a jn ∣ ( 6.4.3 ) 则 A A A 的所有特征值位于 n \pmb{n} n 个圆盘的并
\bigcup_ {i = 1} ^ {n} \{z \in \mathbf {C}: | z - a _ {n} | \leqslant R _ {i} ^ {\prime a} C _ {i} ^ {\prime 1} ^ {a} \} \tag {6.4.4}
中.
证明:我们可以假定 0 < α < 1 0 < \alpha < 1 0 < α < 1 ,当 α = 0 \alpha = 0 α = 0 和 α = 1 \alpha = 1 α = 1 的情形(相应于关于列和与行和的Gersgorin定理)可以通过取极限得到。另外,可以假定所有 R i ′ > 0 R_i' > 0 R i ′ > 0 ,因为可以在其 R i ′ = 0 R_i' = 0 R i ′ = 0 的任一行中添上一个小的非零元使 A A A 产生扰动;所得到的矩阵有包含区域(6.4.4),它大于 A A A 的包含区域,并且在扰动趋于零的极限情形推出结论成立。
378 现在假定 A x = λ x Ax = \lambda x A x = λ x ,且 x = [ x i ] ≠ 0 x = [x_i] \neq 0 x = [ x i ] = 0 ,于是对每个 i = 1 , 2 , … , n i = 1, 2, \dots, n i = 1 , 2 , … , n ,有
∣ λ − a i t ∣ ∣ x t ∣ = ∣ ∑ j = 1 j ≠ i n a i j x j ∣ ⩽ ∑ j = 1 j ≠ i n ∣ a i j ∣ ∣ x j ∣ = ∑ j = 1 j ≠ i n ∣ a i j ∣ α { ∣ a i j ∣ 1 − α ∣ x j ∣ } ⩽ [ ∑ j = 1 n { ∣ a i j ∣ α } 1 / α ] α [ ∑ j = 1 n { ∣ a i j ∣ 1 − α } ∣ x j ∣ } 1 / ( 1 − α ) ] 1 − α = R i ′ u [ ∑ j = 1 j ≠ i n ∣ a i j ∣ ∣ x j ∣ 1 / ( 1 − a ) ] 1 − a , (6.4.5a) \begin{array}{l} \mid \lambda - a _ {i t} \mid \mid x _ {t} \mid = \left| \sum_ {\substack {j = 1 \\ j \neq i}} ^ {n} a _ {i j} x _ {j} \right| \leqslant \sum_ {\substack {j = 1 \\ j \neq i}} ^ {n} \mid a _ {i j} \mid \mid x _ {j} \mid = \sum_ {\substack {j = 1 \\ j \neq i}} ^ {n} \mid a _ {i j} \mid^ {\alpha} \{\mid a _ {i j} \mid^ {1 - \alpha} \mid x _ {j} \mid \} \\ \leqslant \left[ \sum_ {j = 1} ^ {n} \left\{\left| a _ {i j} \right| ^ {\alpha} \right\} ^ {1 / \alpha} \right] ^ {\alpha} \left[ \right. \sum_ {j = 1} ^ {n} \left\{\left| a _ {i j} \right| ^ {1 - \alpha} \right\}\left| x _ {j} \right|\left. \right\} ^ {1 / (1 - \alpha)} \left. \right] ^ {1 - \alpha} \tag {6.4.5a} \\ = R _ {i} ^ {\prime u} \left[ \sum_ {\substack {j = 1 \\ j \neq i}} ^ {n} | a _ {i j} | | x _ {j} | ^ {1 / (1 - a)} \right] ^ {1 - a}, \\ \end{array} ∣ λ − a i t ∣∣ x t ∣= ∑ j = 1 j = i n a ij x j ⩽ ∑ j = 1 j = i n ∣ a ij ∣∣ x j ∣= ∑ j = 1 j = i n ∣ a ij ∣ α { ∣ a ij ∣ 1 − α ∣ x j ∣ } ⩽ [ ∑ j = 1 n { ∣ a ij ∣ α } 1/ α ] α [ ∑ j = 1 n { ∣ a ij ∣ 1 − α } ∣ x j ∣ } 1/ ( 1 − α ) ] 1 − α = R i ′ u [ ∑ j = 1 j = i n ∣ a ij ∣∣ x j ∣ 1/ ( 1 − a ) ] 1 − a , ( 6.4.5a ) 因为 R 1 ′ > 0 R_{1}^{\prime} > 0 R 1 ′ > 0 ,它等价于
∣ λ − a n ∣ R i ′ α ∣ x i ∣ ⩽ [ ∑ j = 1 n ∣ a y ∣ ∣ x j ∣ 1 / ( 1 − α ) ] 1 , \frac {\left| \lambda - a _ {n} \right|}{R _ {i} ^ {\prime \alpha}} \mid x _ {i} \mid \leqslant \left[ \sum_ {j = 1} ^ {n} \mid a _ {y} \mid \mid x _ {j} \mid^ {1 / (1 - \alpha)} \right] ^ {1}, R i ′ α ∣ λ − a n ∣ ∣ x i ∣ ⩽ [ j = 1 ∑ n ∣ a y ∣∣ x j ∣ 1/ ( 1 − α ) ] 1 , 因而
[ ∣ λ − a i t ∣ R t ′ a ] 1 ( 1 a ) ∣ x i ∣ 1 ( 1 a ) ⩽ ∑ i = 1 j ≠ i n ∣ a i j ∣ ∣ x j ∣ 1 / ( 1 − a ) . (6.4.5b) \left[ \frac {\mid \lambda - a _ {i t} \mid}{R _ {t} ^ {\prime a}} \right] ^ {1 (1 a)} | x _ {i} | ^ {1 (1 a)} \leqslant \sum_ {\substack {i = 1 \\ j \neq i}} ^ {n} | a _ {i j} | | x _ {j} | ^ {1 / (1 - a)}. \tag{6.4.5b} [ R t ′ a ∣ λ − a i t ∣ ] 1 ( 1 a ) ∣ x i ∣ 1 ( 1 a ) ⩽ i = 1 j = i ∑ n ∣ a ij ∣∣ x j ∣ 1/ ( 1 − a ) . ( 6.4.5b ) 在(6.4.5a)中所使用的不等式是Holder不等式(附录B),其中, p = 1 / α p = 1 / \alpha p = 1/ α 且 q = p / ( p − 1 ) = 1 / ( 1 − α ) q = p / (p - 1) = 1 / (1 - \alpha) q = p / ( p − 1 ) = 1/ ( 1 − α ) .现在对 i \pmb{i} i 相加(6.4.5b)便得到
∑ i = 1 n [ ∣ λ − a i ∣ R i ′ σ ] 1 ( 1 − a ) ∣ x i ∣ 1 + ( 1 − a ) ⩽ ∑ i = 1 n ∑ j = 1 j ≠ i n ∣ a i j ∣ ∣ x j ∣ 1 + ( 1 − a ) = ∑ j = 1 n C j ′ ∣ x j ∣ 1 − ( 1 − a ) . (6.4.6) \begin{array}{l} \sum_ {i = 1} ^ {n} \left[ \frac {| \lambda - a _ {i} |}{R _ {i} ^ {\prime \sigma}} \right] ^ {1 (1 - a)} | x _ {i} | ^ {1 + (1 - a)} \leqslant \sum_ {i = 1} ^ {n} \sum_ {j = 1 \atop j \neq i} ^ {n} | a _ {i j} | | x _ {j} | ^ {1 + (1 - a)} \\ = \sum_ {j = 1} ^ {n} C _ {j} ^ {\prime} \left| x _ {j} \right| ^ {1 - (1 - a)}. \tag {6.4.6} \\ \end{array} ∑ i = 1 n [ R i ′ σ ∣ λ − a i ∣ ] 1 ( 1 − a ) ∣ x i ∣ 1 + ( 1 − a ) ⩽ ∑ i = 1 n ∑ j = i j = 1 n ∣ a ij ∣∣ x j ∣ 1 + ( 1 − a ) = ∑ j = 1 n C j ′ ∣ x j ∣ 1 − ( 1 − a ) . ( 6.4.6 ) 如果对适合 x i ≠ 0 x_{i} \neq 0 x i = 0 的每个 i i i 有
[ ∣ λ − a n ∣ R i ′ a ] 1 / ( 1 − a ) > C i ′ , \left[ \frac {| \lambda - a _ {n} |}{R _ {i} ^ {\prime a}} \right] ^ {1 / (1 - a)} > C _ {i} ^ {\prime}, [ R i ′ a ∣ λ − a n ∣ ] 1/ ( 1 − a ) > C i ′ , 则(6.4.6)不能成立。因此,得出
[ ∣ λ − a n ∣ R i r α ] 1 / ( 1 − α ) ⩽ C , \left[ \frac {\mid \lambda - a _ {n} \mid}{R _ {i} ^ {r _ {\alpha}}} \right] ^ {1 / (1 - \alpha)} \leqslant C, [ R i r α ∣ λ − a n ∣ ] 1/ ( 1 − α ) ⩽ C , 对适合 x i ≠ 0 x_{i} \neq 0 x i = 0 的至少一个 i i i 值成立,因而
∣ λ − a i ∣ ⩽ R i ′ α C i ′ 1 \left| \lambda - a _ {i} \right| \leqslant R _ {i} ^ {\prime \alpha} C _ {i} ^ {\prime 1} ∣ λ − a i ∣ ⩽ R i ′ α C i ′1 练习 考虑 A = [ 1 4 1 6 ] A = \begin{bmatrix} 1 & 4 \\ 1 & 6 \end{bmatrix} A = [ 1 1 4 6 ] ,试比较Gersgorin行和列特征值包含区域与 α = 1 2 \alpha = \frac{1}{2} α = 2 1 的Ostrowsi区
域.对于 A A A 的谱半径,Ostrowski定理给出什么估计,且如何同Gersgorin估计(6.1.5)进行比较?
练习 推论(6.1.6)的Ostrowski形式是什么?
下一个结果也是Gersgorin定理的推广,它属于Brauer,不过现在一次要取两行;几何区域不再是圆盘,而是称作Cassini椭圆形的诸集合。显然,其证明平行于Gersgorin定理的证明,其中不仅选择特征向量的一个最大模分量,而且还选择两个最大模分量。
6.4.7 定理(Brauer) 设 A = [ a i j ] ∈ M n A = [a_{ij}] \in M_n A = [ a ij ] ∈ M n . A A A 的所有特征值位于 n ( n − 1 ) / 2 n(n-1)/2 n ( n − 1 ) /2 个 Cassini 椭圆形的并
⋃ i ≠ j n { z ∈ C : ∣ z − a i n ∣ ∣ z − a j j ∣ ⩽ R i ′ R j ′ } (6.4.8) \bigcup_ {i \neq j} ^ {n} \left\{z \in \mathbf {C}: | z - a _ {i n} | | z - a _ {j j} | \leqslant R _ {i} ^ {\prime} R _ {j} ^ {\prime} \right\} \tag {6.4.8} i = j ⋃ n { z ∈ C : ∣ z − a in ∣∣ z − a jj ∣ ⩽ R i ′ R j ′ } ( 6.4.8 ) 中.
证明:设 λ \lambda λ 是 A A A 的特征值,且假定 A x = λ x Ax = \lambda x A x = λ x ,其中 x = [ x i ] ≠ 0 x = [x_i] \neq 0 x = [ x i ] = 0 。则 x x x 的一个元素有最大绝对值,例如 x p x_p x p ,使得对所有 i = 1 , … , n i = 1, \dots, n i = 1 , … , n 有 ∣ x p ∣ ⩾ ∣ x i ∣ |x_p| \geqslant |x_i| ∣ x p ∣ ⩾ ∣ x i ∣ 且 x p ≠ 0 x_p \neq 0 x p = 0 。如果 x x x 的所有其他元都是零,则 A x = λ x Ax = \lambda x A x = λ x 的假定说明 a p p = λ a_{pp} = \lambda a pp = λ 。因为 A A A 的所有对角元都包含在区域(6.4.8)中,所以,当它的相应特征向量只有一个非零元时,特征值 λ \lambda λ 在这个区域中。
现在假定至少存在特征向量 x x x 的两个非零元,设 x q x_{q} x q 是具有第二个最大绝对值的分量;即对所有 i = 1 , … , n , i ≠ p i = 1, \dots, n, i \neq p i = 1 , … , n , i = p ,且 x p ≠ 0 ≠ x q x_{p} \neq 0 \neq x_{q} x p = 0 = x q ,有 ∣ x p ∣ ⩾ ∣ x q ∣ ⩾ ∣ x i ∣ |x_{p}| \geqslant |x_{q}| \geqslant |x_{i}| ∣ x p ∣ ⩾ ∣ x q ∣ ⩾ ∣ x i ∣ .
于是 A x = λ x Ax = \lambda x A x = λ x 表明
x p ( λ − a p p ) = ∑ j = 1 j ≠ p n a p j x i x _ {p} (\lambda - a _ {p p}) = \sum_ {\substack {j = 1 \\ j \neq p}} ^ {n} a _ {p j} x _ {i} x p ( λ − a pp ) = j = 1 j = p ∑ n a p j x i 它蕴涵
∣ x p ∣ ∣ λ − a p p ∣ = ∣ ∑ j − 1 j ≠ p n a p j x j ∣ ⩽ ∑ j = 1 j ≠ p n ∣ a p j ∣ ∣ x j ∣ ⩽ ∑ j = 1 j ≠ p n ∣ a p j ∣ ∣ x q ∣ = R p ′ ∣ x q ∣ , \left| x _ {p} \right| | \lambda - a _ {p p} | = \left| \sum_ {\substack {j - 1 \\ j \neq p}} ^ {n} a _ {p j} x _ {j} \right| \leqslant \sum_ {\substack {j = 1 \\ j \neq p}} ^ {n} \left| a _ {p j} \right| | x _ {j} | \leqslant \sum_ {\substack {j = 1 \\ j \neq p}} ^ {n} \left| a _ {p j} \right| | x _ {q} | = R _ {p} ^ {\prime} | x _ {q} |, ∣ x p ∣ ∣ λ − a pp ∣ = j − 1 j = p ∑ n a p j x j ⩽ j = 1 j = p ∑ n ∣ a p j ∣ ∣ x j ∣ ⩽ j = 1 j = p ∑ n ∣ a p j ∣ ∣ x q ∣ = R p ′ ∣ x q ∣ , 或
∣ λ − a p p ∣ ⩽ R p ′ ∣ x q ∣ ∣ x p ∣ . (6.4.9) \left| \lambda - a _ {p p} \right| \leqslant R _ {p} ^ {\prime} \frac {\left| x _ {q} \right|}{\left| x _ {p} \right|}. \tag {6.4.9} ∣ λ − a pp ∣ ⩽ R p ′ ∣ x p ∣ ∣ x q ∣ . ( 6.4.9 ) 但是也有
x q ( λ − a q q ) = ∑ j = 1 j ≠ q n a q j x j x _ {q} (\lambda - a _ {q q}) = \sum_ {\substack {j = 1 \\ j \neq q}} ^ {n} a _ {q j} x _ {j} x q ( λ − a qq ) = j = 1 j = q ∑ n a q j x j 它蕴涵
∣ x q ∣ ∣ λ − a q q ∣ = ∣ ∑ j = 1 j ≠ q n a q j x j ∣ ⩽ ∑ j = 1 j ≠ q n ∣ a q j ∣ ∣ x j ∣ ⩽ ∑ j = 1 j ≠ q n ∣ a q j ∣ ∣ x p ∣ = R q ′ ∣ x p ∣ , \left| x _ {q} \right| | \lambda - a _ {q q} | = \left| \sum_ {\substack {j = 1 \\ j \neq q}} ^ {n} a _ {q j} x _ {j} \right| \leqslant \sum_ {\substack {j = 1 \\ j \neq q}} ^ {n} \left| a _ {q j} \right| | x _ {j} | \leqslant \sum_ {\substack {j = 1 \\ j \neq q}} ^ {n} \left| a _ {q j} \right| | x _ {p} | = R _ {q} ^ {\prime} | x _ {p} |, ∣ x q ∣ ∣ λ − a qq ∣ = j = 1 j = q ∑ n a q j x j ⩽ j = 1 j = q ∑ n ∣ a q j ∣ ∣ x j ∣ ⩽ j = 1 j = q ∑ n ∣ a q j ∣ ∣ x p ∣ = R q ′ ∣ x p ∣ , 或
∣ λ − a q q ∣ ⩽ R q ′ ∣ x p ∣ ∣ x q ∣ . (6.4.10) \mid \lambda - a _ {q q} \mid \leqslant R _ {q} ^ {\prime} \frac {\mid x _ {p} \mid}{\mid x _ {q} \mid}. \tag {6.4.10} ∣ λ − a qq ∣ ⩽ R q ′ ∣ x q ∣ ∣ x p ∣ . ( 6.4.10 ) 取(6.4.9)和(6.4.10)的乘积使我们可消去 x x x 的两个分量的未知比,从而得到
379
380
∣ λ − a p p ∣ ∣ λ a q q ∣ ⩽ R p ′ ∣ x q ∣ ∣ x p ∣ ∣ R q ′ ∣ x q ∣ = R p ′ R q ′ . \mid \lambda - a _ {p p} \mid \mid \lambda \quad a _ {q q} \mid \leqslant R _ {p} ^ {\prime} \frac {\mid x _ {q} \mid}{\mid x _ {p} \mid} \frac {\mid R _ {q} ^ {\prime}}{\mid x _ {q} \mid} = R _ {p} ^ {\prime} R _ {q} ^ {\prime}. ∣ λ − a pp ∣∣ λ a qq ∣ ⩽ R p ′ ∣ x p ∣ ∣ x q ∣ ∣ x q ∣ ∣ R q ′ = R p ′ R q ′ . 因此,特征值 λ \lambda λ 位于区域(6.4.8)中
练习 Brauer定理的列和形式是什么?
关于特征值包含区域的任一个定理蕴涵(并且实际上也被蕴涵于)相关的可逆性定理。现在利用包含结果得到不许 z = 0 z = 0 z = 0 属于该包含区域的条件。
6.4.11 推论 如果 A = [ a i j ] ∈ M n A = [a_{ij}] \in M_n A = [ a ij ] ∈ M n ,则下列条件中的任何一个都是 A A A 为可逆矩阵的充分条件:
(a) 对某个 α ∈ [ 0 , 1 ] \alpha \in [0, 1] α ∈ [ 0 , 1 ] . ∣ a k ∣ > R i ′ a C i ′ 1 |a_{k}| > R_{i}^{\prime a} C_{i}^{\prime 1} ∣ a k ∣ > R i ′ a C i ′1 对所有 i = 1 , ⋯ , n i = 1, \cdots, n i = 1 , ⋯ , n 成立 (I) strowskii); (b) ∣ a n ∣ ∣ ∣ a n ∣ > R i ′ R j ′ |a_{n}| \mid |a_{n}| > R_{i}^{\prime}R_{j}^{\prime} ∣ a n ∣ ∣ ∣ a n ∣ > R i ′ R j ′ 对所有 i , j = 1 , … , n , i ≠ j i, j = 1, \dots, n, i \neq j i , j = 1 , … , n , i = j 成立(Brauer).
练习 利用(6.4.1)和(6.4.7)证明(6.4.11).
Brauer定理要求一次取两行的乘积,在一次取三行或多行的想法启发下,人们注意到进一步推广Brauer定理的可能性,并且对每个 m = 1 , … , n m = 1,\dots ,n m = 1 , … , n ,考虑形如
{ z ∈ C : ∏ k = 1 m ∣ z − a i k ′ k ∣ ⩽ ∏ k = 1 m R i k ′ } , A = [ a i j ] ∈ M n (6.4.12) \left\{z \in \mathbf {C}: \prod_ {k = 1} ^ {m} | z - a _ {i _ {k} ^ {\prime} k} | \leqslant \prod_ {k = 1} ^ {m} R _ {i _ {k}} ^ {\prime} \right\}, \quad A = \left[ a _ {i j} \right] \in M _ {n} \tag {6.4.12} { z ∈ C : k = 1 ∏ m ∣ z − a i k ′ k ∣ ⩽ k = 1 ∏ m R i k ′ } , A = [ a ij ] ∈ M n ( 6.4.12 ) [38]
的集合之并.对每个 m m m ,有 ( n m ) \binom{n}{m} ( m n ) 个这种形式的集合: m = 1 m = 1 m = 1 给出 n n n 个Gersgorin圆盘,而 m = 2 m = 2 m = 2 给出Brauer的 n ( n − 1 ) / 2 n(n - 1) / 2 n ( n − 1 ) /2 个椭圆形.遗憾的是,对 m ⩾ 3 m\geqslant 3 m ⩾ 3 ,集合(6.4.12)并不一定是特征值包含区域,正如例子
A = [ 1 1 0 0 1 1 0 0 0 0 1 0 0 0 0 1 ] (6.4.13) A = \left[ \begin{array}{l l l l} 1 & 1 & 0 & 0 \\ 1 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{array} \right] \tag {6.4.13} A = 1 1 0 0 1 1 0 0 0 0 1 0 0 0 0 1 ( 6.4.13 ) 所说明的那样,对于 m = 3 m = 3 m = 3 和 m = 4 m = 4 m = 4 ,集合(6.4.12)在点 z = 2 z = 2 z = 2 完全失效
练习 证明(6.4.13)中矩阵的特征值是 λ = 0 , 1 , 1 \lambda = 0, 1, 1 λ = 0 , 1 , 1 和 2。对 m = 1 , m = 2 m = 1, m = 2 m = 1 , m = 2 和 m = 3 , 4 m = 3, 4 m = 3 , 4 画出集合(6.4.12)的草图。考虑
A = [ J 0 0 I n ] ∈ M n 12 , (6.4.14) A = \left[ \begin{array}{l l} J & 0 \\ 0 & I _ {n} \end{array} \right] \in M _ {n 1 2}, \tag {6.4.14} A = [ J 0 0 I n ] ∈ M n 12 , ( 6.4.14 ) 其中, J = [ 1 1 1 1 ] ∈ M 2 J = \begin{bmatrix} 1 & 1 \\ 1 & 1 \end{bmatrix} \in M_2 J = [ 1 1 1 1 ] ∈ M 2 ,且 I n ∈ M n I_n \in M_n I n ∈ M n 是 n × n n \times n n × n 单位矩阵,证明,对所有 m ⩾ 3 m \geqslant 3 m ⩾ 3 ,也会出现上述同样的现象.
虽然这个例子排除了对 Brauer 定理作最明显的推广的可能性,但是它提醒我们,什么样的推广可能是错误的,应如何对待。区域(6.4.12)的问题在于采用了过多项的乘积,其中一些项因为零去心行和而有可能为零。当然,如果矩阵 A A A 是不可约的,这种情况不会出能现;这时所有 R i ′ > 0 R_{i}^{\prime} > 0 R i ′ > 0 。
然而,即使 A A A 是不可约的,区域(6.4.12)还可能不是 A A A 的特征值包含区域;它仍然可能采用很多项的乘积。考虑由
Λ ϵ = [ 1 1 ϵ ϵ 1 1 0 0 ϵ 0 1 0 ϵ 0 0 1 ] , 1 > ϵ ⩾ 0 , (6.4.15) \Lambda_ {\epsilon} = \left[ \begin{array}{l l l l} 1 & 1 & \epsilon & \epsilon \\ 1 & 1 & 0 & 0 \\ \epsilon & 0 & 1 & 0 \\ \epsilon & 0 & 0 & 1 \end{array} \right], \quad 1 > \epsilon \geqslant 0, \tag {6.4.15} Λ ϵ = 1 1 ϵ ϵ 1 1 0 0 ϵ 0 1 0 ϵ 0 0 1 , 1 > ϵ ⩾ 0 , ( 6.4.15 ) 给出的扰动及 A ϵ A_{\epsilon} A ϵ 的有向图 Γ ( A ϵ ) \Gamma(A_{\epsilon}) Γ ( A ϵ ) ,其中,当 ϵ = 0 \epsilon = 0 ϵ = 0 时,虚弧线消失。如果 ϵ ≠ 0 \epsilon \neq 0 ϵ = 0 ,则 Γ ( A ϵ ) \Gamma(A_{\epsilon}) Γ ( A ϵ ) 是强连通的,且 A ϵ A_{\epsilon} A ϵ 是不可约的。于是求得
R 1 ′ = 1 + 2 ε , R 2 ′ = 1 , R 3 ′ = ε , R 4 ′ = ε , R _ {1} ^ {\prime} = 1 + 2 \varepsilon , R _ {2} ^ {\prime} = 1, R _ {3} ^ {\prime} = \varepsilon , R _ {4} ^ {\prime} = \varepsilon , R 1 ′ = 1 + 2 ε , R 2 ′ = 1 , R 3 ′ = ε , R 4 ′ = ε , 且 A ϵ A_{\epsilon} A ϵ 有特征值
λ t = 1. 1 , 1 + ( 1 + 2 ε 2 ) 12 和 1 − ( 1 + 2 ε 2 ) 12 . \lambda_ {t} = 1. \quad 1, \quad 1 + (1 + 2 \varepsilon^ {2}) ^ {1 2} \text {和} 1 - (1 + 2 \varepsilon^ {2}) ^ {1 2}. λ t = 1. 1 , 1 + ( 1 + 2 ε 2 ) 12 和 1 − ( 1 + 2 ε 2 ) 12 . 练习 验证关于 A ϵ A_{\epsilon} A ϵ 的上述计算.
因为三项或多项 R 1 ′ R_{1}^{\prime} R 1 ′ 的任一乘积至少包含 ε \varepsilon ε 的一个因子,所以,当 ε \varepsilon ε 是小的正数时,无论对于 m = 3 m = 3 m = 3 还是 m = 4 m = 4 m = 4 ,集合(6.4.12)都不可能是特征值的包含区域。
练习 考虑(6.4.14)的如同形式(6.4.15)的扰动,证明上述结论对所有 m ⩾ 3 m \geqslant 3 m ⩾ 3 成立。
(6.4.13)和(6.4.15)的哪个固有性质说明, m = 1 m = 1 m = 1 和 m = 2 m = 2 m = 2 在(6.4.12)中是可行的,而 m = 3 m = 3 m = 3 和 m = 4 m = 4 m = 4 是不可行的呢?Richard Brualdi注意到,在每种情形下有向图都不包含长为3或4的回路,但是的确包含长为1和2的回路。这原来是得到Brauer定理的正确推广的关键所在。
我们知道,有向图 Γ \Gamma Γ 是强连通的,当且仅当在 Γ \Gamma Γ 中有一条从每一结点到任何其他结点的有向道路(并且还有返回的有向道路).
我们称 Γ \Gamma Γ 是弱连通的,当且仅当从每个结点到某个其他结点有一条有向道路及返回的有向道路。这等价于断言, Γ ′ \Gamma' Γ ′ 中的每个结点属于某条非平凡回路:一条平凡回路(或圈)是长为 1 的有向道路,其起点和终点在同一个结点。
用矩阵来描述,我们知道, Γ ( A ) \Gamma(A) Γ ( A ) 是强连通的,当且仅当 A A A 是不可约的。称 A A A 是弱不可约的,当且仅当 Γ ( A ) \Gamma(A) Γ ( A ) 是弱连通的。弱不可约性看来不像不可约性有引人注意的特征描述[用像置换相似那样的变换表示(6.2.21b)],但是,用 A A A 元素的零-非零结构来描述便会得知, A A A 是弱不可约的,当且仅当对每个 i − 1 , ⋯ , n i - 1, \cdots, n i − 1 , ⋯ , n , A A A 的第 i i i 行至少有一个非零非对角元 a 9 i a_{9_i} a 9 i ,使得 A A A 有一个非零元序列 a k 1 k 2 , a k 2 k 3 , ⋯ , a k m − 1 k m a_{k_1 k_2}, a_{k_2 k_3}, \cdots, a_{k_{m-1} k_m} a k 1 k 2 , a k 2 k 3 , ⋯ , a k m − 1 k m ,适合 k 1 = j i k_1 = j_i k 1 = j i 和 k m = i k_m = i k m = i 。这个麻烦的条件大约是 A A A 有性质 SC 的条件(6.2.7)的一半,为了计算上的需要,或许用类似于定理(6.2.23)的形式来叙述更为方便。
6.4.16 引理 如果 A ∈ M n A \in M_{n} A ∈ M n ,则 A A A 是弱不可约的,当且仅当矩阵
(a) B = [ I + ∣ A ∣ ] n B = [I + |A|]^{n} B = [ I + ∣ A ∣ ] n 或 (b) B = [ I + M ( A ) ] n − 1 B = [I + M(A)]^{n - 1} B = [ I + M ( A ) ] n − 1
中的任何一个有性质:对每个 i = 1 , … , n i = 1, \dots, n i = 1 , … , n ,在第 i i i 行至少存在一个非零非对角元 b i j ( j ≠ i ) b_{ij} (j \neq i) b ij ( j = i ) ,
使得 b n b_{n} b n 也是非零的.
练习 证明引理(6.4.16). 提示:利用(6.2.19)中的思想
练习 假定 A ∈ M n A \in M_{n} A ∈ M n , 设 B ∈ M n B \in M_{n} B ∈ M n 定义为(6.4.16)中的(a)或(b). 证明, A A A 是弱不可约的当且仅当 Γ ( B ) \Gamma(B) Γ ( B ) 有性质: 每个结点属于长为2的回路. 关于不可约矩阵的相应性质是什么? 哪个性质更弱? 根据定义可知, 一个回路是简单的, 如果只有它的起点(这也是终点)在结点表中可以出现两次以上.
练习 如果 A ∈ M n A \in M_{n} A ∈ M n 是弱不可约的,证明所有 R i ′ > 0 R_{i}^{\prime} > 0 R i ′ > 0 和所有 C i ′ > 0 C_{i}^{\prime} > 0 C i ′ > 0 .
集 S S S 上的一个预序是定义在 S S S 的所有点对之间的关系 R R R ,使得对任一对元素 s , t ∈ S s, t \in S s , t ∈ S ,有 s R t sRt s Rt 或 t R s tRs tR s ,或者两者都成立。一个预序一定是自反的( s R s sRs s R s 对每个 s ∈ S s \in S s ∈ S 成立)和传递的(如果 s R t sRt s Rt 且 t R u tRu tR u ,则 s R u sRu s R u )。一个预序可能不是对称的(只要 t R s tRs tR s ,就有 s R t sRt s Rt ),而且还可能有 s R t sRt s Rt 且 t R s tRs tR s ,而无 s = t s = t s = t 。 S S S 的子集 S 0 S_0 S 0 中的点 z z z 称为 S 0 S_0 S 0 的极大元,是指 s R z sRz s R z 对所有 s ∈ S s \in S s ∈ S 成立。
练习 设 S S S 是复数域的任一非空集合. 用
z R w , 当 且 仅 当 ∣ z ∣ ⩽ ∣ w ∣ z R w, \quad \text {当 且 仅 当} | z | \leqslant | w | z Rw , 当 且 仅 当 ∣ z ∣ ⩽ ∣ w ∣ 定义的复数对 z , w ∈ S z, w \in S z , w ∈ S 之间的关系是 C \mathbf{C} C 上一个预序.
6.4.17 引理 设 S S S 是非空有限集,在 S S S 上定义了一个预序。则 S S S 至少包含一个极大元。
证明:把诸元素排成任意顺序 s 1 , ⋯ , s k s_1, \cdots, s_k s 1 , ⋯ , s k ,令 s ≡ s 1 s \equiv s_1 s ≡ s 1 。如果 s 2 R s s_2R_s s 2 R s ,就留下 s s s ,否则就令 s ≡ s 2 s \equiv s_2 s ≡ s 2 。对余下的元素继续这样做。 s s s 的最后值就是极大元。
如果 Γ \Gamma Γ 是有向图,且 P i P_{i} P i 是 Γ \Gamma Γ 的一个结点,定义 Γ 外 ( P i ) \Gamma_{\text{外}}(P_i) Γ 外 ( P i ) 是由不同于 P i P_{i} P i 的结点组成的集,且从 P i P_{i} P i 经长为1的某条有向道路可以到达其中每一个结点。注意,如果 Γ \Gamma Γ 是弱连通的,则对每个结点 P i ∈ Γ P_{i} \in \Gamma P i ∈ Γ , Γ 外 ( P i ) \Gamma_{\text{外}}(P_{i}) Γ 外 ( P i ) 是不空的。
让我们用 C ( A ) C(A) C ( A ) 表示有向图 Γ ( A ) \Gamma(A) Γ ( A ) 中的诸非平凡回路 γ \gamma γ 的集合。一条非平凡回路是至少包含两个不同结点的回路;即它是(简单有向)回路,而不是圈。对于矩阵(6.4.13), C ( A ) C(A) C ( A ) 只包括一条回路 γ = P 1 P 2 \gamma = P_{1}P_{2} γ = P 1 P 2 , P 2 P 1 P_{2}P_{1} P 2 P 1 ,而对于矩阵(6.4.15),则有三条分离的非平凡回路,其长度都是2。
6.4.18 定理(Brualdi) 如果 A = [ a y ] ∈ M n A = [a_{y}] \in M_{n} A = [ a y ] ∈ M n 是弱不可约的,则 A A A 的每个特征值包含在区域
⋃ y ∈ C ( A ) { z ∈ C : ∏ P i ∈ y ∣ z − a n ∣ ⩽ ∏ P i ∈ y R i ′ } (6.4.19) \bigcup_ {y \in C (A)} \left\{z \in \mathbf {C}: \prod_ {P _ {i} \in y} | z - a _ {n} | \leqslant \prod_ {P _ {i} \in y} R _ {i} ^ {\prime} \right\} \tag {6.4.19} y ∈ C ( A ) ⋃ ⎩ ⎨ ⎧ z ∈ C : P i ∈ y ∏ ∣ z − a n ∣ ⩽ P i ∈ y ∏ R i ′ ⎭ ⎬ ⎫ ( 6.4.19 ) 中.记号是说,如果 γ = P i 1 P i 2 , … , P i k P i k + 1 \gamma = P_{i_1}P_{i_2},\dots ,P_{i_k}P_{i_{k + 1}} γ = P i 1 P i 2 , … , P i k P i k + 1 是非平凡回路,且 P i k − 1 = P i 1 P_{i_{k - 1}} = P_{i_1} P i k − 1 = P i 1 ,则在(6.4.19)中的每个乘积恰好包含 k k k 项,且下标 i i i 取 i 1 , i 2 , … , i k i_1,i_2,\dots ,i_k i 1 , i 2 , … , i k 这 k k k 个值.
证明:假定 λ \lambda λ 是 A A A 的特征值,且对 A A A 的某个主对角元有 λ = a ε \lambda = a_{\varepsilon} λ = a ε 。则 λ \lambda λ 显然在区域(6.4.19)中。实际上,因为 A A A 是弱不可约的,所以所有 R i ′ > 0 R_{i}^{\prime} > 0 R i ′ > 0 ,因而在这种情形, λ \lambda λ 位于区域(6.4.9)内部。如果 A A A 的每个特征值都等于 A A A 的某个主对角元,则 A A A 的所有特征值都在区域(6.4.9)的内部,于是定理得证。
关于其余情形的证明,假定 λ \lambda λ 是 A A A 的特征值,且对所有 i = 1 , … , n , λ ≠ a n i = 1, \dots, n, \lambda \neq a_{n} i = 1 , … , n , λ = a n 。设 A x = λ x Ax = \lambda x A x = λ x 对某个非零 x = [ x i ] ∈ C n x = [x_i] \in \mathbb{C}^n x = [ x i ] ∈ C n 成立,在 Γ \Gamma Γ 的诸结点上定义预序 R R R 为
P t R P j , 当 且 仅 当 ∣ x i ∣ ⩽ ∣ x j ∣ . (6.4.20) P _ {t} R P _ {j}, \quad \text {当 且 仅 当} | x _ {i} | \leqslant | x _ {j} |. \tag {6.4.20} P t R P j , 当 且 仅 当 ∣ x i ∣ ⩽ ∣ x j ∣. ( 6.4.20 ) 要证明,在 Γ ( A ) \Gamma(A) Γ ( A ) 中存在回路 γ ′ \gamma' γ ′ ,且具有以下三条性质:
(a) γ ′ = P i 1 P i 2 ⋅ P i 2 P i 3 , … , P i k P i k + 1 \gamma^{\prime} = P_{i_1}P_{i_2}\cdot P_{i_2}P_{i_3},\dots ,P_{i_k}P_{i_{k + 1}} γ ′ = P i 1 P i 2 ⋅ P i 2 P i 3 , … , P i k P i k + 1 是非平凡(简单有向)回路,其中 k ⩾ 2 k\geqslant 2 k ⩾ 2 且 P i k + 1 = P i 1 P_{i_{k + 1}} = P_{i_1} P i k + 1 = P i 1 (b)对每个 j = 1 , … , k j = 1,\dots ,k j = 1 , … , k ,结点 P i j + 1 P_{i_{j + 1}} P i j + 1 是 Γ 外 ( P i j ) \Gamma _ { \text{外} } ( P _ { i _ { j } } ) Γ 外 ( P i j ) 中的极大结点;即 ∣ x t j + 1 ∣ ⩾ ∣ x m ∣ \mid x_{t_{j + 1}}\mid \geqslant \mid x_m\mid ∣ x t j + 1 ∣ ⩾ ∣ x m ∣ 对所有使 P m ∈ Γ 外 ( P i j ) P_{m}\in \Gamma_{\text{外}}(P_{i_j}) P m ∈ Γ 外 ( P i j ) 的 m m m 成立.(c)所有 x i j ≠ 0 x_{i_j}\neq 0 x i j = 0 , j = 1 , … , k . j = 1,\dots ,k. j = 1 , … , k . (204
如果 γ ′ \gamma^{\prime} γ ′ 是适合条件(6.4.21)的回路,则 A x = λ x Ax = \lambda x A x = λ x 推知,对任意 j = 1 , … , k j = 1, \dots, k j = 1 , … , k ,有
( λ … a i 1 i j ) x i j = ∑ m = 1 m ≠ i j n a i j m x m = ∑ P m ∈ P 外 ( P r ) a i j m x m , (\lambda \dots a _ {i _ {1} i _ {j}}) x _ {i _ {j}} = \sum_ {\substack {m = 1 \\ m \neq i _ {j}}} ^ {n} a _ {i _ {j} m} x _ {m} = \sum_ {P _ {m} \in P _ {\text {外}} (P _ {r})} a _ {i _ {j} m} x _ {m}, ( λ … a i 1 i j ) x i j = m = 1 m = i j ∑ n a i j m x m = P m ∈ P 外 ( P r ) ∑ a i j m x m , 因而
∣ λ − a t , t ∣ ∣ x t ∣ = ∣ ∑ P m ∈ Γ 外 ( P t ) a t , m x m ∣ ⩽ ∑ P m ∈ Γ 外 ( P t ) ∣ a t , m ∣ ∣ x m ∣ ( 6.4.22 ) ⩽ ∑ P m ∈ Γ 外 ( P i ) ∣ a i , m ∣ ∣ x i + 1 ∣ = R i j ′ ∣ x i + 1 ∣ . ( 6.4.22 a ) \begin{array}{l} | \lambda - a _ {t, t} | | x _ {t} | = \left| \sum_ {P _ {m} \in \Gamma_ {\text {外}} (P _ {t})} a _ {t, m} x _ {m} \right| \leqslant \sum_ {P _ {m} \in \Gamma_ {\text {外}} (P _ {t})} | a _ {t, m} | | x _ {m} | (6.4.22) \\ \leqslant \sum_ {P _ {m} \in \Gamma_ {\text {外}} (P _ {i})} | a _ {i, m} | | x _ {i + 1} | \\ = R _ {i j} ^ {\prime} \mid x _ {i + 1} \mid . (6.4.22a) \\ \end{array} ∣ λ − a t , t ∣∣ x t ∣ = ∑ P m ∈ Γ 外 ( P t ) a t , m x m ⩽ ∑ P m ∈ Γ 外 ( P t ) ∣ a t , m ∣∣ x m ∣ ( 6.4.22 ) ⩽ ∑ P m ∈ Γ 外 ( P i ) ∣ a i , m ∣∣ x i + 1 ∣ = R ij ′ ∣ x i + 1 ∣ . ( 6.4.22 a ) 如果现在在 γ ′ \gamma' γ ′ 的所有结点上取不等式(6.4.22)的乘积,便得到
∏ j = 1 k ∣ λ − a j , t ∣ ∣ x i j ∣ ⩽ ∏ j = 1 k R i j ′ ∣ x i j + 1 ∣ . (6.4.23) \prod_ {j = 1} ^ {k} | \lambda - a _ {j, t} | | x _ {i _ {j}} | \leqslant \prod_ {j = 1} ^ {k} R _ {i _ {j}} ^ {\prime} | x _ {i _ {j + 1}} |. \tag {6.4.23} j = 1 ∏ k ∣ λ − a j , t ∣∣ x i j ∣ ⩽ j = 1 ∏ k R i j ′ ∣ x i j + 1 ∣. ( 6.4.23 ) 但是
∏ j = 1 k ∣ λ − a t i t j ∣ = ∏ P i ∈ γ ′ ∣ λ − a i i ∣ 和 ∏ j = 1 k R i j ′ = ∏ P i ∈ γ ′ R i ′ , \prod_ {j = 1} ^ {k} \mid \lambda - a _ {t _ {i} t _ {j}} \mid = \prod_ {P _ {i} \in \gamma^ {\prime}} \mid \lambda - a _ {i i} \mid \quad \text {和} \quad \prod_ {j = 1} ^ {k} R _ {i j} ^ {\prime} = \prod_ {P _ {i} \in \gamma^ {\prime}} R _ {i} ^ {\prime}, j = 1 ∏ k ∣ λ − a t i t j ∣= P i ∈ γ ′ ∏ ∣ λ − a ii ∣ 和 j = 1 ∏ k R ij ′ = P i ∈ γ ′ ∏ R i ′ , 又因为 P t k + 1 = P t 1 P_{t_{k + 1}} = P_{t_1} P t k + 1 = P t 1 ,还有 x t k − 1 = x t 1 x_{t_{k - 1}} = x_{t_1} x t k − 1 = x t 1 ,因此,
∏ j = 1 k ∣ x i j ∣ = ∏ j = 1 k ∣ x i j − 1 ∣ ≠ 0. (6.4.24) \prod_ {j = 1} ^ {k} \left| x _ {i _ {j}} \right| = \prod_ {j = 1} ^ {k} \left| x _ {i _ {j - 1}} \right| \neq 0. \tag {6.4.24} j = 1 ∏ k x i j = j = 1 ∏ k x i j − 1 = 0. ( 6.4.24 ) 于是,用(6.4.24)除(6.4.23)便得到
∏ P ∈ γ ′ ∣ λ − a n ∣ ⩽ ∏ P ∈ γ ′ R t ′ . (6.4.25) \prod_ {P \in \gamma^ {\prime}} | \lambda - a _ {n} | \leqslant \prod_ {P \in \gamma^ {\prime}} R _ {t} ^ {\prime}. \tag {6.4.25} P ∈ γ ′ ∏ ∣ λ − a n ∣ ⩽ P ∈ γ ′ ∏ R t ′ . ( 6.4.25 ) 因为 γ ′ \gamma^{\prime} γ ′ 是 Γ ( A ) \Gamma(A) Γ ( A ) 中的非平凡回路,所以特征值 λ \lambda λ 一定位于区域(6.4.19)中。
现在应该证明,必存在适合条件(6.4.21)的回路 γ ′ \gamma' γ ′ 。设 i i i 是使 x i ≠ 0 x_{i} \neq 0 x i = 0 的任一下标:于是从恒等式
( λ − a n ) x i = ∑ j = 1 j ≠ i n a i j x j = ∑ P j ∈ P 外 ( P i ) a i j x j , (\lambda - a _ {n}) x _ {i} = \sum_ {\substack {j = 1 \\ j \neq i}} ^ {n} a _ {i j} x _ {j} = \sum_ {P _ {j} \in P _ {\text {外}} (P _ {i})} a _ {i j} x _ {j}, ( λ − a n ) x i = j = 1 j = i ∑ n a ij x j = P j ∈ P 外 ( P i ) ∑ a ij x j , 以及 x i ≠ 0 x_{i} \neq 0 x i = 0 和 λ − a n ≠ 0 \lambda - a_{n} \neq 0 λ − a n = 0 的事实得知,左边非零,因而在 Γ 外 ( P i ) \Gamma_{\text{外}}(P_{i}) Γ 外 ( P i ) 的诸结点中[这些 P i P_{i} P i 使 a i j ≠ 0 a_{ij} \neq 0 a ij = 0 且 j ≠ i j \neq i j = i ;因为 Γ ( A ) \Gamma(A) Γ ( A ) 是弱连通的,所以 Γ 外 ( P i ) \Gamma_{\text{外}}(P_{i}) Γ 外 ( P i ) 非空]一定至少有一个结点,使得相应的特征向量分量 x j x_{j} x j 非零。设 P i 1 ≡ P i P_{i_{1}} \equiv P_{i} P i 1 ≡ P i ,又设 P i 2 P_{i_{2}} P i 2 是 Γ 外 ( P i 1 ) \Gamma_{\text{外}}(P_{i_{1}}) Γ 外 ( P i 1 ) 中的诸结点中的极大结点,即 ∣ x i 2 ∣ ⩾ ∣ x m ∣ |x_{i_{2}}| \geqslant |x_{m}| ∣ x i 2 ∣ ⩾ ∣ x m ∣ 对所有使 P m ∈ Γ 外 ( P i 1 ) P_{m} \in \Gamma_{\text{外}}(P_{i_{1}}) P m ∈ Γ 外 ( P i 1 ) 的 m m m 成立。我们可保证 x i 2 ≠ 0 x_{i_{2}} \neq 0 x i 2 = 0 。
假定上述构造法已经得到长为 j − 1 j - 1 j − 1 的有向道路 P t 1 P t 2 , P t 2 P t 3 , … , P t j − 1 P t j P_{t_1}P_{t_2}, P_{t_2}P_{t_3}, \dots, P_{t_{j-1}}P_{t_j} P t 1 P t 2 , P t 2 P t 3 , … , P t j − 1 P t j ,且适合(6.4.21)的条件(b)和(c);刚才已对 j = 2 j = 2 j = 2 这样做了。于是
( λ … a i ′ j ) x i j = ∑ P m ( I 外 ⋅ P i ′ ) a i ′ m x m , (\lambda \dots a _ {i ^ {\prime} j}) x _ {i j} = \sum_ {P _ {m} (I _ {\text {外}} \cdot P _ {i ^ {\prime}})} a _ {i ^ {\prime} m} x _ {m}, ( λ … a i ′ j ) x ij = P m ( I 外 ⋅ P i ′ ) ∑ a i ′ m x m , 且左边非零,因而在 Γ 外 ( P i r ) \Gamma_{\text{外}}(P_{i_r}) Γ 外 ( P i r ) 中一定至少存在一个结点[因 Γ ( A ) \Gamma(A) Γ ( A ) 是弱连通的,所以 Γ 外 ( P i r ) \Gamma_{\text{外}}(P_{i_r}) Γ 外 ( P i r ) 非空]使相应的特征向量分量非零.因此,如果选取 P i r + 1 P_{i_{r + 1}} P i r + 1 为 Γ 外 ( P i r ) \Gamma_{\text{外}}(P_{i_r}) Γ 外 ( P i r ) 的极大结点,保证有 x i r ≠ 0 x_{i_r}\neq 0 x i r = 0
因为在 Γ ( A ) \Gamma(A) Γ ( A ) 中只有有限多个结点,这个构造法依次取 j = 2 , 3 , ⋯ j = 2, 3, \cdots j = 2 , 3 , ⋯ ,最后会得到第一个极大结点 P i 0 ∈ Γ 外 ( P i 1 ) P_{i_0} \in \Gamma_{\text{外}}(P_{i_1}) P i 0 ∈ Γ 外 ( P i 1 ) 。它是作为前面某一步的结点 P i p P_{i_p} P i p 得来的( 2 ⩽ p + 1 < q 2 \leqslant p + 1 < q 2 ⩽ p + 1 < q )。因此 γ ′ = P i p P i p + 1 , P i p + 1 P i p − 2 , ⋯ , P i q − 1 P i p \gamma' = P_{i_p}P_{i_{p+1}}, P_{i_{p+1}}P_{i_{p-2}}, \cdots, P_{i_{q-1}}P_{i_p} γ ′ = P i p P i p + 1 , P i p + 1 P i p − 2 , ⋯ , P i q − 1 P i p 是 Γ ( A ) \Gamma(A) Γ ( A ) 中的回路,且适合(6.4.21)中的所有三个条件。 □ \square □
当 A A A 实际上是不可约的时候,Brualdi定理有较强的形式,它是推广Brauer(6.4.7)的定理(6.2.26)的形式.
6.4.26 定理(Brualdi) 设 A = [ a i j ] ∈ M n A = [a_{ij}] \in M_{n} A = [ a ij ] ∈ M n 是不可约的, 则对每个非平凡回路 γ ∈ C ( A ) \gamma \in C(A) γ ∈ C ( A ) , 只有当各个集合
{ z ∈ C : ∏ P i ∈ γ ∣ z − a n ∣ ⩽ ∏ P i ∈ γ R i ′ } (6.4.27) \left\{z \in \mathbf {C}: \prod_ {P _ {i} \in \gamma} | z - a _ {n} | \leqslant \prod_ {P _ {i} \in \gamma} R _ {i} ^ {\prime} \right\} \tag {6.4.27} ⎩ ⎨ ⎧ z ∈ C : P i ∈ γ ∏ ∣ z − a n ∣ ⩽ P i ∈ γ ∏ R i ′ ⎭ ⎬ ⎫ ( 6.4.27 ) 的边界都经过 λ \lambda λ 时,区域(6.4.19)的边界点 λ \lambda λ 才可以是 A A A 的特征值。
证明:因为所有 R i ′ > 0 R_{i}^{\prime} > 0 R i ′ > 0 ,如果 λ = a n \lambda = a_{n} λ = a n 对任一 i = 1 , 2 , … , n i = 1,2,\dots ,n i = 1 , 2 , … , n 成立,则 λ \pmb{\lambda} λ 不可能在区域(6.4.27)的边界上.因此,可以假定,对所有 i = 1 , … , n i = 1,\dots ,n i = 1 , … , n 有 λ ≠ a n \lambda \neq a_{n} λ = a n ,并且可以继续采用Brualdi定理(6.4.18)中的证法以及相同的记号,但是需另外假定 λ \lambda λ 是在区域(6.4.19)的边界上的 A \pmb{A} A 的特征值.正如在引理(6.2.3)的证明中所证明的,对所的有非平凡回路 γ ∈ C ( A ) \gamma \in C(A) γ ∈ C ( A ) , λ \lambda λ 必定满足不等式
∏ P ∈ γ λ ⋅ a ν ⩾ ∏ P ∈ γ R ′ \prod_ {P \in \gamma} \lambda \cdot a _ {\nu} \geqslant \prod_ {P \in \gamma} R ^ {\prime} P ∈ γ ∏ λ ⋅ a ν ⩾ P ∈ γ ∏ R ′ [387] [其中等式对至少一个 γ ∈ ( A ) \gamma \in (A) γ ∈ ( A ) 成立]. 把这个不等式与(6.4.25)作一比较,得知
∏ P ∈ γ ′ ∣ λ − a n ′ = ∏ P ∈ γ ′ R t ′ , (6.4.28) \prod_ {P \in \gamma^ {\prime}} \left| \lambda - a _ {n} \right. ^ {\prime} = \prod_ {P \in \gamma^ {\prime}} R _ {t} ^ {\prime}, \tag {6.4.28} P ∈ γ ′ ∏ ∣ λ − a n ′ = P ∈ γ ′ ∏ R t ′ , ( 6.4.28 ) 其中 γ ′ \gamma' γ ′ 是在(6.4.18)的证明中所构造的特殊回路。因此,(6.4.23)中的不等式一定是等式,从而对所有 j = 1 , 2 , … , k j = 1, 2, \dots, k j = 1 , 2 , … , k ,(6.4.22)中的两个不等式一定是等式。特别是,不等式(6.4.22a)一定是等式,因而对每个 P i j ∈ γ ′ P_{i_j} \in \gamma' P i j ∈ γ ′ 和对所有使 P m ∈ Γ 外 ( P i j ) P_m \in \Gamma_{\text{外}}(P_{i_j}) P m ∈ Γ 外 ( P i j ) 的 m m m , ∣ x m ∣ = ∣ x i j + 1 ∣ = c i j + 1 = |x_m| = |x_{i_{j+1}}| = c_{i_{j+1}} = ∣ x m ∣ = ∣ x i j + 1 ∣ = c i j + 1 = 常数。注意,这个结论对适合条件(6.4.21)的任一回路都成立。
现在定义集合
K ≡ { P i ∈ Γ ( A ) : ∣ x m ∣ − c i = 常 数 对 所 有 使 P m ∈ Γ 外 ( P i ) 的 m 成 立 } . K \equiv \{P _ {i} \in \Gamma (A): | x _ {m} | - c _ {i} = \text {常 数 对 所 有 使} P _ {m} \in \Gamma_ {\text {外}} (P _ {i}) \text {的} m \text {成 立} \}. K ≡ { P i ∈ Γ ( A ) : ∣ x m ∣ − c i = 常 数 对 所 有 使 P m ∈ Γ 外 ( P i ) 的 m 成 立 } . 因为 γ ′ \gamma' γ ′ 的所有结点都在 K K K 中,所以 K K K 不空。我们想要证明 Γ ( A ) \Gamma(A) Γ ( A ) 的所有结点都在 K K K 中。
假定 Γ ( A ) \Gamma(A) Γ ( A ) 的结点 P q P_{q} P q 不在 K K K 中。因为 Γ ( A ) \Gamma(A) Γ ( A ) 是强连通的,所以在 Γ ( A ) \Gamma(A) Γ ( A ) 中,从 K K K 的每个结点到这个外结点 P q P_{q} P q 至少存在一条有向道路。如果从所有这些有向道路中选取长度最小的道路,则它的第一条弧一定是从 K K K 中的一个结点到不在 K K K 中的结点 P f P_{f} P f 的弧。如果在 Γ ( A ) \Gamma(A) Γ ( A ) 的结点上
采用定理(6.4.18)的证明中用过的相同预序,则可以使用在定理(6.4.18)证明中用过的相同构造法;从结点 P i ≡ P j P_{i} \equiv P_{j} P i ≡ P j 开始,选取极大结点 P j n ∈ Γ 外 ( P j 1 ) P_{j_{n}} \in \Gamma_{\text{外}}(P_{j_{1}}) P j n ∈ Γ 外 ( P j 1 ) ,选取极大结点 P j 1 ∈ Γ 外 ( P j 0 ) P_{j_{1}} \in \Gamma_{\text{外}}(P_{j_{0}}) P j 1 ∈ Γ 外 ( P j 0 ) ,如此等等。因为 Γ ( A ) \Gamma(A) Γ ( A ) 是弱(甚至强)连通的,所以,在每一步 Γ 外 ( P j r ) \Gamma_{\text{外}}(P_{j_{r}}) Γ 外 ( P j r ) 非空,又由于如前所述的相同理由,极大结点适合(6.4.21)的条件(c).
如果在这个构造过程中的某一步,在选取极大结点当中,可以选择在 K K K 中的或不在 K K K 中的结点,那么就总选取不在 K K K 中的那个结点。如果在任一步中,可供选取的所有极大结点都在 K K K 中,那么就在它们中任选一个,然后沿着(一定在 K K K 中的)长度最小的有向道路到不在 K K K 中的第一个结点上;并且如前继续选择极大结点。根据 K K K 的定义, K K K 中任一条有向道路将具有性质:每个结点是它的前一结点在 Γ 外 \Gamma_{\text{外}} Γ 外 中的极大结点[(6.1.21)的条件(b)]。因为 K K K 的补集只有有限多个结点,这个构造法终究应该得到 K K K 的补集中的第一个极大结点,它是作为前面某一步的一个结点得来的。对于这个构造法中的这个结点,在它第一次出现与第二次出现之间的有向道路将是一条非平凡的有向回路,这条有向回路可能不是简单的,这是因为当这个构造法选出 K K K 中一结点时,我们就选一条由该点到 K K K 外一结点的有向道路。在位于 K K K 中的那部分道路中,可能有有限多条回路,但是可以删去它们而留下一条简单回路 γ ′ ′ \gamma^{\prime \prime} γ ′′ , γ ′ ′ \gamma^{\prime \prime} γ ′′ 适合条件(6.4.21)且至少包含不在 K K K 中的一个结点。
因为回路 γ ′ ′ \gamma^{\prime \prime} γ ′′ 适合条件(6.4.21),所以可以用它来代替定理(6.4.18)证明中的回路 γ ′ \gamma^{\prime} γ ′ 。根据本证明的第一段中的论证,得知,对所有 P i t ∈ γ ′ ′ , ∣ x m ∣ = c t r = P_{i_t} \in \gamma'', |x_m| = c_{t_r} = P i t ∈ γ ′′ , ∣ x m ∣ = c t r = 常数对所有 P m ∈ Γ ( P j t ) P_{m} \in \Gamma(P_{j_t}) P m ∈ Γ ( P j t ) 成立。因此 γ ′ ′ \gamma^{\prime \prime} γ ′′ 中的每个结点在 K K K 中,这与 γ ′ ′ \gamma^{\prime \prime} γ ′′ 至少包含不在 K K K 中的一个结点相矛盾。这就证明了 Γ ( A ) \Gamma(A) Γ ( A ) 不可能有不在 K K K 中的任何结点。
如果 γ \gamma γ 是 Γ ( A ) \Gamma(A) Γ ( A ) 中任一条非平凡(简单有向)回路,因为它的所有结点都在 K K K 中,所以它自然适合条件(6.4.21). 因此可以用它代替定理(6.4.18)的证明中的 γ ′ \gamma' γ ′ ,从而也可以用它代替(6.4.28)中的 γ ′ \gamma' γ ′ . 这就是所要证的结论:每个集(6.4.27)的边界经过 λ \lambda λ .
6.4.29 推论 如果 A ∈ M n A \in M_{n} A ∈ M n ,则下列条件中的任何一个是 Λ \Lambda Λ 为可逆矩阵的充分条件:
(a) A A A 是弱不可约矩阵,且
∏ P 1 ∈ γ ∣ a n ∣ > ∏ P 1 ∈ γ R 1 ′ \prod_ {P _ {1} \in \gamma} | a _ {n} | > \prod_ {P _ {1} \in \gamma} R _ {1} ^ {\prime} P 1 ∈ γ ∏ ∣ a n ∣ > P 1 ∈ γ ∏ R 1 ′ 对每条非平凡回路 γ ∈ C ( A ) \gamma \in C(A) γ ∈ C ( A ) 成立;
(b) A A A 是不可约矩阵,且
∏ P i ∈ γ ∣ a n ∣ ⩾ ∏ P i ∈ γ R ′ \prod_ {P _ {i} \in \gamma} | a _ {n} | \geqslant \prod_ {P _ {i} \in \gamma} R ^ {\prime} P i ∈ γ ∏ ∣ a n ∣ ⩾ P i ∈ γ ∏ R ′ 对每条非平凡回路 γ ∈ ( A ) \gamma \in (A) γ ∈ ( A ) 成立,其中严格不等式对至少一条回路成立。
习题 证明,如果矩阵 A = [ a i j ] A = [a_{ij}] A = [ a ij ] 适合关于 Brauer 可逆性的条件 (6.4.11b),则除了 i = 1 , … , n i = 1, \dots, n i = 1 , … , n 的至多一个值以外,都有 ∣ a n ∣ > R j ′ |a_{n}| > R_{j}^{\prime} ∣ a n ∣ > R j ′ 。因此,Brauer 条件只是比关于严格对角占优性的 Levy-Desplanques 条件 (6.1.10a) 稍微弱一些。这与 (6.1.11) 是什么关系?
证明,根据(6.4.11)中的两个条件, A = [ 2 3 1 3 ] A = \begin{bmatrix} 2 & 3 \\ 1 & 3 \end{bmatrix} A = [ 2 1 3 3 ] 都是可逆的,不过不是Levy-
Desplanques条件(6.1.10a)也不是(6.1.11)确保其可逆性.(6.1.11)的列形式是什么? 3. 证明,对于 n ⩾ 2 n \geqslant 2 n ⩾ 2 ,每个不可约矩阵 A ∈ M n A \in M_n A ∈ M n 是弱不可约的。试给出一个例子,它是弱不可约矩阵而不是不可约矩阵。 4. 给出推论(6.4.29)的证明细节。提示:采用(6.1.10)和(6.2.6)中的相同证法。 5. 证明, A ∈ M n A \in M_n A ∈ M n 是弱不可约的,当且仅当 A A A 不置换相似于其一个对角子块是 1 × 1 1 \times 1 1 × 1 的分块三角(0.9.4)矩阵。 进一步阅读 关于包含区域的详细说明以及许多原始文献可参看 R. Brualdi, “Matrices, Eigenvalues, and Directed Graphs,” Lin. Multilin. Alg. 11(1982), 143-165.