8.4 不可约非负矩阵 如果能够对不含任何0元的矩阵证明一结论,那么这个结论常常可推广到不可约矩阵,这是一个颇具启发性的有用法则。我们在第6章推广基本的Gersgorin定理时,已有这个法则的一个例证,现在要给出另一个例证。其基本思想已在定理(6.2.24)中得到证明;这里重述其相关的部分。
8.4.1 引理 设 A ∈ M n A \in M_n A ∈ M n ,且假定 A ⩾ 0 A \geqslant 0 A ⩾ 0 。那么, A A A 是不可约矩阵,当且仅当 ( I + A ) n − 1 > 0 (I + A)^{n-1} > 0 ( I + A ) n − 1 > 0 。
练习 如果 A ∈ M n A \in M_{n} A ∈ M n , 证明, A A A 是不可约的, 当且仅当 A t A^{t} A t 是不可约的.
目前,我们还需要下述简单的结果。
8.4.2 引理 设 A ∈ M n A \in M_{n} A ∈ M n ,且设 λ 1 , … , λ n \lambda_{1}, \ldots, \lambda_{n} λ 1 , … , λ n 是 A A A 的特征值(计重特征值)。则 λ 1 + 1 , … , λ n + 1 \lambda_{1} + 1, \ldots, \lambda_{n} + 1 λ 1 + 1 , … , λ n + 1 是 I + A I + A I + A 的特征值且 ρ ( I + A ) ⩽ 1 + ρ ( A ) \rho(I + A) \leqslant 1 + \rho(A) ρ ( I + A ) ⩽ 1 + ρ ( A ) 。如果 A ⩾ 0 A \geqslant 0 A ⩾ 0 ,则 ρ ( I + A ) = 1 + ρ ( A ) \rho(I + A) = 1 + \rho(A) ρ ( I + A ) = 1 + ρ ( A ) 。
证明:设 λ ∈ σ ( A ) \lambda \in \sigma(A) λ ∈ σ ( A ) 有重数 k k k ,则 λ \lambda λ 是特征方程 p A ( t ) = det ( t I − A ) − 0 p_A(t) = \operatorname{det}(tI - A) - 0 p A ( t ) = det ( t I − A ) − 0 的 k k k 重根。另外,因 det ( t I − A ) = det [ ( t + 1 ) I − ( A + I ) ] \operatorname{det}(tI - A) = \operatorname{det}[(t + 1)I - (A + I)] det ( t I − A ) = det [( t + 1 ) I − ( A + I )] ,所以 λ + 1 \lambda + 1 λ + 1 是 p A , t ( s ) = det [ s I − ( A + I ) ] = 0 p_{A, t}(s) = \operatorname{det}[sI - (A + I)] = 0 p A , t ( s ) = det [ s I − ( A + I )] = 0 的 k k k 重根。于是 λ 1 + 1 , … , λ n + 1 \lambda_1 + 1, \dots, \lambda_n + 1 λ 1 + 1 , … , λ n + 1 是 A + I A + I A + I 的特征值。因此, ρ ( I + A ) = max 1 ⩽ i ⩽ n ∣ λ i + 1 ∣ ⩽ max 1 ⩽ i ⩽ n ∣ λ i ∣ + 1 = 1 + ρ ( A ) \rho(I + A) = \max_{1 \leqslant i \leqslant n} |\lambda_i + 1| \leqslant \max_{1 \leqslant i \leqslant n} |\lambda_i| + 1 = 1 + \rho(A) ρ ( I + A ) = max 1 ⩽ i ⩽ n ∣ λ i + 1∣ ⩽ max 1 ⩽ i ⩽ n ∣ λ i ∣ + 1 = 1 + ρ ( A ) 。但是,当 A ⩾ 0 A \geqslant 0 A ⩾ 0 时,根据(8.3.1), 1 ∣ ρ ( A ) 1 \mid \rho(A) 1 ∣ ρ ( A ) 是 I + A I + A I + A 的特征值,因此,在这种情形, ρ ( I + A ) = 1 + ρ ( A ) \rho(I + A) = 1 + \rho(A) ρ ( I + A ) = 1 + ρ ( A ) □
练习 试说明,为了证明上述引理的前一部分,下述论证为什么是不完全的:如果 λ \lambda λ 是 A A A 的特征值,则存在某个向量 x ≠ 0 x \neq 0 x = 0 使得 A . x = λ x A.x = \lambda x A . x = λ x 。但是, ( A + I ) x = ( λ + 1 ) x (A + I)x = (\lambda + 1)x ( A + I ) x = ( λ + 1 ) x ,所以 λ + 1 \lambda + 1 λ + 1 是 A + I A + I A + I 的特征值。
8.4.3 引理 如果 A ∈ M n A \in M_{n} A ∈ M n , A ⩾ 0 A \geqslant 0 A ⩾ 0 , 且对某个 k ⩾ 1 k \geqslant 1 k ⩾ 1 有 A k > 0 A^{k} > 0 A k > 0 , 则 ρ ( A ) \rho(A) ρ ( A ) 是 A A A 的代数单重特征值.
证明:如果 λ 1 , … , λ n \lambda_1, \dots, \lambda_n λ 1 , … , λ n 是 A A A 的特征值,则 λ 1 k , … , λ n k \lambda_1^k, \dots, \lambda_n^k λ 1 k , … , λ n k 是 A k A^k A k 的特征值。由定理(8.3.1)可知, ρ ( A ) \rho(A) ρ ( A ) 是 A A A 的特征值,因此,假如 ρ ( A ) \rho(A) ρ ( A ) 是 A A A 的重特征值,则 ρ ( A ) k = ρ ( A k ) \rho(A)^k = \rho(A^k) ρ ( A ) k = ρ ( A k ) 是 A k A^k A k 的重特征值。但这是不可能的,因为由定理(8.2.10)可知, ρ ( A k ) \rho(A^k) ρ ( A k ) 是 A k A^k A k 的单重特征值。
现在将可看到,在多大程度上Perron定理可以推广到非负不可约矩阵.把正矩阵的Perron结果推广到非负矩阵,是与Frobenius的名字分不开的.
8.4.4 定理 设 A ∈ M n A \in M_{n} A ∈ M n ,且假定 A A A 是不可约非负矩阵,则
(a) ρ ( A ) > 0 \rho (A) > 0 ρ ( A ) > 0
(b) ρ ( A ) \rho(A) ρ ( A ) 是 A A A 的特征值; (c) 存在正向量 x x x 使得 A x = ρ ( A ) x A_x = \rho(A)_x A x = ρ ( A ) x ; (d) ρ ( A ) \rho(A) ρ ( A ) 是 A A A 的代数(因而几何)单重特征值.
证明:推论(8.1.25)说明,即使在比不可约性更弱的条件下,(a)仍然成立。根据定理(8.3.1),论断(b)对所有非负矩阵成立,同时它保证存在适合 A x = ρ ( A ) x Ax = \rho(A)x A x = ρ ( A ) x 的非负向量 x ≠ 0 x \neq 0 x = 0 。另一方面, ( I + A ) − 1 x = [ 1 + ρ ( A ) ] − 1 x (I + A)^{-1}x = [1 + \rho(A)]^{-1}x ( I + A ) − 1 x = [ 1 + ρ ( A ) ] − 1 x ,又根据引理(8.4.1),矩阵 ( I + A ) − 1 (I + A)^{-1} ( I + A ) − 1 是正的,所以由(8.1.14)可知,向量 ( I + A ) − 1 x (I + A)^{-1}x ( I + A ) − 1 x 一定是正的。因此 x = [ 1 + ρ ( A ) ] 1 − n ( I + A ) n − 1 x > 0 x = [1 + \rho(A)]^{1 - n}(I + A)^{n - 1}x > 0 x = [ 1 + ρ ( A ) ] 1 − n ( I + A ) n − 1 x > 0 。为了证明(d),利用引理(8.4.2)可证,如果 ρ ( A ) \rho(A) ρ ( A ) 是 A A A 的重特征值,则 1 + ρ ( A ) = ρ ( I + A ) 1 + \rho(A) = \rho(I + A) 1 + ρ ( A ) = ρ ( I + A ) 是 I + A I + A I + A 的重特征值。但是 I + A ⩾ 0 I + A \geqslant 0 I + A ⩾ 0 ,且根据引理(8.4.1), ( I + A ) − 1 > 0 (I + A)^{-1} > 0 ( I + A ) − 1 > 0 ,因此由引理(8.4.3)可知, 1 + ρ ( A ) 1 + \rho(A) 1 + ρ ( A ) 一定是 I + A I + A I + A 的单重特征值。□
该定理保证,不可约非负矩阵相应于Perron根的特征空间是一维的。对于不可约非负矩阵,其分量和为1的唯一正特征向量称为Perron向量。
因为不可约非负矩阵有正特征向量,所以(8.1)节末的诸结果可以应用于这类矩阵,其中特别重要的是谱半径的变分特征(8.1.32).另外, A † A^{\dagger} A † 不可约,当且仅当 A A A 不可约,所以不可约非负矩阵也有正左特征向量.因此,定理(8.3.4)对不可约非负矩阵成立.这个事实在定理(8.1.18)的下述推广中是关键的.
8.4.5 定理 设 A , B ∈ M n A, B \in M_{n} A , B ∈ M n . 假定 A A A 是不可约非负矩阵,且 A ⩾ ∣ B ∣ A \geqslant |B| A ⩾ ∣ B ∣ ,则 ρ ( A ) ⩾ ρ ( B ) \rho(A) \geqslant \rho(B) ρ ( A ) ⩾ ρ ( B ) . 如果 ρ ( A ) = ρ ( B ) \rho(A) = \rho(B) ρ ( A ) = ρ ( B ) ,又 λ = e i φ ρ ( B ) \lambda = e^{i\varphi} \rho(B) λ = e i φ ρ ( B ) 是 B B B 的特征值,则存在 θ 1 , … , θ n ∈ R \theta_{1}, \dots, \theta_{n} \in \mathbb{R} θ 1 , … , θ n ∈ R 使得 B = e i φ D A D − 1 B = e^{i\varphi} D A D^{-1} B = e i φ D A D − 1 ,其中 D = diag ( e i θ 1 , … , e i θ n ) D = \operatorname{diag}(e^{i\theta_{1}}, \dots, e^{i\theta_{n}}) D = diag ( e i θ 1 , … , e i θ n ) .
证明:由定理(8.1.18)已经知道,如果 A ⩾ ∣ B ∣ A \geqslant |B| A ⩾ ∣ B ∣ ,则 ρ ( A ) ⩾ ρ ( B ) \rho(A) \geqslant \rho(B) ρ ( A ) ⩾ ρ ( B ) 。如果 ρ ( A ) = ρ ( B ) \rho(A) = \rho(B) ρ ( A ) = ρ ( B ) ,则存在某个 x ≠ 0 x \neq 0 x = 0 ,使得 B x = λ x Bx = \lambda x B x = λ x ,且 ∣ λ ∣ = ρ ( B ) = ρ ( A ) |\lambda| = \rho(B) = \rho(A) ∣ λ ∣ = ρ ( B ) = ρ ( A ) ,因而
ρ ( A ) ∣ x ∣ − ∣ λ i ∣ = ∣ B x ∣ ⩽ ∣ B ∣ ∣ x ∣ ⩽ A ∣ x ∣ . \rho (A) \mid x \mid - \mid \lambda_ {i} \mid = \mid B _ {x} \mid \leqslant \mid B \mid \mid x \mid \leqslant A \mid x \mid . ρ ( A ) ∣ x ∣ − ∣ λ i ∣=∣ B x ∣ ⩽ ∣ B ∣∣ x ∣ ⩽ A ∣ x ∣ . 因为 A A A 是不可约矩阵,所以,根据定理(8.3.4)可知, A ∣ x ∣ = ρ ( A ) ∣ x A \mid x \mid = \rho(A) \mid x A ∣ x ∣= ρ ( A ) ∣ x . 因而 ∣ B x ∣ = ∣ B ∣ ∣ x ∣ = A ∣ x |Bx| = |B| \mid x| = A \mid x ∣ B x ∣ = ∣ B ∣ ∣ x ∣ = A ∣ x . 此外,定理(8.4.4)的(c)和(d)也蕴涵 ∣ x ∣ > 0 |x| > 0 ∣ x ∣ > 0 ,又因为 ∣ B ∣ ⩽ A |B| \leqslant A ∣ B ∣ ⩽ A 所以由(8.1.15)和 ∣ B ∣ ∣ r ∣ = A ∣ x |B| \mid r \mid = A \mid x ∣ B ∣ ∣ r ∣= A ∣ x , 的事实推出 ∣ B ∣ = A |B| = A ∣ B ∣ = A . 如果定义 θ k ∈ R \theta_k \in \mathbb{R} θ k ∈ R 为 e i θ k = x k / ∣ x k ∣ e^{i\theta_k} = x_k / |x_k| e i θ k = x k /∣ x k ∣ , k = 1 , … , n k = 1, \dots, n k = 1 , … , n ,如果 λ ≡ e i φ ρ ( A ) \lambda \equiv e^{i\varphi} \rho(A) λ ≡ e i φ ρ ( A ) ,又如果令 D ≡ d i a g ( e θ 1 , … , e i θ n ) D \equiv \mathrm{diag}(e^{\theta_1}, \dots, e^{i\theta_n}) D ≡ diag ( e θ 1 , … , e i θ n ) ,则 x = D ∣ x x = D \mid x x = D ∣ x 且 λ x = e i φ ρ ( A ) D ∣ x = B D ∣ x = B r \lambda x = e^{i\varphi} \rho(A)D \mid x = BD \mid x = Br λ x = e i φ ρ ( A ) D ∣ x = B D ∣ x = B r . 因此, e − i φ D − 1 B D ∣ x = ρ ( A ) ∣ x = A ∣ x e^{-i\varphi}D^{-1}BD \mid x = \rho(A) \mid x = A \mid x e − i φ D − 1 B D ∣ x = ρ ( A ) ∣ x = A ∣ x . 这个恒等式连同 ∣ x ∣ > 0 |x| > 0 ∣ x ∣ > 0 和 ∣ e − i φ D − 1 B D ∣ = A |e^{-i\varphi}D^{-1}BD| = A ∣ e − i φ D − 1 B D ∣ = A 的事实蕴涵 e − i φ D − 1 B D = A e^{-i\varphi}D^{-1}BD = A e − i φ D − 1 B D = A . □
练习 对上述证明的最后一部分,给出其证明细节。提示:设 C = e i π D − 1 B D C = e^{i\pi}D^{-1}BD C = e iπ D − 1 B D ,且注意到
A ∣ x ∣ = C ∣ x ∣ = ∣ C ∣ x ∣ ∣ ⩽ ∣ C ∣ ∣ x ∣ = A ∣ x ∣ , A \mid x \mid = C \mid x \mid = | C \mid x \mid | \leqslant | C \mid \mid x \mid = A \mid x \mid , A ∣ x ∣= C ∣ x ∣= ∣ C ∣ x ∣ ∣ ⩽ ∣ C ∣∣ x ∣= A ∣ x ∣ , 因而在三角不等式中等式成立,辐角 arg ( c i j ∣ x j ∣ ) = \arg (c_{ij} | x_j |) = arg ( c ij ∣ x j ∣ ) = 常数, c i j ⩾ 0 c_{ij} \geqslant 0 c ij ⩾ 0 ,且 c i j = a i j c_{ij} = a_{ij} c ij = a ij
当 A > 0 A > 0 A > 0 时,由Perron定理可知, ρ ( A ) \rho(A) ρ ( A ) 是 A A A 的有最大模的唯一特征值。当 A ⩾ 0 A \geqslant 0 A ⩾ 0 时,可能存在多个有极大模的特征值,不过,在这种情形, A A A 应该有特殊的形式,且这些特征值应该位于一个很规则的图形内。
8.4.6 推论 设 A ∈ M n A \in M_{n} A ∈ M n ,假定 A A A 是不可约非负矩阵,又假定具有极大模特征值 ρ ( A ) \rho(A) ρ ( A ) 的集合 S = { λ n = ρ ( A ) , λ n − 1 , … , λ n − k − 1 } S = \{\lambda_{n} = \rho(A), \lambda_{n-1}, \dots, \lambda_{n-k-1}\} S = { λ n = ρ ( A ) , λ n − 1 , … , λ n − k − 1 } 恰好有 k k k 个互不相同的元,则每个特征值 λ i ∈ S \lambda_{i} \in S λ i ∈ S 有代数重数 1,且
S = { e 2 π i p / k ρ ( A ) : p = 0 , 1 , … , k − 1 } , S = \left\{e ^ {2 \pi i p / k} \rho (A): p = 0, 1, \dots , k - 1 \right\}, S = { e 2 πi p / k ρ ( A ) : p = 0 , 1 , … , k − 1 } , 即这些极大模特征值正好是 k k k 个次单位根与 ρ ( A ) \rho(A) ρ ( A ) 的乘积,另外,如果 λ \lambda λ 是 A A A 的任一特征值,则对所有 p = 0 , 1 , … , k − 1 p = 0, 1, \dots, k - 1 p = 0 , 1 , … , k − 1 , e 2 π p / k λ e^{2\pi p / k} \lambda e 2 π p / k λ 是特征值。
证明:对于 S S S 中的每个特征值,记 λ n , p = e i φ p ρ ( A ) \lambda_{n,p} = e^{i\varphi_{p}}\rho(A) λ n , p = e i φ p ρ ( A ) , p = 0 , 1 , … , k − 1 p = 0,1,\dots,k-1 p = 0 , 1 , … , k − 1 ,也就是 φ p = arg ( λ n − p ) \varphi_{p} = \arg (\lambda_{n-p}) φ p = arg ( λ n − p ) 。假定 k > 1 k > 1 k > 1 ,如果有必要,可以重新标记诸特征值,如果还有必要,也可以重新定义辐角使得 0 = φ 0 < φ 1 < φ 2 < ⋯ < φ k < 2 π 0 = \varphi_{0} < \varphi_{1} < \varphi_{2} < \dots < \varphi_{k} < 2\pi 0 = φ 0 < φ 1 < φ 2 < ⋯ < φ k < 2 π 。利用上述定理,且取 B ≡ A B \equiv A B ≡ A 和 λ ≡ λ n − p \lambda \equiv \lambda_{n-p} λ ≡ λ n − p ,得知,对 p = 0 , 1 , … , k − 1 p = 0,1,\dots,k-1 p = 0 , 1 , … , k − 1 有 A = B = e i φ p D p A D p − 1 A = B = e^{i\varphi_{p}}D_{p}AD_{p}^{-1} A = B = e i φ p D p A D p − 1 。因 D p A D p − 1 D_{p}AD_{p}^{-1} D p A D p − 1 相似于 A A A ,所以它与 A A A 有相同的特征值,因此这个恒等式说明,对任意 p = 0 , 1 , … , k − 1 p = 0,1,\dots,k-1 p = 0 , 1 , … , k − 1 ,如果 A A A 的特征值集合在复平面内作角 φ p \varphi_{p} φ p 的旋转,则它仍变到自身;(只要证明 φ p = 2 π p / k \varphi_{p} = 2\pi p / k φ p = 2 π p / k )这就是上述最后一个论断。此外,已知 λ n = ρ ( A ) \lambda_{n} = \rho(A) λ n = ρ ( A ) 是 A A A 的代数单重特征值(因为 A A A 是不可约的),所以依次令 p = 1 , 2 , … , k − 1 p = 1,2,\dots,k-1 p = 1 , 2 , … , k − 1 ,便得出所有 λ n − p \lambda_{n-p} λ n − p 也是代数单重特征值。
不过,还可以说得更详细一些。因为对每个 p = 0 , 1 , … , k − 1 p = 0, 1, \dots, k - 1 p = 0 , 1 , … , k − 1 , S = { λ n , λ n − 1 , … , λ n − k + 1 } = { e i φ p λ n , e i φ p λ n − 1 , … , e i φ p λ n − k + 1 } S = \{\lambda_n, \lambda_{n-1}, \dots, \lambda_{n-k+1}\} = \{e^{i\varphi_p}\lambda_n, e^{i\varphi_p}\lambda_{n-1}, \dots, e^{i\varphi_p}\lambda_{n-k+1}\} S = { λ n , λ n − 1 , … , λ n − k + 1 } = { e i φ p λ n , e i φ p λ n − 1 , … , e i φ p λ n − k + 1 } ,所以一定存在某个 q = q ( p ) q = q(p) q = q ( p ) 使得 ρ ( A ) = λ n = e i φ p λ q \rho(A) = \lambda_n = e^{i\varphi_p}\lambda_q ρ ( A ) = λ n = e i φ p λ q ;即对每个 p p p ,都存在某个 q = q ( p ) q = q(p) q = q ( p ) 使得 φ p = 2 π − φ q \varphi_p = 2\pi - \varphi_q φ p = 2 π − φ q [即 φ p = − φ q ( m o d 2 π ) \varphi_p = -\varphi_q(\bmod 2\pi) φ p = − φ q ( mod 2 π ) ],因而, e i φ p ρ ( A ) ∈ S e^{i\varphi_p}\rho(A) \in S e i φ p ρ ( A ) ∈ S 。另外,如果重复定理(8.4.5)给出的关于 A A A 的表示式,并且对于任意选定的适合 0 ⩽ r , m ⩽ k − 1 0 \leqslant r, m \leqslant k-1 0 ⩽ r , m ⩽ k − 1 的 r , m r, m r , m ,取 B = e i φ r D r A D r − 1 B = e^{i\varphi_r}D_rAD_r^{-1} B = e i φ r D r A D r − 1 和 λ = λ m = e i φ m ρ ( A ) \lambda = \lambda_m = e^{i\varphi_m}\rho(A) λ = λ m = e i φ m ρ ( A ) ,则得出
A = e i φ r D r { e i φ m D m A D m − 1 } D r − 1 = e ( φ m + φ r ) D r D m A ( D r D m ) − 1 . A = e ^ {i \varphi_ {r}} D _ {r} \left\{e ^ {i \varphi_ {m}} D _ {m} A D _ {m} ^ {- 1} \right\} D _ {r} ^ {- 1} = e ^ {\left(\varphi_ {m} + \varphi_ {r}\right)} D _ {r} D _ {m} A \left(D _ {r} D _ {m}\right) ^ {- 1}. A = e i φ r D r { e i φ m D m A D m − 1 } D r − 1 = e ( φ m + φ r ) D r D m A ( D r D m ) − 1 . 因此,根据上述相同的论证,在复平面内, A A A 的特征值集合经 φ m + φ r \varphi_{m} + \varphi_{r} φ m + φ r 的旋转变到自身。特别是, λ n e t ( φ m + φ r ) = e t ( φ m + φ r ) ρ ( A ) \lambda_{n}e^{t(\varphi_{m} + \varphi_{r})} = e^{t(\varphi_{m} + \varphi_{r})}\rho (A) λ n e t ( φ m + φ r ) = e t ( φ m + φ r ) ρ ( A ) 一定是 A A A 的(具有极大模的)特征值,所以对某个 j = j ( m , r ) j = j(m,r) j = j ( m , r ) ,一定有 φ m + φ r = φ j ( m o d 2 π ) \varphi_{m} + \varphi_{r} = \varphi_{j} (\bmod 2\pi) φ m + φ r = φ j ( mod 2 π )
考虑集合 G = { φ 0 = 0 , φ 1 , … , φ n − k + 1 } ⊂ [ 0 , 2 π ) G = \{\varphi_0 = 0, \varphi_1, \dots, \varphi_{n - k + 1}\} \subset [0, 2\pi) G = { φ 0 = 0 , φ 1 , … , φ n − k + 1 } ⊂ [ 0 , 2 π ) 。上一段已提供了以下信息:(a) 0 ∈ G 0 \in G 0 ∈ G ;(b)如果 φ i , φ j ∈ G \varphi_i, \varphi_j \in G φ i , φ j ∈ G ,则 φ i + φ j ( m o d 2 π ) ∈ G \varphi_i + \varphi_j (\bmod 2\pi) \in G φ i + φ j ( mod 2 π ) ∈ G ;(c)如果 φ i ∈ G \varphi_i \in G φ i ∈ G ,则 φ i ( m o d 2 π ) ∈ G \varphi_i (\bmod 2\pi) \in G φ i ( mod 2 π ) ∈ G 。另外显然有,(d)如果 φ i , φ j ∈ G \varphi_i, \varphi_j \in G φ i , φ j ∈ G ,则 φ i + φ j = φ i + φ i ( m o d 2 π ) \varphi_i + \varphi_j = \varphi_i + \varphi_i (\bmod 2\pi) φ i + φ j = φ i + φ i ( mod 2 π ) 。因此, G G G 是恰好有 k k k 个元素的 Abel 群;群的运算是“关于模为 2 π 2\pi 2 π 的加法”。因为有限 Abel 群任一元素的阶一定整除群的阶,所以每个 e φ m e^{\varphi_m} e φ m 一定是 p p p 次单位根,其中 p = p ( m ) p = p(m) p = p ( m ) 是 k k k 的因子。另外,我们可以不用群的理论直接证明这一事实。
因为对某个 j j j 以及每个 r r r 和 m m m 有 φ m + φ r = φ j ( m o d 2 π ) \varphi_{m} + \varphi_{r} = \varphi_{j} (\bmod 2\pi) φ m + φ r = φ j ( mod 2 π ) ,用归纳法可得出,(令 r = m = 1 r = m = 1 r = m = 1 )对所有 r = 0 , 1 , 2 , … ( m o d 2 π ) r = 0, 1, 2, \dots (\bmod 2\pi) r = 0 , 1 , 2 , … ( mod 2 π ) 有 r φ 1 ∈ G r\varphi_{1} \in G r φ 1 ∈ G ;即对所有 r = 0 , 1 , 2 , … r = 0, 1, 2, \dots r = 0 , 1 , 2 , … 有 e r φ 1 ρ ( A ) ∈ S e^{r\varphi_{1}}\rho(A) \in S e r φ 1 ρ ( A ) ∈ S 。但是,假如 e i φ 1 e^{i\varphi_{1}} e i φ 1 不是单位根,这便蕴涵 S S S 有无限多个不同的元素,而这是不可能的。因此,对某个适合 1 < p ⩽ k 1 < p \leqslant k 1 < p ⩽ k 的 p p p , e i p φ 1 = 1 e^{i p\varphi_{1}} = 1 e i p φ 1 = 1 ;可假定 p p p 是使这个式子成立的最小整数。我们知道, 0 < φ 1 < φ 2 < ⋯ < φ n − k + 1 < 2 π 0 < \varphi_{1} < \varphi_{2} < \dots < \varphi_{n - k + 1} < 2\pi 0 < φ 1 < φ 2 < ⋯ < φ n − k + 1 < 2 π ,且对某个固定指数 m m m 考虑 φ m \varphi_{m} φ m ,恰好可用 p + 1 p + 1 p + 1 个点 0 , φ 1 , 2 φ 1 , … , ( p − 1 ) φ 1 0, \varphi_{1}, 2\varphi_{1}, \dots, (p - 1)\varphi_{1} 0 , φ 1 , 2 φ 1 , … , ( p − 1 ) φ 1 , p φ 1 = 2 π p\varphi_{1} = 2\pi p φ 1 = 2 π 将区间 [ 0 , 2 π ) [0, 2\pi) [ 0 , 2 π ) 分成 p p p 个半开子区间(在右边开);点 φ m \varphi_{m} φ m 一定落在这些子区间的一个中。于是,存在某个适合 0 ⩽ q ⩽ p − 1 0 \leqslant q \leqslant p - 1 0 ⩽ q ⩽ p − 1 的 q q q 使得 q φ 1 ⩽ φ m < ( q + 1 ) φ 1 q\varphi_{1} \leqslant \varphi_{m} < (q + 1)\varphi_{1} q φ 1 ⩽ φ m < ( q + 1 ) φ 1 ;即 0 ⩽ φ m − q φ 1 < φ 1 0 \leqslant \varphi_{m} - q\varphi_{1} < \varphi_{1} 0 ⩽ φ m − q φ 1 < φ 1 。因此,对某个 j − j ( m ) j - j(m) j − j ( m ) ,一定有 φ m − q φ 1 = φ j \varphi_{m} - q\varphi_{1} = \varphi_{j} φ m − q φ 1 = φ j ,这是因为已经证明,如果 e i φ 1 ρ ( A ) e^{i\varphi_{1}}\rho(A) e i φ 1 ρ ( A ) 是特征值,则 e − i φ 1 ρ ( A ) e^{-i\varphi_{1}}\rho(A) e − i φ 1 ρ ( A ) 和 e − i φ 1 ρ ( A ) e^{-i\varphi_{1}}\rho(A) e − i φ 1 ρ ( A ) 也是特征值。另一方面, 0 ⩽ φ m − q φ 1 = φ j < φ 1 0 \leqslant \varphi_{m} - q\varphi_{1} = \varphi_{j} < \varphi_{1} 0 ⩽ φ m − q φ 1 = φ j < φ 1 ,且选定 φ 1 \varphi_{1} φ 1 是最小非零辐角,因而一定有 φ m − q φ 1 = 0 \varphi_{m} - q\varphi_{1} = 0 φ m − q φ 1 = 0 。这就说明每个辐角 φ j \varphi_{j} φ j 是 φ 1 \varphi_{1} φ 1 的某个倍数,所以必定是 p = k p = k p = k ;即 φ 1 = 2 π / k \varphi_{1} = 2\pi / k φ 1 = 2 π / k ,因为假如 p < k p < k p < k ,则在集合 { e i φ 1 ρ ( A ) , e 2 i φ 1 ρ ( A ) , e 3 i φ 1 ρ ( A ) , … } \{e^{i\varphi_{1}}\rho(A), e^{2i\varphi_{1}}\rho(A), e^{3i\varphi_{1}}\rho(A), \dots\} { e i φ 1 ρ ( A ) , e 2 i φ 1 ρ ( A ) , e 3 i φ 1 ρ ( A ) , … } 中的不同的元素会少于 k k k
510
个,然而这个集合一定等于整个S. 最后,因为每个 φ m \varphi_{m} φ m 是 φ 1 = 2 π / k \varphi_{1} = 2\pi /k φ 1 = 2 π / k 的某个倍数,又因为存在 k k k 个不同的 φ i \varphi_{i} φ i 项和 k k k 个 φ 1 \varphi_{1} φ 1 的不同倍数,所以对所有 m = 0 , 1 , 2 , … , k − 1 m = 0,1,2,\dots ,k - 1 m = 0 , 1 , 2 , … , k − 1 一定有 φ m = m φ 1 \varphi_{m} = m\varphi_{1} φ m = m φ 1
整个证明是在 k > 1 k > 1 k > 1 的假定下进行的,但是,如果 k = 1 k = 1 k = 1 ,所作的论断是显然的.
8.4.7 附注 如果 A ⩾ 0 A \geqslant 0 A ⩾ 0 是不可约的,且有 k > 1 k > 1 k > 1 个极大模特征值,则 A A A 的每个非零特征值位于中心在 C \mathbf{C} C 中的 0 的一个圆上,这个圆恰好经过 A A A 的 k k k 个特征值,且使它们在整个圆上都保持相同的间隔。特别是, k k k 必须是 A A A 的非零特征值的个数的因子。因此,如果 A A A 是 n × n n \times n n × n 非奇异不可约非负矩阵,且 n n n 是素数,则一定存在一个或 n n n 个极大模特征值;不会有其他可能性。 8.4.8 推论 假定 A ∈ M n A \in M_{n} A ∈ M n 是不可约非负矩阵,且记 A m ≡ [ a i j ( m ) ] A^{m} \equiv \left[a_{ij}^{(m)}\right] A m ≡ [ a ij ( m ) ] , m = 1 , 2 , ⋯ m = 1, 2, \cdots m = 1 , 2 , ⋯ 。如果正好存在 A A A 的 k > 1 k > 1 k > 1 个具有极大模的特征值,则当 m m m 不是 k k k 的整数倍时, a i j ( m ) ≡ 0 a_{ij}^{(m)} \equiv 0 a ij ( m ) ≡ 0 对所有 i = 1 , 2 , ⋯ , n i = 1, 2, \cdots, n i = 1 , 2 , ⋯ , n 成立。特别是所有 a n = 0 a_{n} = 0 a n = 0 。
证明:利用推论(8.4.6)选取 A A A 的一个极大模特征值 λ = e i φ ρ ( A ) \lambda = e^{i\varphi}\rho(A) λ = e i φ ρ ( A ) ,其中 φ = 2 π / k \varphi = 2\pi / k φ = 2 π / k 。于是,只要 m m m 不是 k k k 的整数倍, e m φ e^{m\varphi} e m φ 就不是正实数。利用定理(8.4.5),且取 B − A B - A B − A 和 λ = e i φ ρ ( A ) \lambda = e^{i\varphi}\rho(A) λ = e i φ ρ ( A ) ,得出 A = e i φ D A D − 1 A = e^{i\varphi}DAD^{-1} A = e i φ D A D − 1 ,所以对于所有 i = 1 , ⋯ , n i = 1, \cdots, n i = 1 , ⋯ , n 和 m = 1 , 2 , 3 , ⋯ m = 1, 2, 3, \cdots m = 1 , 2 , 3 , ⋯ ,有 A m = e m φ D A m D − 1 A^m = e^{m\varphi}DA^m D^{-1} A m = e m φ D A m D − 1 和 a n ( m ) = e i n φ a n ( m ) a_n^{(m)} = e^{in\varphi}a_n^{(m)} a n ( m ) = e in φ a n ( m ) 。如果 e i n φ e^{in\varphi} e in φ 不是正实数,又如果 a n ( m ) > 0 a_n^{(m)} > 0 a n ( m ) > 0 ,则这个等式不可能成立,因此,当 m m m 不是 k k k 的倍数时,对所有 i = 1 , ⋯ , n i = 1, \cdots, n i = 1 , ⋯ , n ,一定有 a n ( m ) ≡ 0 a_n^{(m)} \equiv 0 a n ( m ) ≡ 0 □
练习 假定 A ∈ M n A \in M_{n} A ∈ M n 是不可约非负矩阵。证明,为了保证 ρ ( A ) \rho(A) ρ ( A ) 是 A A A 的唯一极大模特值,其充分条件是某个 a n ≠ 0 a_{n} \neq 0 a n = 0 。但是,考察矩阵
[ 0 1 1 1 0 1 1 1 0 ] \left[ \begin{array}{c c c} 0 & 1 & 1 \\ 1 & 0 & 1 \\ 1 & 1 & 0 \end{array} \right] 0 1 1 1 0 1 1 1 0 并说明这个条件不是必要的,你能找一个 2 × 2 2 \times 2 2 × 2 矩阵的反例吗?
8.4.9 附注 比推论(8.4.8)更强的结论仍成立:如果 A ⩾ 0 A \geqslant 0 A ⩾ 0 是不可约矩阵,且有 k > 1 k > 1 k > 1 个具有极大模的特征值,则存在置换矩阵 P P P 使得
P A P T = [ 0 A 12 0 ⋮ 0 ⋱ 0 ⋱ A k − 1 , k A k , 1 0 … 0 ] P A P ^ {T} = \left[ \begin{array}{c c c c} 0 & A _ {1 2} & & 0 \\ \vdots & 0 & \ddots & \\ 0 & & \ddots & A _ {k - 1, k} \\ A _ {k, 1} & 0 & \dots & 0 \end{array} \right] P A P T = 0 ⋮ 0 A k , 1 A 12 0 0 ⋱ ⋱ … 0 A k − 1 , k 0 其中, k k k 个主对角零子块是方阵而所列出的诸子块 A i j A_{ij} A ij 不一定是零矩阵。特别地,所有主对角元 a n a_{n} a n 必须是零[Var,p.28]。
为了得到在推论(8.4.6)中所描述的极大模特征值的规则图形,尽管不可约性假设是本质的,但是在一般情形下不仍然可以得到某些信息。
8.4.10 推论 如果 A ∈ M n , A ⩾ 0 , ρ ( A ) > 0 A \in M_n, A \geqslant 0, \rho(A) > 0 A ∈ M n , A ⩾ 0 , ρ ( A ) > 0 ,如果 λ \lambda λ 是 A A A 的适合 ∣ λ ∣ = ρ ( A ) |\lambda| = \rho(A) ∣ λ ∣ = ρ ( A ) 的特征值,则 λ / ρ ( A ) = e i φ \lambda / \rho(A) = e^{i\varphi} λ / ρ ( A ) = e i φ 是单位根,对某个适合 1 ⩽ k ⩽ n 1 \leqslant k \leqslant n 1 ⩽ k ⩽ n 的 k k k 有 e i φ = 1 e^{i\varphi} = 1 e i φ = 1 ,且对所有 p = 0 , 1 , 2 , … , k − 1 , e i φ ρ ( A ) p = 0, 1, 2, \dots, k-1, e^{i\varphi} \rho(A) p = 0 , 1 , 2 , … , k − 1 , e i φ ρ ( A ) 都是 A A A 的特征值。
证明:如果 A A A 是不可约的,则论断可由推论(8.4.6)推出。如果 A A A 可约,则 A A A 可经置换相似变成分块上三角形式
[ A 1 ∗ A 2 ⋱ 0 A r ] \left[ \begin{array}{c c c c} A _ {1} & & & * \\ & A _ {2} & & \\ & & \ddots & \\ 0 & & & A _ {r} \end{array} \right] A 1 0 A 2 ⋱ ∗ A r 其中 A j A_{j} A j 是不可约方阵或零方阵. A A A 的特征值是各对角子块矩阵 A 1 , … , A r A_{1},\dots ,A_{r} A 1 , … , A r 的特征值的并,且每个 A j A_{j} A j 的极大模特征值集合的结构由推论(8.4.8)给出. □
练习设
A 1 = [ 0 1 1 0 ] 和 A 2 = [ 0 1 0 0 0 1 1 0 0 ] , A _ {1} = \left[ \begin{array}{l l} {0} & {1} \\ {1} & {0} \end{array} \right] \quad \text {和} \quad A _ {2} = \left[ \begin{array}{l l l} {0} & {1} & {0} \\ {0} & {0} & {1} \\ {1} & {0} & {0} \end{array} \right], A 1 = [ 0 1 1 0 ] 和 A 2 = 0 0 1 1 0 0 0 1 0 , 通过考察
A = [ A 1 ∗ 0 A 2 ] ∈ M 3 A = \left[ \begin{array}{c c} A _ {1} & * \\ 0 & A _ {2} \end{array} \right] \in M _ {3} A = [ A 1 0 ∗ A 2 ] ∈ M 3 来说明,对于一般的非负矩阵 A A A , A A A 的极大模特征值可能比 ρ ( A ) \rho (A) ρ ( A ) 以及 ρ ( A ) \rho (A) ρ ( A ) 经过一个单位根的各次幂的旋转所得到的集合要多.
习题 用例子说明,未列入到定理(8.4.4)中的Perron定理(8.2.11)中的各项命题对不可约非负矩阵一般不成立。
用例子说明, ρ ( I + A ) = 1 + ρ ( A ) \rho(I + A) = 1 + \rho(A) ρ ( I + A ) = 1 + ρ ( A ) 对所有 A ∈ M n A \in M_{n} A ∈ M n 不成立。试给出使这恒等式成立的关于 A A A 的必要充分条件。
不可约性是非负矩阵有正特征向量的充分条件而不是必要条件。试考察 [ 1 1 0 0 ] \left[ \begin{array}{ll}1 & 1\\ 0 & 0 \end{array} \right] [ 1 0 1 0 ] 和 [ 1 0 1 0 ] \left[ \begin{array}{ll}1 & 0\\ 1 & 0 \end{array} \right] [ 1 1 0 0 ] ,说明可约非负矩阵可能有或可能没有正特征向量。
如果 A ⩾ 0 A \geqslant 0 A ⩾ 0 是不可约的,证明,当 m → ∞ m \to \infty m → ∞ 时,矩阵 [ ρ ( A ) − 1 A ] m [\rho(A)^{-1}A]^m [ ρ ( A ) − 1 A ] m 的各元一致有界。
我们已经证明,不可约矩阵有正 Perron 向量。假定 A ⩾ 0 A \geqslant 0 A ⩾ 0 , ρ ( A ) > 0 \rho(A) > 0 ρ ( A ) > 0 , x ⩾ 0 x \geqslant 0 x ⩾ 0 , x ≠ 0 x \neq 0 x = 0 且 A x = ρ ( A ) x Ax = \rho(A)x A x = ρ ( A ) x ;证明,如果 x x x 不是正的,则 A A A 是可约的。如果 x x x 是正的, A A A 就一定不可约吗?
假定 A ⩾ 0 A \geqslant 0 A ⩾ 0 是不可约的,且 B ⩾ 0 B \geqslant 0 B ⩾ 0 与 A A A 可交换。如果 x x x 是 A A A 的 Perron 向量,证明 B x = ρ ( B ) x Bx = \rho(B)x B x = ρ ( B ) x 。提示:定理(8.4.4d)。
说明多项式 x k − 1 = 0 x^{k} - 1 = 0 x k − 1 = 0 的友矩阵是 k × k k \times k k × k 非负矩阵有 k k k 个极大模特征值的例子。验证这些特征值在复平面中的位置。
设 k 1 , k 2 , k p k_{1}, k_{2}, k_{p} k 1 , k 2 , k p 是给定的正整数,说明如何构造一个非负矩阵使得它的极大模特征值正好是 k 1 k_{1} k 1 个 k 1 k_{1} k 1 次单位根, k 2 k_{2} k 2 个 k 2 k_{2} k 2 次单位根,…,以及 k p k_{p} k p 个 k p k_{p} k p 次单位根。
如果不可约非负矩阵 A A A 有 k ⩾ 1 k \geqslant 1 k ⩾ 1 个极大模特征值,说明为什么称 A A A 为指标 k k k 的循环。
如果 A ⩾ 0 A \geqslant 0 A ⩾ 0 是不可约矩阵,并且还是指标 k ⩾ 1 k \geqslant 1 k ⩾ 1 的循环,证明特征多项式 p A ( t ) = t r ( t k − ρ ( A ) k ) ( t k − μ 2 k ) ⋯ ( t k − μ m k ) p_A(t) = t^r (t^k - \rho(A)^k)(t^k - \mu_2^k) \cdots (t^k - \mu_m^k) p A ( t ) = t r ( t k − ρ ( A ) k ) ( t k − μ 2 k ) ⋯ ( t k − μ m k ) ,其中, r , m ⩾ 0 r, m \geqslant 0 r , m ⩾ 0 为某个整数, μ i \mu_i μ i 是适合 ∣ μ i ∣ < ρ ( A ) |\mu_i| < \rho(A) ∣ μ i ∣ < ρ ( A ) 的某些复数, i = 2 , … , m i = 2, \dots, m i = 2 , … , m 。对 p A ( t ) p_A(t) p A ( t ) 中零和非零系数的型式作出说明,并且基于特征多项式的形式给出 A A A 只有一个极大模特征值的准则。提示:在推论(8.4.6)的证明中已知,如果 φ = 2 π / k \varphi = 2\pi / k φ = 2 π / k
513
且 λ \lambda λ 是 A A A 的特征值,则 e α γ λ e^{\alpha \gamma} \lambda e α γ λ 亦是 A A A 的特征值, r = 0 , 1 , 2 , … r = 0, 1, 2, \dots r = 0 , 1 , 2 , … . 11. 设 n > 1 n > 1 n > 1 是素数。证明,如果 A ∈ M n A \in M_{n} A ∈ M n 是非负的,不可约的和非奇异的,则或者 ρ ( A ) \rho(A) ρ ( A ) 是 A A A 的有极大模的唯一特征值,或者 A A A 的所有特征值有极大模。 12. 考察 A = [ 0 1 1 0 ] A = \begin{bmatrix} 0 & 1 \\ 1 & 0 \end{bmatrix} A = [ 0 1 1 0 ] ,说明一般不可能改进推论(8.4.8)而断言, A A A 的所有幂的主对角元一定都是零。 13. 如果 A ⩾ 0 A \geqslant 0 A ⩾ 0 ,证明, A A A 的不可约性只与其零元的位置有系,而与非零元的大小无关。 14. 如果 A , B ∈ M n A, B \in M_{n} A , B ∈ M n , 则 A B AB A B 与 B A BA B A 有相同的特征值. 考察 [ 0 1 0 1 ] \left[ \begin{array}{cc}0 & 1 \\ 0 & 1\end{array} \right] [ 0 0 1 1 ] 和 [ 0 0 1 1 ] \left[ \begin{array}{cc}0 & 0 \\ 1 & 1\end{array} \right] [ 0 1 0 1 ] , 说明, 即使 A A A 和 B B B 是非负矩阵, 有可能 A B AB A B 不可约而 B A BA B A 可约. 这种例子说明不可约矩阵可能相似 (甚至酉等价) 于可约矩阵; 解释这是为什么. 同时它说明, 仅仅涉及矩阵的特征值的任何条件不能最终验证其不可约性. 15. 设 A ∈ M n A \in M_{n} A ∈ M n 是给定的不可约非负矩阵。证明,只要 B ∈ M n B \in M_{n} B ∈ M n 非负, A + B A + B A + B 就不可约,并且只要 B ≥ 0 B \geq 0 B ≥ 0 和 B ≠ 0 B \neq 0 B = 0 ,就有 ρ ( A + B ) > ρ ( A ) \rho(A + B) > \rho(A) ρ ( A + B ) > ρ ( A ) 。这是(8.1.18)到严格单调性的改进,不过需附加不可约性假定。提示:(8.1.18)说明 ρ ( A + B ) ⩾ ρ ( A ) \rho(A + B) \geqslant \rho(A) ρ ( A + B ) ⩾ ρ ( A ) ,如果等式成立,利用(8.4.5)证明 B = 0 B = 0 B = 0 。 16. 证明可以用下述方式强化(8.4.1). 设 A ∈ M n A \in M_{n} A ∈ M n 是非负的, 且设 A A A 的极小多项式有次数 m m m . 证明, A A A 不可约, 当且仅当 ( I + A ) m − 1 > 0 (I + A)^{m-1} > 0 ( I + A ) m − 1 > 0 . 提示: 考虑 I + A + A n + ⋯ + A m − 1 + A m + ⋯ + A n − 1 I + A + A^{n} + \cdots + A^{m-1} + A^{m} + \cdots + A^{n-1} I + A + A n + ⋯ + A m − 1 + A m + ⋯ + A n − 1 , 然后用 I , A , ⋯ , A m − 1 I, A, \cdots, A^{m-1} I , A , ⋯ , A m − 1 表示 A m A^{m} A m 和更高次幂. 17. 设 A ∈ M n A \in M_{n} A ∈ M n 是给定的非负矩阵,考虑在最小二乘意义下求 A A A 的秩 1 最佳逼近问题;即求秩 1 X ∈ M n 1X \in M_{n} 1 X ∈ M n 使 ∥ A − X ∥ 2 = min { ∥ A − Y ∥ 2 : Y ∈ M n \| A - X \|_{2} = \min \{\| A - Y \|_{2}: Y \in M_{n} ∥ A − X ∥ 2 = min { ∥ A − Y ∥ 2 : Y ∈ M n 有秩 1}. 假定 A A T AA^{T} A A T 的 Perron 根是单根,如果 A A T AA^{T} A A T 或 A T A A^{T}A A T A 不可约,情况就是这样。为什么?证明这样的最佳 X X X 是非负的,唯一的且由 X = r w T X = \sqrt{r} w^{T} X = r w T 给出,其中 r = ρ ( A A T ) r = \rho(AA^{T}) r = ρ ( A A T ) 是 A A A 的 Perron 根,而 v , w ∈ R n v, w \in \mathbb{R}^{n} v , w ∈ R n 是非负单位向量,它们分别是 A A T AA^{T} A A T 和 A T A A^{T}A A T A 相应于特征值 r r r 的单位特征向量。提示:利用(7.4.1)中给出的秩 1 最佳逼近的特征。注意 A A T AA^{T} A A T 和 A T A A^{T}A A T A 都是实对称半正定矩阵,所以 r , v r, v r , v 和 w w w 的计算原则上是不太困难的。
试用习题17求每个矩阵
A = [ 1 1 1 1 ] , [ 1 1 0 1 ] , [ 0 0 1 1 ] A = \left[ \begin{array}{l l} 1 & 1 \\ 1 & 1 \end{array} \right], \quad \left[ \begin{array}{l l} 1 & 1 \\ 0 & 1 \end{array} \right], \quad \left[ \begin{array}{l l} 0 & 0 \\ 1 & 1 \end{array} \right] A = [ 1 1 1 1 ] , [ 1 0 1 1 ] , [ 0 1 0 1 ] 的秩1最佳二乘逼近。证明, A = I ∈ M n A = I \in M_n A = I ∈ M n 的秩1最佳二乘逼近不唯一;对于任何单位向量 v ∈ C n v \in \mathbf{C}^n v ∈ C n , X = v v ∗ X = vv^* X = v v ∗ 是 I I I 的秩1最佳二乘逼近。