8.3 非负矩阵 因为在实际中常常遇到不是正矩阵的非负矩阵,为此,需要考虑把上一节中所论述的理论推广到矩阵的元素不都是严格正的情形。我们可能希望,这种推广可通过取适当的极限来完成,这对于某些结果是可以办到的。但是,令人失望的是,像秩与维数这样一些量不是连续函数,所以极限论证只是部分有效。在 Perron 定理中可以通过取极限作推广的仅有结果包括在下面的定理中。
8.3.1 定理 如果 A ∈ M n A \in M_n A ∈ M n ,且 A ⩾ 0 A \geqslant 0 A ⩾ 0 ,则 ρ ( A ) \rho(A) ρ ( A ) 是 A A A 的特征值,且存在非负向量 x ⩾ 0 , x ≠ 0 x \geqslant 0, x \neq 0 x ⩾ 0 , x = 0 ,使得 A x = ρ ( A ) x Ax = \rho(A)x A x = ρ ( A ) x .
证明:对任意 ε > 0 \varepsilon > 0 ε > 0 ,定义 A ( ε ) = [ a i j + ε ] > 0 A(\varepsilon) = [a_{ij} + \varepsilon] > 0 A ( ε ) = [ a ij + ε ] > 0 。用 x ( ε ) x(\varepsilon) x ( ε ) 表示 A ( ε ) A(\varepsilon) A ( ε ) 的 Perron 向量,所以 x ( ε ) > 0 x(\varepsilon) > 0 x ( ε ) > 0 且 ∑ i = 1 n x ( ε i ) = 1 \sum_{i=1}^{n} x(\varepsilon_i) = 1 ∑ i = 1 n x ( ε i ) = 1 。因为向量集 { x ( ε ) : ε > 0 } \{x(\varepsilon): \varepsilon > 0\} { x ( ε ) : ε > 0 } 包含在紧集 { x : x ∈ C n , ∥ x ∥ 1 ⩽ 1 } \{x: x \in \mathbb{C}^n, \|x\|_1 \leqslant 1\} { x : x ∈ C n , ∥ x ∥ 1 ⩽ 1 } 中,所以存在单调递减序列 ε 1 , ε 2 , ⋯ \varepsilon_1, \varepsilon_2, \cdots ε 1 , ε 2 , ⋯ 且 lim k → ∞ ε k = 0 \lim_{k \to \infty} \varepsilon_k = 0 lim k → ∞ ε k = 0 ,使得 lim k → ∞ x ( ε k ) = x \lim_{k \to \infty} x(\varepsilon_k) = x lim k → ∞ x ( ε k ) = x 存在。因为对所有 k = 1 , 2 , ⋯ k = 1, 2, \cdots k = 1 , 2 , ⋯ 有 x ( ε k ) > 0 x(\varepsilon_k) > 0 x ( ε k ) > 0 ,所以一定有 x = lim k → ∞ x ( ε k ) ⩾ 0 x = \lim_{k \to \infty} x(\varepsilon_k) \geqslant 0 x = lim k → ∞ x ( ε k ) ⩾ 0 ;又
∑ i = 1 n x i − lim k → ∞ ∑ i = 1 n x ( ε k ) i = 1 \sum_ {i = 1} ^ {n} x _ {i} - \lim _ {k \rightarrow \infty} \sum_ {i = 1} ^ {n} x \left(\varepsilon_ {k}\right) _ {i} = 1 i = 1 ∑ n x i − k → ∞ lim i = 1 ∑ n x ( ε k ) i = 1 所以 x = 0 x = 0 x = 0 是不可能的。根据定理(8.1.18), ρ ( A ( ε k ) ) ⩾ ρ ( A ( ε k − 1 ) ) ⩾ ⋯ ⩾ ρ ( A ) \rho(A(\varepsilon_k)) \geqslant \rho(A(\varepsilon_{k-1})) \geqslant \dots \geqslant \rho(A) ρ ( A ( ε k )) ⩾ ρ ( A ( ε k − 1 )) ⩾ ⋯ ⩾ ρ ( A ) 对所有 k = 1 , 2 , ⋯ k = 1, 2, \cdots k = 1 , 2 , ⋯ 成立,所以实数序列 { ρ ( A ( ε k ) ) } k = 1 , 2 , ⋯ \{\rho(A(\varepsilon_k))\}_{k=1,2,\cdots} { ρ ( A ( ε k )) } k = 1 , 2 , ⋯ 是单调递减序列。因此, ρ ≡ lim k → ∞ ρ ( A ( ε k ) ) \rho \equiv \lim_{k \to \infty} \rho(A(\varepsilon_k)) ρ ≡ lim k → ∞ ρ ( A ( ε k )) 存在且 ρ ⩾ ρ ( A ) \rho \geqslant \rho(A) ρ ⩾ ρ ( A ) 。但是由事实
A x = lim k → ∞ A ( ε k ) x ( ε k ) = lim k → ∞ ρ ( A ( ε k ) ) x ( ε k ) A x = \lim _ {k \rightarrow \infty} A (\varepsilon_ {k}) x (\varepsilon_ {k}) = \lim _ {k \rightarrow \infty} \rho (A (\varepsilon_ {k})) x (\varepsilon_ {k}) A x = k → ∞ lim A ( ε k ) x ( ε k ) = k → ∞ lim ρ ( A ( ε k )) x ( ε k ) = lim k ρ ( A ( ε k ) ) lim k x ( ε k ) = ρ x = \lim _ {k} \rho (A (\varepsilon_ {k})) \lim _ {k} x (\varepsilon_ {k}) = \rho x = k lim ρ ( A ( ε k )) k lim x ( ε k ) = ρ x 和事实 x ≠ 0 x \neq 0 x = 0 ,推出 ρ \rho ρ 是 A A A 的特征值.另一方面, ρ ⩽ ρ ( A ) \rho \leqslant \rho(A) ρ ⩽ ρ ( A ) 因此一定有 ρ = ρ ( A ) \rho = \rho(A) ρ = ρ ( A )
关于谱半径的变分特征部分(8.1.31)可以推广到一般非负矩阵和非负向量,不过其证明是颇不相同的。
8.3.2 定理 设 A ∈ M n A \in M_{n} A ∈ M n , A ⩾ 0 A \geqslant 0 A ⩾ 0 , x ∈ C n x \in \mathbf{C}^{n} x ∈ C n , x ⩾ 0 x \geqslant 0 x ⩾ 0 且 x ≠ 0 x \neq 0 x = 0 . 如果对某个 α ∈ R \alpha \in \mathbb{R} α ∈ R , A x ⩾ α x Ax \geqslant \alpha x A x ⩾ αx , 则 ρ ( A ) ⩾ α \rho(A) \geqslant \alpha ρ ( A ) ⩾ α .
证明:设 A = [ a i j ] A = [a_{ij}] A = [ a ij ] ,设 ε > 0 \varepsilon > 0 ε > 0 ,且定义 A ( ε ) ≡ [ a i j + ε ] A(\varepsilon) \equiv [a_{ij} + \varepsilon] A ( ε ) ≡ [ a ij + ε ] 。于是 A ( ε ) > 0 A(\varepsilon) > 0 A ( ε ) > 0 ,所以有正的左Perron向量 y ( ε ) y(\varepsilon) y ( ε ) ;即 y ( ε ) T A ( ε ) = ρ ( A ( ε ) ) y ( ε ) T y(\varepsilon)^T A(\varepsilon) = \rho(A(\varepsilon)) y(\varepsilon)^T y ( ε ) T A ( ε ) = ρ ( A ( ε )) y ( ε ) T 。已知 A x − α x ⩾ 0 Ax - \alpha x \geqslant 0 A x − αx ⩾ 0 ,所以 A ( ε ) x − α x > A x − α x ⩾ 0 A(\varepsilon)x - \alpha x > Ax - \alpha x \geqslant 0 A ( ε ) x − αx > A x − αx ⩾ 0 ,因而 y ( ε ) T [ A ( ε ) x − α x ] = [ ρ ( A ( ε ) ) − α ] y ( ε ) T x ⩾ 0 y(\varepsilon)^T [A(\varepsilon)x - \alpha x] = [\rho(A(\varepsilon)) - \alpha] y(\varepsilon)^T x \geqslant 0 y ( ε ) T [ A ( ε ) x − αx ] = [ ρ ( A ( ε )) − α ] y ( ε ) T x ⩾ 0 。因为 y ( ε ) T x > 0 y(\varepsilon)^T x > 0 y ( ε ) T x > 0 ,对所有 ε > 0 \varepsilon > 0 ε > 0 ,有 ρ ( A ( ε ) ) − α ⩾ 0 \rho(A(\varepsilon)) - \alpha \geqslant 0 ρ ( A ( ε )) − α ⩾ 0 。但当 ε → 0 \varepsilon \to 0 ε → 0 时 ρ ( A ( ε ) ) → ρ ( A ) \rho(A(\varepsilon)) \to \rho(A) ρ ( A ( ε )) → ρ ( A ) ,所以 ρ ( A ) ⩾ α \rho(A) \geqslant \alpha ρ ( A ) ⩾ α 。
8.3.3 推论 如果 A ∈ M n A \in M_{n} A ∈ M n ,且 A ⩾ 0 A \geqslant 0 A ⩾ 0 ,则
ρ ( A ) = max x ≥ 0 x ≠ 0 min 1 ≤ i ≤ n r i ≠ 0 1 x i ∑ j = 1 n a i j x j . \rho (A) = \max _ {\substack {x \geq 0 \\ x \neq 0}} \min _ {\substack {1 \leq i \leq n \\ r _ {i} \neq 0}} \frac {1}{x _ {i}} \sum_ {j = 1} ^ {n} a _ {i j} x _ {j}. ρ ( A ) = x ≥ 0 x = 0 max 1 ≤ i ≤ n r i = 0 min x i 1 j = 1 ∑ n a ij x j . 证明:如果 A ⩾ 0 A \geqslant 0 A ⩾ 0 , x ⩾ 0 x \geqslant 0 x ⩾ 0 ,且 x ≠ 0 x \neq 0 x = 0 ,又如果选取
α ≡ min x i ≠ 0 ∑ 1 , … , i n a i j x j x i , \alpha \equiv \min _ {x _ {i} \neq 0} \sum_ {1, \dots , i} ^ {n} \frac {a _ {i j} x _ {j}}{x _ {i}}, α ≡ x i = 0 min 1 , … , i ∑ n x i a ij x j , 则根据定理(8.3.2), A x ⩾ α x Ax\geqslant \alpha x A x ⩾ αx ,因而 α ⩽ ρ ( A ) \alpha \leqslant \rho (A) α ⩽ ρ ( A ) .但是如果选取 x \pmb{x} x 为由定理(8.3.1)保证其存在的特征向量,那么我们看到这个上界可以用 α = ρ ( A ) \alpha = \rho (A) α = ρ ( A ) 来达到. □
练习 考虑 A = [ 1 0 0 2 ] A = \begin{bmatrix} 1 & 0 \\ 0 & 2 \end{bmatrix} A = [ 1 0 0 2 ] 和 x = [ 1 0 ] x = \begin{bmatrix} 1 \\ 0 \end{bmatrix} x = [ 1 0 ] ,证明,如果 x x x 不是正向量,(8.1.29)的上界不一定成立。证明(8.1.32)的“ min max \min \max min max ”特征一般也不成立。然而,如上述推论所证明的那样,“ max min \max \min max min ”特征的确可以推广。
添加一个假设条件,可以稍微强化定理(8.3.2)以给出关于向量 x x x 的某些信息。
8.3.4 定理 设 A ∈ M n A \in M_n A ∈ M n ,且 A ⩾ 0 A \geqslant 0 A ⩾ 0 ,再假定 A A A 有正左特征向量。如果 x ⩾ 0 , x ≠ 0 x \geqslant 0, x \neq 0 x ⩾ 0 , x = 0 ,又如果 A x ⩾ ρ ( A ) x Ax \geqslant \rho(A)x A x ⩾ ρ ( A ) x ,则 A x = ρ ( A ) x Ax = \rho(A)x A x = ρ ( A ) x .
证明:设 y > 0 y > 0 y > 0 适合 A T y = ρ ( A ) y A^T y = \rho(A)y A T y = ρ ( A ) y ,且假定 x ⩾ 0 x \geqslant 0 x ⩾ 0 适合 x ≠ 0 x \neq 0 x = 0 和 A x − ρ ( A ) x ⩾ 0 Ax - \rho(A)x \geqslant 0 A x − ρ ( A ) x ⩾ 0 。则
y T [ A x − ρ ( A ) x ] − ρ ( A ) y T x − ρ ( A ) y T x − 0 , y ^ {T} [ A x - \rho (A) x ] - \rho (A) y ^ {T} x - \rho (A) y ^ {T} x - 0, y T [ A x − ρ ( A ) x ] − ρ ( A ) y T x − ρ ( A ) y T x − 0 , 所以一定有 A x − ρ ( A ) x = 0 Ax - \rho (A)x = 0 A x − ρ ( A ) x = 0
不添加假设条件,不可能比定理(8.3.1)更进一步把Perron定理(8.2.11)推广到非负矩阵。
当 A ∈ M n A \in M_{n} A ∈ M n 且 A ⩾ 0 A \geqslant 0 A ⩾ 0 时,非负特征值 ρ ( A ) \rho(A) ρ ( A ) 称为 A A A 的 Perron 根。因为相应于非负矩阵的 Perron 根的特征向量未必是唯一确定的,所以对于一般非负矩阵(不同于 A A A 是正矩阵的情形),没有关于“Perron 向量”的完全确定的概念。例如,非负矩阵 A = I A = I A = I 有每个非负向量作为相应于 Perron 根 ρ ( A ) = 1 \rho(A) = 1 ρ ( A ) = 1 的特征向量。
习题 用例子说明,在Perron定理(8.2.11)中的不包括在定理(8.3.1)中的各项命题对所有非
负矩阵一般不成立.提示:考虑 [ 0 1 0 0 ] , [ 1 0 0 1 ] \left[ \begin{array}{ll}0 & 1\\ 0 & 0 \end{array} \right],\left[ \begin{array}{ll}1 & 0\\ 0 & 1 \end{array} \right] [ 0 0 1 0 ] , [ 1 0 0 1 ] 和 [ 0 1 1 0 ] . \left[ \begin{array}{ll}0 & 1\\ 1 & 0 \end{array} \right]. [ 0 1 1 0 ] .
如果 A ⩾ 0 A \geqslant 0 A ⩾ 0 ,且对某个 k ⩾ 1 k \geqslant 1 k ⩾ 1 有 A k > 0 A^k > 0 A k > 0 ,证明 A A A 有正特征向量。
如果 A ⩾ 0 A \geqslant 0 A ⩾ 0 有非负特征向量 x x x , 其中有 r ⩾ 1 r \geqslant 1 r ⩾ 1 个正分量和 n − r n - r n − r 个零分量, 证明, A A A 经置换相似可以变成形式 [ B C 0 D ] \left[ \begin{array}{cc} B & C \\ 0 & D \end{array} \right] [ B 0 C D ] , 其中 B ∈ M r B \in M_r B ∈ M r , C ∈ M r ( n − r ) C \in M_{r(n-r)} C ∈ M r ( n − r ) , D ∈ M n − r D \in M_{n-r} D ∈ M n − r ; B , C B, C B , C 和 D D D 是非负矩阵, 且 B B B 有正特征向量. 如果 r < n r < n r < n , 证明 A A A 一定是可约矩阵.
用例子说明,推论(8.1.30)的下述推广不成立:设 A ⩾ 0 A \geqslant 0 A ⩾ 0 。如果 A A A 有非负特征向量 x ⩾ 0 , x ≠ 0 x \geqslant 0, x \neq 0 x ⩾ 0 , x = 0 ,则 A x = ρ ( A ) x Ax = \rho(A)x A x = ρ ( A ) x .
考虑矩阵 A = [ 0 1 0 1 ] A = \begin{bmatrix} 0 & 1 \\ 0 & 1 \end{bmatrix} A = [ 0 0 1 1 ] 和向量 x = [ 1 , 2 ] T x = [1, 2]^T x = [ 1 , 2 ] T ,说明,如果只假定 A ⩾ 0 A \geqslant 0 A ⩾ 0 ,定理(8.3.4)是不成立的。 A A A 的左和右 Perron 向量是什么?
如果 A ⩾ 0 A \geqslant 0 A ⩾ 0 ,证明,存在与 A A A 交换的正矩阵 B B B ,当且仅当 A A A 有全是正的左和右特征向量。提示:如果 x x x 和 y y y 是 A A A 的正右特征向量和正左特征向量,设 B = x y T B = xy^{\mathrm{T}} B = x y T 。反之,如果 x ⩾ 0 x \geqslant 0 x ⩾ 0 ,且 A x = ρ ( A ) x Ax = \rho(A)x A x = ρ ( A ) x ,考虑 B A x = A B x = B ρ ( A ) x > 0 BAx = ABx = B\rho(A)x > 0 B A x = A B x = Bρ ( A ) x > 0 .
如果 A = [ a i j ] ∈ M n A = [a_{ij}] \in M_n A = [ a ij ] ∈ M n 是非负三对角矩阵,证明 A A A 的所有特征值都是实的。提示:首先证明,如果所有下和上对角元都是正的,则可以求得正对角矩阵 D D D 使得 D − 1 A D D^{-1}AD D − 1 A D 是对称矩阵。然后证明对角线以上或以下的0元是无关紧要的。
设非负矩阵 A ∈ M n A \in M_{n} A ∈ M n 是给定的。证明,或者 A A A 是不可约的,或者存在置换矩阵 P \pmb{P} P 使得
P i A P = [ A 1 ∗ ⋱ 0 A k ] , P ^ {i} A P = \left[ \begin{array}{c c c} A _ {1} & & * \\ & \ddots & \\ 0 & & A _ {k} \end{array} \right], P i A P = A 1 0 ⋱ ∗ A k , 其中,每个 A i A_{i} A i 或者是不可约矩阵,或者是 1 × 1 1 \times 1 1 × 1 零矩阵, i = 1 , … , k i = 1, \dots, k i = 1 , … , k 。这种形式称为 A A A 的不可约正规形式,注意, σ ( A ) = ⋃ i = 1 k σ ( A i ) \sigma(A) = \bigcup_{i=1}^{k} \sigma(A_{i}) σ ( A ) = ⋃ i = 1 k σ ( A i ) ,且 A A A 的不可约正规形式未必唯一。
矩阵 A = [ a i j ] ∈ M n ( R ) A = [a_{ij}] \in M_n(\mathbb{R}) A = [ a ij ] ∈ M n ( R ) 称为本性非负矩阵,是指其所有非对角元 a i j ( i ≠ j ) a_{ij} (i \neq j) a ij ( i = j ) 都是非负的。证明,如果 A A A 是本性非负矩阵,则有某个 λ > 0 \lambda > 0 λ > 0 使得 λ I + A ⩾ 0 \lambda I + A \geqslant 0 λ I + A ⩾ 0 。试用这一论断以及(8.3.1)证明,如果 A ∈ M n A \in M_n A ∈ M n 是本性非负矩阵,则 A A A 有实特征值 r ( A ) r(A) r ( A ) (常称其为 A A A 的优势特征值),且有如下性质:对 A A A 的每个特征值 λ i \lambda_i λ i 有 r ( A ) ⩾ Re λ i r(A) \geqslant \operatorname{Re}\lambda_i r ( A ) ⩾ Re λ i 。证明, r ( A ) r(A) r ( A ) 不一定是 A A A 的具有最大模的特征值,但当 A ⩾ 0 A \geqslant 0 A ⩾ 0 时 r ( A ) = ρ ( A ) r(A) = \rho(A) r ( A ) = ρ ( A ) 。提示: λ I + A \lambda I + A λ I + A 的诸特征值为 λ + λ i \lambda + \lambda_i λ + λ i 。
定理(8.1.18)是说,若 A ∈ M n A \in M_{n} A ∈ M n 是非负矩阵,则当 B ∈ M n B \in M_{n} B ∈ M n 也是非负矩阵时有 ρ ( A + B ) ⩾ ρ ( A ) \rho(A + B) \geqslant \rho(A) ρ ( A + B ) ⩾ ρ ( A ) ;这是关于谱半径的一种单调性结果。如果 A ∈ M n A \in M_{n} A ∈ M n 是本性非负矩阵(见习题9),证明,对所有对角矩阵 D ∈ M n ( R ) D \in M_{n}(\mathbf{R}) D ∈ M n ( R ) , A + D A + D A + D 是本性非负矩阵。如果 A A A 是给定的本性非负矩阵,而 D D D 允许在实对角矩阵类中变化,则可得知,优势特征值 r ( A + D ) r(A + D) r ( A + D ) 是 D D D 的诸对角元的一个凸函数。
进一步阅读 参看以下文章:C.Johnson,R.Kellogg,and A.Stephens,“Complex
Eigenvalues of a Nonnegative Matrix with a Specified Graph II,"Lin. Multilin. Alg. 7 (1979), 129-143, 以及 C. Johnson, "Row Stochastic Matrices Similar to Doubly Stochastic Matrices," Lin. Multilin. Alg. 10 (1981), 113-130. 可以了解有关非负矩阵可能具有的特征值这一重要论题的一些结果。这些文章给出一些参考文献。其中包括 Dmitriev, Dynkin 和 Karpelevich 的经典工作,以及非负逆特征值问题。后一个问题(刻划可以是非负矩阵的谱的复数集的特征)尚未解决。关于习题 10 的其他信息可参看 J. Cohen, "Convexity of the Dominant Eigenvalue of an Essentially Nonnegative Matrix," Proc. Amer. Math. Soc. 81 (1981), 657-658。也可参看 (8.4)节 15 题。