8.4_不可约非负矩阵

8.4 不可约非负矩阵

如果能够对不含任何0元的矩阵证明一结论,那么这个结论常常可推广到不可约矩阵,这是一个颇具启发性的有用法则。我们在第6章推广基本的Gersgorin定理时,已有这个法则的一个例证,现在要给出另一个例证。其基本思想已在定理(6.2.24)中得到证明;这里重述其相关的部分。

8.4.1 引理 设 AMnA \in M_n ,且假定 A0A \geqslant 0 。那么, AA 是不可约矩阵,当且仅当 (I+A)n1>0(I + A)^{n-1} > 0

练习 如果 AMnA \in M_{n} , 证明, AA 是不可约的, 当且仅当 AtA^{t} 是不可约的.

目前,我们还需要下述简单的结果。

8.4.2 引理 设 AMnA \in M_{n} ,且设 λ1,,λn\lambda_{1}, \ldots, \lambda_{n}AA 的特征值(计重特征值)。则 λ1+1,,λn+1\lambda_{1} + 1, \ldots, \lambda_{n} + 1I+AI + A 的特征值且 ρ(I+A)1+ρ(A)\rho(I + A) \leqslant 1 + \rho(A) 。如果 A0A \geqslant 0 ,则 ρ(I+A)=1+ρ(A)\rho(I + A) = 1 + \rho(A)

证明:设 λσ(A)\lambda \in \sigma(A) 有重数 kk ,则 λ\lambda 是特征方程 pA(t)=det(tIA)0p_A(t) = \operatorname{det}(tI - A) - 0kk 重根。另外,因 det(tIA)=det[(t+1)I(A+I)]\operatorname{det}(tI - A) = \operatorname{det}[(t + 1)I - (A + I)] ,所以 λ+1\lambda + 1pA,t(s)=det[sI(A+I)]=0p_{A, t}(s) = \operatorname{det}[sI - (A + I)] = 0kk 重根。于是 λ1+1,,λn+1\lambda_1 + 1, \dots, \lambda_n + 1A+IA + I 的特征值。因此, ρ(I+A)=max1inλi+1max1inλi+1=1+ρ(A)\rho(I + A) = \max_{1 \leqslant i \leqslant n} |\lambda_i + 1| \leqslant \max_{1 \leqslant i \leqslant n} |\lambda_i| + 1 = 1 + \rho(A) 。但是,当 A0A \geqslant 0 时,根据(8.3.1), 1ρ(A)1 \mid \rho(A)I+AI + A 的特征值,因此,在这种情形, ρ(I+A)=1+ρ(A)\rho(I + A) = 1 + \rho(A)

练习 试说明,为了证明上述引理的前一部分,下述论证为什么是不完全的:如果 λ\lambdaAA 的特征值,则存在某个向量 x0x \neq 0 使得 A.x=λxA.x = \lambda x 。但是, (A+I)x=(λ+1)x(A + I)x = (\lambda + 1)x ,所以 λ+1\lambda + 1A+IA + I 的特征值。

8.4.3 引理 如果 AMnA \in M_{n} , A0A \geqslant 0 , 且对某个 k1k \geqslant 1Ak>0A^{k} > 0 , 则 ρ(A)\rho(A)AA 的代数单重特征值.

证明:如果 λ1,,λn\lambda_1, \dots, \lambda_nAA 的特征值,则 λ1k,,λnk\lambda_1^k, \dots, \lambda_n^kAkA^k 的特征值。由定理(8.3.1)可知, ρ(A)\rho(A)AA 的特征值,因此,假如 ρ(A)\rho(A)AA 的重特征值,则 ρ(A)k=ρ(Ak)\rho(A)^k = \rho(A^k)AkA^k 的重特征值。但这是不可能的,因为由定理(8.2.10)可知, ρ(Ak)\rho(A^k)AkA^k 的单重特征值。

现在将可看到,在多大程度上Perron定理可以推广到非负不可约矩阵.把正矩阵的Perron结果推广到非负矩阵,是与Frobenius的名字分不开的.

8.4.4 定理 设 AMnA \in M_{n} ,且假定 AA 是不可约非负矩阵,则

(a) ρ(A)>0\rho (A) > 0

(b) ρ(A)\rho(A)AA 的特征值;
(c) 存在正向量 xx 使得 Ax=ρ(A)xA_x = \rho(A)_x ;
(d) ρ(A)\rho(A)AA 的代数(因而几何)单重特征值.

证明:推论(8.1.25)说明,即使在比不可约性更弱的条件下,(a)仍然成立。根据定理(8.3.1),论断(b)对所有非负矩阵成立,同时它保证存在适合 Ax=ρ(A)xAx = \rho(A)x 的非负向量 x0x \neq 0 。另一方面, (I+A)1x=[1+ρ(A)]1x(I + A)^{-1}x = [1 + \rho(A)]^{-1}x ,又根据引理(8.4.1),矩阵 (I+A)1(I + A)^{-1} 是正的,所以由(8.1.14)可知,向量 (I+A)1x(I + A)^{-1}x 一定是正的。因此 x=[1+ρ(A)]1n(I+A)n1x>0x = [1 + \rho(A)]^{1 - n}(I + A)^{n - 1}x > 0 。为了证明(d),利用引理(8.4.2)可证,如果 ρ(A)\rho(A)AA 的重特征值,则 1+ρ(A)=ρ(I+A)1 + \rho(A) = \rho(I + A)I+AI + A 的重特征值。但是 I+A0I + A \geqslant 0 ,且根据引理(8.4.1), (I+A)1>0(I + A)^{-1} > 0 ,因此由引理(8.4.3)可知, 1+ρ(A)1 + \rho(A) 一定是 I+AI + A 的单重特征值。□

该定理保证,不可约非负矩阵相应于Perron根的特征空间是一维的。对于不可约非负矩阵,其分量和为1的唯一正特征向量称为Perron向量。

因为不可约非负矩阵有正特征向量,所以(8.1)节末的诸结果可以应用于这类矩阵,其中特别重要的是谱半径的变分特征(8.1.32).另外, AA^{\dagger} 不可约,当且仅当 AA 不可约,所以不可约非负矩阵也有正左特征向量.因此,定理(8.3.4)对不可约非负矩阵成立.这个事实在定理(8.1.18)的下述推广中是关键的.

8.4.5 定理 设 A,BMnA, B \in M_{n} . 假定 AA 是不可约非负矩阵,且 ABA \geqslant |B| ,则 ρ(A)ρ(B)\rho(A) \geqslant \rho(B) . 如果 ρ(A)=ρ(B)\rho(A) = \rho(B) ,又 λ=eiφρ(B)\lambda = e^{i\varphi} \rho(B)BB 的特征值,则存在 θ1,,θnR\theta_{1}, \dots, \theta_{n} \in \mathbb{R} 使得 B=eiφDAD1B = e^{i\varphi} D A D^{-1} ,其中 D=diag(eiθ1,,eiθn)D = \operatorname{diag}(e^{i\theta_{1}}, \dots, e^{i\theta_{n}}) .

证明:由定理(8.1.18)已经知道,如果 ABA \geqslant |B| ,则 ρ(A)ρ(B)\rho(A) \geqslant \rho(B) 。如果 ρ(A)=ρ(B)\rho(A) = \rho(B) ,则存在某个 x0x \neq 0 ,使得 Bx=λxBx = \lambda x ,且 λ=ρ(B)=ρ(A)|\lambda| = \rho(B) = \rho(A) ,因而

ρ(A)xλi=BxBxAx.\rho (A) \mid x \mid - \mid \lambda_ {i} \mid = \mid B _ {x} \mid \leqslant \mid B \mid \mid x \mid \leqslant A \mid x \mid .

因为 AA 是不可约矩阵,所以,根据定理(8.3.4)可知, Ax=ρ(A)xA \mid x \mid = \rho(A) \mid x . 因而 Bx=Bx=Ax|Bx| = |B| \mid x| = A \mid x . 此外,定理(8.4.4)的(c)和(d)也蕴涵 x>0|x| > 0 ,又因为 BA|B| \leqslant A 所以由(8.1.15)和 Br=Ax|B| \mid r \mid = A \mid x , 的事实推出 B=A|B| = A . 如果定义 θkR\theta_k \in \mathbb{R}eiθk=xk/xke^{i\theta_k} = x_k / |x_k|k=1,,nk = 1, \dots, n ,如果 λeiφρ(A)\lambda \equiv e^{i\varphi} \rho(A) ,又如果令 Ddiag(eθ1,,eiθn)D \equiv \mathrm{diag}(e^{\theta_1}, \dots, e^{i\theta_n}) ,则 x=Dxx = D \mid xλx=eiφρ(A)Dx=BDx=Br\lambda x = e^{i\varphi} \rho(A)D \mid x = BD \mid x = Br . 因此, eiφD1BDx=ρ(A)x=Axe^{-i\varphi}D^{-1}BD \mid x = \rho(A) \mid x = A \mid x . 这个恒等式连同 x>0|x| > 0eiφD1BD=A|e^{-i\varphi}D^{-1}BD| = A 的事实蕴涵 eiφD1BD=Ae^{-i\varphi}D^{-1}BD = A . □

练习 对上述证明的最后一部分,给出其证明细节。提示:设 C=eiπD1BDC = e^{i\pi}D^{-1}BD ,且注意到

Ax=Cx=CxCx=Ax,A \mid x \mid = C \mid x \mid = | C \mid x \mid | \leqslant | C \mid \mid x \mid = A \mid x \mid ,

因而在三角不等式中等式成立,辐角 arg(cijxj)=\arg (c_{ij} | x_j |) = 常数, cij0c_{ij} \geqslant 0 ,且 cij=aijc_{ij} = a_{ij}

A>0A > 0 时,由Perron定理可知, ρ(A)\rho(A)AA 的有最大模的唯一特征值。当 A0A \geqslant 0 时,可能存在多个有极大模的特征值,不过,在这种情形, AA 应该有特殊的形式,且这些特征值应该位于一个很规则的图形内。

8.4.6 推论 设 AMnA \in M_{n} ,假定 AA 是不可约非负矩阵,又假定具有极大模特征值 ρ(A)\rho(A) 的集合 S={λn=ρ(A),λn1,,λnk1}S = \{\lambda_{n} = \rho(A), \lambda_{n-1}, \dots, \lambda_{n-k-1}\} 恰好有 kk 个互不相同的元,则每个特征值 λiS\lambda_{i} \in S 有代数重数 1,且

S={e2πip/kρ(A):p=0,1,,k1},S = \left\{e ^ {2 \pi i p / k} \rho (A): p = 0, 1, \dots , k - 1 \right\},

即这些极大模特征值正好是 kk 个次单位根与 ρ(A)\rho(A) 的乘积,另外,如果 λ\lambdaAA 的任一特征值,则对所有 p=0,1,,k1p = 0, 1, \dots, k - 1e2πp/kλe^{2\pi p / k} \lambda 是特征值。

证明:对于 SS 中的每个特征值,记 λn,p=eiφpρ(A)\lambda_{n,p} = e^{i\varphi_{p}}\rho(A)p=0,1,,k1p = 0,1,\dots,k-1 ,也就是 φp=arg(λnp)\varphi_{p} = \arg (\lambda_{n-p}) 。假定 k>1k > 1 ,如果有必要,可以重新标记诸特征值,如果还有必要,也可以重新定义辐角使得 0=φ0<φ1<φ2<<φk<2π0 = \varphi_{0} < \varphi_{1} < \varphi_{2} < \dots < \varphi_{k} < 2\pi 。利用上述定理,且取 BAB \equiv Aλλnp\lambda \equiv \lambda_{n-p} ,得知,对 p=0,1,,k1p = 0,1,\dots,k-1A=B=eiφpDpADp1A = B = e^{i\varphi_{p}}D_{p}AD_{p}^{-1} 。因 DpADp1D_{p}AD_{p}^{-1} 相似于 AA ,所以它与 AA 有相同的特征值,因此这个恒等式说明,对任意 p=0,1,,k1p = 0,1,\dots,k-1 ,如果 AA 的特征值集合在复平面内作角 φp\varphi_{p} 的旋转,则它仍变到自身;(只要证明 φp=2πp/k\varphi_{p} = 2\pi p / k )这就是上述最后一个论断。此外,已知 λn=ρ(A)\lambda_{n} = \rho(A)AA 的代数单重特征值(因为 AA 是不可约的),所以依次令 p=1,2,,k1p = 1,2,\dots,k-1 ,便得出所有 λnp\lambda_{n-p} 也是代数单重特征值。

不过,还可以说得更详细一些。因为对每个 p=0,1,,k1p = 0, 1, \dots, k - 1S={λn,λn1,,λnk+1}={eiφpλn,eiφpλn1,,eiφpλnk+1}S = \{\lambda_n, \lambda_{n-1}, \dots, \lambda_{n-k+1}\} = \{e^{i\varphi_p}\lambda_n, e^{i\varphi_p}\lambda_{n-1}, \dots, e^{i\varphi_p}\lambda_{n-k+1}\} ,所以一定存在某个 q=q(p)q = q(p) 使得 ρ(A)=λn=eiφpλq\rho(A) = \lambda_n = e^{i\varphi_p}\lambda_q ;即对每个 pp ,都存在某个 q=q(p)q = q(p) 使得 φp=2πφq\varphi_p = 2\pi - \varphi_q [即 φp=φq(mod2π)\varphi_p = -\varphi_q(\bmod 2\pi) ],因而, eiφpρ(A)Se^{i\varphi_p}\rho(A) \in S 。另外,如果重复定理(8.4.5)给出的关于 AA 的表示式,并且对于任意选定的适合 0r,mk10 \leqslant r, m \leqslant k-1r,mr, m ,取 B=eiφrDrADr1B = e^{i\varphi_r}D_rAD_r^{-1}λ=λm=eiφmρ(A)\lambda = \lambda_m = e^{i\varphi_m}\rho(A) ,则得出

A=eiφrDr{eiφmDmADm1}Dr1=e(φm+φr)DrDmA(DrDm)1.A = e ^ {i \varphi_ {r}} D _ {r} \left\{e ^ {i \varphi_ {m}} D _ {m} A D _ {m} ^ {- 1} \right\} D _ {r} ^ {- 1} = e ^ {\left(\varphi_ {m} + \varphi_ {r}\right)} D _ {r} D _ {m} A \left(D _ {r} D _ {m}\right) ^ {- 1}.

因此,根据上述相同的论证,在复平面内, AA 的特征值集合经 φm+φr\varphi_{m} + \varphi_{r} 的旋转变到自身。特别是, λnet(φm+φr)=et(φm+φr)ρ(A)\lambda_{n}e^{t(\varphi_{m} + \varphi_{r})} = e^{t(\varphi_{m} + \varphi_{r})}\rho (A) 一定是 AA 的(具有极大模的)特征值,所以对某个 j=j(m,r)j = j(m,r) ,一定有 φm+φr=φj(mod2π)\varphi_{m} + \varphi_{r} = \varphi_{j} (\bmod 2\pi)

考虑集合 G={φ0=0,φ1,,φnk+1}[0,2π)G = \{\varphi_0 = 0, \varphi_1, \dots, \varphi_{n - k + 1}\} \subset [0, 2\pi) 。上一段已提供了以下信息:(a) 0G0 \in G ;(b)如果 φi,φjG\varphi_i, \varphi_j \in G ,则 φi+φj(mod2π)G\varphi_i + \varphi_j (\bmod 2\pi) \in G ;(c)如果 φiG\varphi_i \in G ,则 φi(mod2π)G\varphi_i (\bmod 2\pi) \in G 。另外显然有,(d)如果 φi,φjG\varphi_i, \varphi_j \in G ,则 φi+φj=φi+φi(mod2π)\varphi_i + \varphi_j = \varphi_i + \varphi_i (\bmod 2\pi) 。因此, GG 是恰好有 kk 个元素的 Abel 群;群的运算是“关于模为 2π2\pi 的加法”。因为有限 Abel 群任一元素的阶一定整除群的阶,所以每个 eφme^{\varphi_m} 一定是 pp 次单位根,其中 p=p(m)p = p(m)kk 的因子。另外,我们可以不用群的理论直接证明这一事实。

因为对某个 jj 以及每个 rrmmφm+φr=φj(mod2π)\varphi_{m} + \varphi_{r} = \varphi_{j} (\bmod 2\pi) ,用归纳法可得出,(令 r=m=1r = m = 1 )对所有 r=0,1,2,(mod2π)r = 0, 1, 2, \dots (\bmod 2\pi)rφ1Gr\varphi_{1} \in G ;即对所有 r=0,1,2,r = 0, 1, 2, \dotserφ1ρ(A)Se^{r\varphi_{1}}\rho(A) \in S 。但是,假如 eiφ1e^{i\varphi_{1}} 不是单位根,这便蕴涵 SS 有无限多个不同的元素,而这是不可能的。因此,对某个适合 1<pk1 < p \leqslant kppeipφ1=1e^{i p\varphi_{1}} = 1 ;可假定 pp 是使这个式子成立的最小整数。我们知道, 0<φ1<φ2<<φnk+1<2π0 < \varphi_{1} < \varphi_{2} < \dots < \varphi_{n - k + 1} < 2\pi ,且对某个固定指数 mm 考虑 φm\varphi_{m} ,恰好可用 p+1p + 1 个点 0,φ1,2φ1,,(p1)φ10, \varphi_{1}, 2\varphi_{1}, \dots, (p - 1)\varphi_{1}pφ1=2πp\varphi_{1} = 2\pi 将区间 [0,2π)[0, 2\pi) 分成 pp 个半开子区间(在右边开);点 φm\varphi_{m} 一定落在这些子区间的一个中。于是,存在某个适合 0qp10 \leqslant q \leqslant p - 1qq 使得 qφ1φm<(q+1)φ1q\varphi_{1} \leqslant \varphi_{m} < (q + 1)\varphi_{1} ;即 0φmqφ1<φ10 \leqslant \varphi_{m} - q\varphi_{1} < \varphi_{1} 。因此,对某个 jj(m)j - j(m) ,一定有 φmqφ1=φj\varphi_{m} - q\varphi_{1} = \varphi_{j} ,这是因为已经证明,如果 eiφ1ρ(A)e^{i\varphi_{1}}\rho(A) 是特征值,则 eiφ1ρ(A)e^{-i\varphi_{1}}\rho(A)eiφ1ρ(A)e^{-i\varphi_{1}}\rho(A) 也是特征值。另一方面, 0φmqφ1=φj<φ10 \leqslant \varphi_{m} - q\varphi_{1} = \varphi_{j} < \varphi_{1} ,且选定 φ1\varphi_{1} 是最小非零辐角,因而一定有 φmqφ1=0\varphi_{m} - q\varphi_{1} = 0 。这就说明每个辐角 φj\varphi_{j}φ1\varphi_{1} 的某个倍数,所以必定是 p=kp = k ;即 φ1=2π/k\varphi_{1} = 2\pi / k ,因为假如 p<kp < k ,则在集合 {eiφ1ρ(A),e2iφ1ρ(A),e3iφ1ρ(A),}\{e^{i\varphi_{1}}\rho(A), e^{2i\varphi_{1}}\rho(A), e^{3i\varphi_{1}}\rho(A), \dots\} 中的不同的元素会少于 kk

510

个,然而这个集合一定等于整个S. 最后,因为每个 φm\varphi_{m}φ1=2π/k\varphi_{1} = 2\pi /k 的某个倍数,又因为存在 kk 个不同的 φi\varphi_{i} 项和 kkφ1\varphi_{1} 的不同倍数,所以对所有 m=0,1,2,,k1m = 0,1,2,\dots ,k - 1 一定有 φm=mφ1\varphi_{m} = m\varphi_{1}

整个证明是在 k>1k > 1 的假定下进行的,但是,如果 k=1k = 1 ,所作的论断是显然的.

8.4.7 附注 如果 A0A \geqslant 0 是不可约的,且有 k>1k > 1 个极大模特征值,则 AA 的每个非零特征值位于中心在 C\mathbf{C} 中的 0 的一个圆上,这个圆恰好经过 AAkk 个特征值,且使它们在整个圆上都保持相同的间隔。特别是, kk 必须是 AA 的非零特征值的个数的因子。因此,如果 AAn×nn \times n 非奇异不可约非负矩阵,且 nn 是素数,则一定存在一个或 nn 个极大模特征值;不会有其他可能性。
8.4.8 推论 假定 AMnA \in M_{n} 是不可约非负矩阵,且记 Am[aij(m)]A^{m} \equiv \left[a_{ij}^{(m)}\right]m=1,2,m = 1, 2, \cdots 。如果正好存在 AAk>1k > 1 个具有极大模的特征值,则当 mm 不是 kk 的整数倍时, aij(m)0a_{ij}^{(m)} \equiv 0 对所有 i=1,2,,ni = 1, 2, \cdots, n 成立。特别是所有 an=0a_{n} = 0

证明:利用推论(8.4.6)选取 AA 的一个极大模特征值 λ=eiφρ(A)\lambda = e^{i\varphi}\rho(A) ,其中 φ=2π/k\varphi = 2\pi / k 。于是,只要 mm 不是 kk 的整数倍, emφe^{m\varphi} 就不是正实数。利用定理(8.4.5),且取 BAB - Aλ=eiφρ(A)\lambda = e^{i\varphi}\rho(A) ,得出 A=eiφDAD1A = e^{i\varphi}DAD^{-1} ,所以对于所有 i=1,,ni = 1, \cdots, nm=1,2,3,m = 1, 2, 3, \cdots ,有 Am=emφDAmD1A^m = e^{m\varphi}DA^m D^{-1}an(m)=einφan(m)a_n^{(m)} = e^{in\varphi}a_n^{(m)} 。如果 einφe^{in\varphi} 不是正实数,又如果 an(m)>0a_n^{(m)} > 0 ,则这个等式不可能成立,因此,当 mm 不是 kk 的倍数时,对所有 i=1,,ni = 1, \cdots, n ,一定有 an(m)0a_n^{(m)} \equiv 0

练习 假定 AMnA \in M_{n} 是不可约非负矩阵。证明,为了保证 ρ(A)\rho(A)AA 的唯一极大模特值,其充分条件是某个 an0a_{n} \neq 0 。但是,考察矩阵

[011101110]\left[ \begin{array}{c c c} 0 & 1 & 1 \\ 1 & 0 & 1 \\ 1 & 1 & 0 \end{array} \right]

并说明这个条件不是必要的,你能找一个 2×22 \times 2 矩阵的反例吗?

8.4.9 附注 比推论(8.4.8)更强的结论仍成立:如果 A0A \geqslant 0 是不可约矩阵,且有 k>1k > 1 个具有极大模的特征值,则存在置换矩阵 PP 使得

PAPT=[0A12000Ak1,kAk,100]P A P ^ {T} = \left[ \begin{array}{c c c c} 0 & A _ {1 2} & & 0 \\ \vdots & 0 & \ddots & \\ 0 & & \ddots & A _ {k - 1, k} \\ A _ {k, 1} & 0 & \dots & 0 \end{array} \right]

其中, kk 个主对角零子块是方阵而所列出的诸子块 AijA_{ij} 不一定是零矩阵。特别地,所有主对角元 ana_{n} 必须是零[Var,p.28]。

为了得到在推论(8.4.6)中所描述的极大模特征值的规则图形,尽管不可约性假设是本质的,但是在一般情形下不仍然可以得到某些信息。

8.4.10 推论 如果 AMn,A0,ρ(A)>0A \in M_n, A \geqslant 0, \rho(A) > 0 ,如果 λ\lambdaAA 的适合 λ=ρ(A)|\lambda| = \rho(A) 的特征值,则 λ/ρ(A)=eiφ\lambda / \rho(A) = e^{i\varphi} 是单位根,对某个适合 1kn1 \leqslant k \leqslant nkkeiφ=1e^{i\varphi} = 1 ,且对所有 p=0,1,2,,k1,eiφρ(A)p = 0, 1, 2, \dots, k-1, e^{i\varphi} \rho(A) 都是 AA 的特征值。

证明:如果 AA 是不可约的,则论断可由推论(8.4.6)推出。如果 AA 可约,则 AA 可经置换相似变成分块上三角形式

[A1A20Ar]\left[ \begin{array}{c c c c} A _ {1} & & & * \\ & A _ {2} & & \\ & & \ddots & \\ 0 & & & A _ {r} \end{array} \right]

其中 AjA_{j} 是不可约方阵或零方阵. AA 的特征值是各对角子块矩阵 A1,,ArA_{1},\dots ,A_{r} 的特征值的并,且每个 AjA_{j} 的极大模特征值集合的结构由推论(8.4.8)给出. □

练习设

A1=[0110]A2=[010001100],A _ {1} = \left[ \begin{array}{l l} {0} & {1} \\ {1} & {0} \end{array} \right] \quad \text {和} \quad A _ {2} = \left[ \begin{array}{l l l} {0} & {1} & {0} \\ {0} & {0} & {1} \\ {1} & {0} & {0} \end{array} \right],

通过考察

A=[A10A2]M3A = \left[ \begin{array}{c c} A _ {1} & * \\ 0 & A _ {2} \end{array} \right] \in M _ {3}

来说明,对于一般的非负矩阵 AAAA 的极大模特征值可能比 ρ(A)\rho (A) 以及 ρ(A)\rho (A) 经过一个单位根的各次幂的旋转所得到的集合要多.

习题

  1. 用例子说明,未列入到定理(8.4.4)中的Perron定理(8.2.11)中的各项命题对不可约非负矩阵一般不成立。

  2. 用例子说明, ρ(I+A)=1+ρ(A)\rho(I + A) = 1 + \rho(A) 对所有 AMnA \in M_{n} 不成立。试给出使这恒等式成立的关于 AA 的必要充分条件。

  3. 不可约性是非负矩阵有正特征向量的充分条件而不是必要条件。试考察 [1100]\left[ \begin{array}{ll}1 & 1\\ 0 & 0 \end{array} \right][1010]\left[ \begin{array}{ll}1 & 0\\ 1 & 0 \end{array} \right] ,说明可约非负矩阵可能有或可能没有正特征向量。

  4. 如果 A0A \geqslant 0 是不可约的,证明,当 mm \to \infty 时,矩阵 [ρ(A)1A]m[\rho(A)^{-1}A]^m 的各元一致有界。

  5. 我们已经证明,不可约矩阵有正 Perron 向量。假定 A0A \geqslant 0ρ(A)>0\rho(A) > 0x0x \geqslant 0x0x \neq 0Ax=ρ(A)xAx = \rho(A)x ;证明,如果 xx 不是正的,则 AA 是可约的。如果 xx 是正的, AA 就一定不可约吗?

  6. 假定 A0A \geqslant 0 是不可约的,且 B0B \geqslant 0AA 可交换。如果 xxAA 的 Perron 向量,证明 Bx=ρ(B)xBx = \rho(B)x 。提示:定理(8.4.4d)。

  7. 说明多项式 xk1=0x^{k} - 1 = 0 的友矩阵是 k×kk \times k 非负矩阵有 kk 个极大模特征值的例子。验证这些特征值在复平面中的位置。

  8. k1,k2,kpk_{1}, k_{2}, k_{p} 是给定的正整数,说明如何构造一个非负矩阵使得它的极大模特征值正好是 k1k_{1}k1k_{1} 次单位根, k2k_{2}k2k_{2} 次单位根,…,以及 kpk_{p}kpk_{p} 次单位根。

  9. 如果不可约非负矩阵 AAk1k \geqslant 1 个极大模特征值,说明为什么称 AA 为指标 kk 的循环。

  10. 如果 A0A \geqslant 0 是不可约矩阵,并且还是指标 k1k \geqslant 1 的循环,证明特征多项式 pA(t)=tr(tkρ(A)k)(tkμ2k)(tkμmk)p_A(t) = t^r (t^k - \rho(A)^k)(t^k - \mu_2^k) \cdots (t^k - \mu_m^k) ,其中, r,m0r, m \geqslant 0 为某个整数, μi\mu_i 是适合 μi<ρ(A)|\mu_i| < \rho(A) 的某些复数, i=2,,mi = 2, \dots, m 。对 pA(t)p_A(t) 中零和非零系数的型式作出说明,并且基于特征多项式的形式给出 AA 只有一个极大模特征值的准则。提示:在推论(8.4.6)的证明中已知,如果 φ=2π/k\varphi = 2\pi / k

513

λ\lambdaAA 的特征值,则 eαγλe^{\alpha \gamma} \lambda 亦是 AA 的特征值, r=0,1,2,r = 0, 1, 2, \dots .
11. 设 n>1n > 1 是素数。证明,如果 AMnA \in M_{n} 是非负的,不可约的和非奇异的,则或者 ρ(A)\rho(A)AA 的有极大模的唯一特征值,或者 AA 的所有特征值有极大模。
12. 考察 A=[0110]A = \begin{bmatrix} 0 & 1 \\ 1 & 0 \end{bmatrix} ,说明一般不可能改进推论(8.4.8)而断言, AA 的所有幂的主对角元一定都是零。
13. 如果 A0A \geqslant 0 ,证明, AA 的不可约性只与其零元的位置有系,而与非零元的大小无关。
14. 如果 A,BMnA, B \in M_{n} , 则 ABABBABA 有相同的特征值. 考察 [0101]\left[ \begin{array}{cc}0 & 1 \\ 0 & 1\end{array} \right][0011]\left[ \begin{array}{cc}0 & 0 \\ 1 & 1\end{array} \right] , 说明, 即使 AABB 是非负矩阵, 有可能 ABAB 不可约而 BABA 可约. 这种例子说明不可约矩阵可能相似 (甚至酉等价) 于可约矩阵; 解释这是为什么. 同时它说明, 仅仅涉及矩阵的特征值的任何条件不能最终验证其不可约性.
15. 设 AMnA \in M_{n} 是给定的不可约非负矩阵。证明,只要 BMnB \in M_{n} 非负, A+BA + B 就不可约,并且只要 B0B \geq 0B0B \neq 0 ,就有 ρ(A+B)>ρ(A)\rho(A + B) > \rho(A) 。这是(8.1.18)到严格单调性的改进,不过需附加不可约性假定。提示:(8.1.18)说明 ρ(A+B)ρ(A)\rho(A + B) \geqslant \rho(A) ,如果等式成立,利用(8.4.5)证明 B=0B = 0
16. 证明可以用下述方式强化(8.4.1). 设 AMnA \in M_{n} 是非负的, 且设 AA 的极小多项式有次数 mm . 证明, AA 不可约, 当且仅当 (I+A)m1>0(I + A)^{m-1} > 0 . 提示: 考虑 I+A+An++Am1+Am++An1I + A + A^{n} + \cdots + A^{m-1} + A^{m} + \cdots + A^{n-1} , 然后用 I,A,,Am1I, A, \cdots, A^{m-1} 表示 AmA^{m} 和更高次幂.
17. 设 AMnA \in M_{n} 是给定的非负矩阵,考虑在最小二乘意义下求 AA 的秩 1 最佳逼近问题;即求秩 1XMn1X \in M_{n} 使 AX2=min{AY2:YMn\| A - X \|_{2} = \min \{\| A - Y \|_{2}: Y \in M_{n} 有秩 1}. 假定 AATAA^{T} 的 Perron 根是单根,如果 AATAA^{T}ATAA^{T}A 不可约,情况就是这样。为什么?证明这样的最佳 XX 是非负的,唯一的且由 X=rwTX = \sqrt{r} w^{T} 给出,其中 r=ρ(AAT)r = \rho(AA^{T})AA 的 Perron 根,而 v,wRnv, w \in \mathbb{R}^{n} 是非负单位向量,它们分别是 AATAA^{T}ATAA^{T}A 相应于特征值 rr 的单位特征向量。提示:利用(7.4.1)中给出的秩 1 最佳逼近的特征。注意 AATAA^{T}ATAA^{T}A 都是实对称半正定矩阵,所以 r,vr, vww 的计算原则上是不太困难的。

  1. 试用习题17求每个矩阵

A=[1111],[1101],[0011]A = \left[ \begin{array}{l l} 1 & 1 \\ 1 & 1 \end{array} \right], \quad \left[ \begin{array}{l l} 1 & 1 \\ 0 & 1 \end{array} \right], \quad \left[ \begin{array}{l l} 0 & 0 \\ 1 & 1 \end{array} \right]

的秩1最佳二乘逼近。证明, A=IMnA = I \in M_n 的秩1最佳二乘逼近不唯一;对于任何单位向量 vCnv \in \mathbf{C}^nX=vvX = vv^*II 的秩1最佳二乘逼近。