8.0_导引

8.0 导引

假定有 n2n \geqslant 2 个城市 C1,,CnC_1, \cdots, C_n ,它们之间的人口流动情况如下所述:对所有 iji \neq j ,每天上午8:00同时从 jj 城到 ii 城去的流动人口的正常比率是 aija_{ij}jj 城的流动人口仍留在 jj 城的比率是 aija_{ij} 。因此,如果用 pi(m)p_i^{(m)} 表示第 mmii 城的人口数,则有第 mm 天与第 m+1m+1 天之间的人口分布递归关系

pi(m+1)=aiipi(m)++ainpn(m),i=1,,n,m=0,1,.p _ {i} ^ {(m + 1)} = a _ {i i} p _ {i} ^ {(m)} + \dots + a _ {i n} p _ {n} ^ {(m)}, \quad i = 1, \dots , n, \quad m = 0, 1, \dots .

如果用 A=[aij]A = [a_{ij}] 表示由人口流动系数组成的 n×nn \times n 矩阵,且用 p^{(m)} = [p_i^{(m)}} 表示人口分布向量,则

p(m+1)=Ap(m)=AAp(m+1)==Am+1p(n),m=0,1,,p ^ {(m + 1)} = A p ^ {(m)} = A A p ^ {(m + 1)} = \dots = A ^ {m + 1} p ^ {(n)}, \quad m = 0, 1, \dots ,

其中 p(0)p^{(0)} 是初始人口分布向量。因为系数 aija_{ij} 表示流动人口比率,所以,对每个 j=1,1,,nj = 1, 1, \dots, n ,有 0aij10 \leqslant a_{ij} \leqslant 1 ,且 i=1naii=1\sum_{i=1}^{n} a_{ii} = 1

为了对城市服务以及资金投入作出切合实际的长远规划,行政人员想知道,从现在到遥远的将来,总的人口 p=i=1npi(i)p = \sum_{i=1}^{n} p_i^{(i)} 将如何分布;即他们想知道,对大的 mmp(m)p^{(m)} 的渐近变化过程。但是,因为 p(m)=Λmp(i)p^{(m)} = \Lambda^m p^{(i)} ,所以显然必须考察 Λ(m)\Lambda^{(m)} 的渐近变化过程。

例如,详细考虑 n=2n = 2 的情形.因为 a11a21=1=a12a22a_{11} \mid a_{21} = 1 = a_{12} \mid a_{22} ,如果记 a21=αa_{21} = \alphaa12=βa_{12} = \beta ,则有

A[1αβα1β],A - \left[ \begin{array}{l l} 1 - \alpha & \beta \\ \alpha & 1 - \beta \end{array} \right],

我们想知道,对大的 mmAmA^m 等于什么?如果 A\pmb{A} 是可对角化的,则可以直接计算 AmA^{m} ,从计算 A\pmb{A} 的特征值开始: λ?=1\lambda_{?} = 1λ1=1αβ.\lambda_1 = 1 - \alpha -\beta . 因为 0α,β10\leqslant \alpha ,\beta \leqslant 1 ,所以 λ2=1λ1=1αβ\lambda_{2} = 1\geqslant |\lambda_{1}| = |1 - \alpha -\beta | 于是有 1=λ2=ρ(A)1 = |\lambda_2| = \rho (A)AA 的谱半径是 AA 的一个特征值.另外,除了在 α=β=0\alpha = \beta = 0 的平凡情形(在这种情形, AA 是可约矩阵)以外,我们看到 λ2=ρ(A)\lambda_{2} = \rho (A)AA 的单重特征值.

如果 α+β0\alpha + \beta \neq 0 ,相应的特征向量是 x=[β,α]Tx = [\beta, \alpha]^T (对于 λ0=1\lambda_0 = 1 )和 z=[1,1]Tz = [1, -1]^T (对于 λ1\lambda_1 ),所以在这种情形 AA 是可对角化的且 A=SAS1A = SAS^{-1} ,其中

Λ=[1001αβ],S=[β1α1]S1=1α+β[11αβ].\Lambda = \left[ \begin{array}{l l} 1 & 0 \\ 0 & 1 - \alpha - \beta \end{array} \right], \quad S = \left[ \begin{array}{l l} \beta & 1 \\ \alpha & - 1 \end{array} \right] \quad \text {和} \quad S ^ {- 1} = \frac {1}{\alpha + \beta} \Big [ \begin{array}{l l} 1 & 1 \\ \alpha & - \beta \end{array} \Big ].

注意,如果 AA 是不可约的,则特征向量 xx 的分量是非负的和正的。

如果 α\alphaβ\beta 不都是1,则 λ1=1αβ<1|\lambda_1| = |1 - \alpha \cdot \beta| < 1 ,因而当 mm \to \inftyλ1m0\lambda_1^{m} \to 0 。因此,在这种情形,有

limmAm=S(limmAm)S1=S[1000]S1α+β[ββαα],\lim _ {m \rightarrow} A ^ {m} = S (\lim _ {m \rightarrow} A ^ {m}) S ^ {- 1} = S \left[\begin{array}{l l}1&0\\0&0\end{array}\right] S ^ {\prime} - \frac {1}{\alpha + \beta} \left[\begin{array}{l l}\beta&\beta\\\alpha&\alpha\end{array}\right],

因而平衡人口分布是

limmp(m)=1α+β[ββαα][p1(0)p2(0)]=1α+β[βα].\lim _ {m \rightarrow \infty} p ^ {(m)} = \frac {1}{\alpha + \beta} \left[\begin{array}{l l}\beta&\beta\\\alpha&\alpha\end{array}\right]\left[\begin{array}{l}p _ {1} ^ {(0)}\\p _ {2} ^ {(0)}\end{array}\right] = \frac {1}{\alpha + \beta} \left[\begin{array}{l}\beta\\\alpha\end{array}\right].

注意,平衡分布完全与初始分布无关。矩阵 AmA^{m} 趋近于一个极限,这个极限的各列与相应于特征值1(它是 AA 的谱半径)的特征向量 x\pmb{x} 成正比,而极限人口分布与这同一个特征向量成正比。

对于上面没有处理的两种例外情形不难逐一分析。如果 α=β=0\alpha = \beta = 0 ,则 A=IA = IlimmAm=I\lim_{m \to \infty} A^m = I ,且 limmp(m)=p(0)\lim_{m \to \infty} p^{(m)} = p^{(0)} ,所以极限分布与初始分布不是无关的。

如果 α=β÷1\alpha = \beta \div 1 ,则 A=[0110]A = \begin{bmatrix} 0 & 1 \\ 1 & 0 \end{bmatrix} 且两个城市逐日调换它们的全部人口。A 的幂不趋近于一个极限,并且,如果初始人口分布是不平衡的,则人口分布也无极限。但是,在“均值平衡”的意义下,它们都可达到一个极限,即

limm1mk=1mAk=[.5.5.5.5]limm1mk=1mp(k)=p1(0)+p2(0)2[11].\lim _ {m \to \infty} {\frac {1}{m}} \sum_ {k = 1} ^ {m} A ^ {k} = {\left[ \begin{array}{l l} {. 5} & {. 5} \\ {. 5} & {. 5} \end{array} \right]} \quad {\text {和}} \quad \lim _ {m \to \infty} {\frac {1}{m}} \sum_ {k = 1} ^ {m} p ^ {(k)} = {\frac {p _ {1} ^ {(0)} + p _ {2} ^ {(0)}}{2}} {\left[ \begin{array}{l} {1} \\ {1} \end{array} \right]}.

总之,从这个例子得知, ρ(A)=1\rho(A) = 1 ,并且:

  1. 谱半径 ρ(A)=1\rho(A) = 1 本身是 AA 的特征值,而它不只是特征值的绝对值。

  2. 相应于特征值 ρ(A)\rho(A) 的特征向量 xx 可以取非负分量,如果 AA 是不可约的,则分量是正的。

  3. 如果 AA 的所有元都是正的,则 ρ(A)\rho(A) 是具有严格最大模的单重特征值。

  4. 如果 AA 的所有元是正的,则 limπ[A/ρ(A)]m\lim_{\pi \to \infty}[A / \rho(A)]^m 存在,且是秩1矩阵,它的所有列与特征向量 xx 成正比。

  5. 在所有情形 limm(1/m)k=1m(A/ρ(A))k\lim_{m\to \infty}(1 / m)\sum_{k = 1}^{m}(A / \rho (A))^k 存在.

实际上这些结论一般对 n2n \geqslant 2 是成立的,不过用上而所述的简单而直接的方法不可能分析研究一般情形。例如,当 n2n \geqslant 2 时,即使 AA 的所有元素都是正的, AA 也不一定可对角化。这就需要新的工具,这正是本章的其余部分要阐述的内容。

习题

  1. 证明,矩阵 A=[1101]A = \begin{bmatrix} 1 & 1 \\ 0 & 1 \end{bmatrix} 有谱半径 1,但是当 mm \to \inftyAmA^m 无界。

  2. 考虑矩阵

Aε=[11+ε11+εε21+ε11+ε],ε>0.A _ {\varepsilon} = \left[ \begin{array}{l l} \frac {1}{1 + \varepsilon} & \frac {1}{1 + \varepsilon} \\ \frac {\varepsilon^ {2}}{1 + \varepsilon} & \frac {1}{1 + \varepsilon} \end{array} \right], \quad \varepsilon > 0.

(a) 证明, λ2=1\lambda_{2} = 1AϵA_{\epsilon} 的单重特征值, ρ(A)=λ2=1\rho(A) = \lambda_{2} = 1 , 且 1>λ11 > |\lambda_{1}| . (b) 证明

x=11+ε[ε1]y=1+ε2ε[1ε]x = \frac {1}{1 + \varepsilon} \Big [ _ {\varepsilon} ^ {1} \Big ] \quad \text {和} \quad y = \frac {1 + \varepsilon} {2 \varepsilon} \Big [ _ {1} ^ {\varepsilon} \Big ]

分别是 AεA_{\varepsilon}AεTA_{\varepsilon}^{\mathrm{T}} 相应于特征值 λ=1\lambda = 1 的特征向量.(c)直接计算 AεmA_{\varepsilon}^{m}m=1m = 1 ,2,….(d)证明

limm,Aεm=12[1ε1ε1].\lim _ {m \rightarrow}, A _ {\varepsilon} ^ {m} = \frac {1}{2} \left[\begin{array}{l l}1&\varepsilon^ {1}\\\varepsilon&1\end{array}\right].

(e)计算 xyTxy^T ,并作出说明.(f)如果 ε0\varepsilon \to 0 ,会出现什么情形?提示:令 Bε=(1+ε)AεB_{\varepsilon} = (1 + \varepsilon)A_{\varepsilon} ,然后如正文中那样对角化 BεB_{\varepsilon}

  1. 从人口自由流动的观点来说明,由城市间的人口流动系数组成的一般矩阵是不可约的意味着什么。

  2. 对于在本节中所讨论过的两个城市的例子,试证明,在 α=β=0\alpha = \beta = 0 以及 α+β0\alpha + \beta \neq 0 的情形下 limm(1/m)k=1mAk\lim_{m \to \infty} (1 / m) \sum_{k=1}^{m} A^k 存在。在每种情形下的极限各是什么?

进一步阅读 关于正定矩阵和非负矩阵的性质的丰富信息,以及许多理论与应用的参考文献可见[BPI]和[Sen]. 在[Var]中,有一个特别注重数值分析应用的关于非负矩阵的诸多结果的综述.

8.0_导引 - 矩阵分析 | OpenTech