5.7 关于矩阵的向量范数 关于向量范数的所有公理虽然对于矩阵“大小”这一有用概念是必需的,但是,对于某些重要的应用来说,其中的矩阵范数的次乘性公理(4)不是必不可少的。例如,非常有用的极限(5.6.14)实际上对比向量范数更--般的函数类仍成立,而不只限于矩阵范数。为此,在这里着
重讨论关于矩阵的向量范数,即向量空间 M n M_{n} M n 上的向量范数(它可能没有次乘性质)。这样的范数常常称为广义矩阵范数。我们将用 ∥ ⋅ ∥ \| \cdot \| ∥ ⋅ ∥ 或用 G ( ⋅ ) G(\cdot) G ( ⋅ ) 表示 M n M_{n} M n 上一般的向量范数,并且从 M n M_{n} M n 上的某些向量范数的例子开始。它们可能是,也可能不是矩阵范数。
例1 如果 G ( ⋅ ) G(\cdot) G ( ⋅ ) 是 M n M_{n} M n 上的向量范数,又如果 T , S ∈ M n T, S \in M_{n} T , S ∈ M n 是非奇异矩阵,则
( G I , S ( A ) ≡ G ( T A S ) , A ∈ M n (5.7.1) \left(G _ {I, S} (A) \equiv G (T A S), A \in M _ {n} \right. \tag {5.7.1} ( G I , S ( A ) ≡ G ( T A S ) , A ∈ M n ( 5.7.1 ) 是 M i M_{i} M i 上的向量范数,即使 G ( ⋅ ) \mathbf{G}(\cdot) G ( ⋅ ) 是矩阵范数, G i , ( ⋅ ) G_{i}, (\cdot) G i , ( ⋅ ) 也不一定有次乘性质.
[320] 练习 证明(5.7.1)中的 G ℓ , ∙ ( ⋅ ) G_{\ell, \bullet}(\cdot) G ℓ , ∙ ( ⋅ ) 总是 M n M^n M n 七的向量范数.
练习 设 S − T − 1 2 I S - T - \frac{1}{2} I S − T − 2 1 I ,设 G ( ⋅ ) = ∣ ⋅ ∣ G(\cdot) = |\cdot| G ( ⋅ ) = ∣ ⋅ ∣ ,证明 G T , ν ( ⋅ ) G_{T, \nu}(\cdot) G T , ν ( ⋅ ) 不是矩阵范数。
练习·证明,如果 G ( ⋅ ) G(\cdot) G ( ⋅ ) 是矩阵范数,且 T − S − 1 T - S^{-1} T − S − 1 ,则 G I , S ( ⋅ ) G_{I,S}(\cdot) G I , S ( ⋅ ) 是矩阵范数。
例2 两个同阶矩阵 A − [ a i j ] A - [a_{ij}] A − [ a ij ] 和 B = [ b i j ] B = [b_{ij}] B = [ b ij ] 的 Hadamard 乘积正好是它们的对应元素的乘积 A ⋅ B = [ a i j b i j ] A \cdot B = [a_{ij}b_{ij}] A ⋅ B = [ a ij b ij ] . 如果 I I ∈ M n II \in M_n II ∈ M n 是没有零元素的已知矩阵, G ( ⋅ ) G(\cdot) G ( ⋅ ) 是 M n M_n M n 上的任意向量范数, 则
( r ˙ H ( A ) = G ( H ⋅ A ) ) (5.7.2) \left(\dot {r} _ {H} (A) = G (H \cdot A)\right) \tag {5.7.2} ( r ˙ H ( A ) = G ( H ⋅ A ) ) ( 5.7.2 ) 是 M n M_{n} M n 上的向量范数。即使 ( G ( ⋅ ) (G(\cdot) ( G ( ⋅ ) 是矩阵范数, G n ( ⋅ ) G_{n}(\cdot) G n ( ⋅ ) 也不一定有次乘性质。
练习 证明(5.7.2)中的 G H ( ⋅ ) G_{H}(\cdot) G H ( ⋅ ) 总是向量范数。
练习 证明(5.7.2)中的 G I I ( ⋅ ) G_{II}(\cdot) G II ( ⋅ ) 是,或者不是矩阵范数,取决于对 H H H 的选择。考虑矩阵范数 G ( ⋅ ) = ∥ ⋅ ∥ 1 G(\cdot) = \left\| \cdot \right\|_1 G ( ⋅ ) = ∥ ⋅ ∥ 1 。及 Hadamard 乘子矩阵
H 1 = [ 1 1 1 1 ] 或 H 2 = [ 2 1 1 2 ] (5.7.3) H _ {1} = \left[ \begin{array}{l l} 1 & 1 \\ 1 & 1 \end{array} \right] \text {或} H _ {2} = \left[ \begin{array}{l l} 2 & 1 \\ 1 & 2 \end{array} \right] \tag {5.7.3} H 1 = [ 1 1 1 1 ] 或 H 2 = [ 2 1 1 2 ] ( 5.7.3 ) 你可能想考察
A = [ 0 1 0 0 ] , B = [ 70 0 − 1 0 ] 和 A B . (5.7.4) A = \left[ \begin{array}{l l} 0 & 1 \\ 0 & 0 \end{array} \right], B = \left[ \begin{array}{l l} 7 0 & 0 \\ - 1 & 0 \end{array} \right] \text {和} A B. \tag {5.7.4} A = [ 0 0 1 0 ] , B = [ 70 − 1 0 0 ] 和 A B . ( 5.7.4 ) 注意 G H 1 ( C ) ⩽ G H 2 ( C ) G_{H_1}(C) \leqslant G_{H_2}(C) G H 1 ( C ) ⩽ G H 2 ( C ) 对所有 C ∈ M 2 C \in M_2 C ∈ M 2 成立.
例3 函数
G 1 b + c d ] = 1 2 [ a + d + ∣ a d d ∣ + ∣ b ∣ + ∣ c ∣ ] (5.7.5) \left. \begin{array}{l l} G _ {1} & b \\ + c & d \end{array} \right] = \frac {1}{2} \left[ \begin{array}{l l} a + d & + | a \\ & d \end{array} \right. \quad d \mid + | b | + | c | ] \tag {5.7.5} G 1 + c b d ] = 2 1 [ a + d + ∣ a d d ∣ + ∣ b ∣ + ∣ c ∣ ] ( 5.7.5 ) 是 M 2 M_2 M 2 上的向量范数.
练习 证明(5.7.5)中的 G ( ⋅ ) G(\cdot) G ( ⋅ ) 是向量范数,但不是矩阵范数。你可能想考察(5.7.4)中的矩阵。
例4 如果 A ∈ M n A \in M_{n} A ∈ M n 是给定的矩阵,则集合 F ( A ) ≡ { x ∗ A x : x ∈ C n 且 x ∗ x = 1 } F(A) \equiv \{x^{*}Ax : x \in \mathbf{C}^{n} \text{ 且 } x^{*}x = 1\} F ( A ) ≡ { x ∗ A x : x ∈ C n 且 x ∗ x = 1 } 称为 A A A 的值域或数值范围,而函数
r ( A ) − max z ′ = 1 ∣ x x A x ∣ − max z ∈ F ( 3 ) ∣ z ∣ (5.7.6) r (A) - \max _ {z ^ {\prime} = 1} | x ^ {x} A x | - \max _ {z \in F (3)} | z | \tag {5.7.6} r ( A ) − z ′ = 1 max ∣ x x A x ∣ − z ∈ F ( 3 ) max ∣ z ∣ ( 5.7.6 ) 称为 A A A 的数值半径.
练习 证明数值半径 r ( A ) r(A) r ( A ) 是 M n M_n M n 上的向量范数。提示:较难验证的部分只有正定性公理(la);见(4.1)节,习题6。但是,数值半径不是矩阵范数。见习题10。
例5 M n M_{n} M n 上的 I \pmb{I} I 、向量范数是
∥ A ∥ ≡ max 1 ≤ i , j , n ∣ a i j ∣ . (5.7.7) \| A \| \equiv \max _ {1 \leq i, j, n} | a _ {i j} |. \tag {5.7.7} ∥ A ∥ ≡ 1 ≤ i , j , n max ∣ a ij ∣. ( 5.7.7 ) 在(5.6)节中已经知道, ∥ ⋅ ∥ \| \cdot \| ∥ ⋅ ∥ 是 M n M_{n} M n 上的向量范数而不是矩阵范数,不过 n ∥ ⋅ ∥ n \parallel \cdot \parallel n ∥ ⋅ ∥ 是矩阵范数。
上述几个例子足以说明, M n M_{n} M n 确实有许多向量范数不是矩阵范数。此外,在这些范数中,有些同时具有从次乘性得来的某些矩阵范数性质,有些则不具有。但是,从 M n M_{n} M n 上的每个向量范数等价于任一矩阵范数(在它们有相同的收敛序列的意义下);事实上,一个更为一般的结果可直接由定理(5.4.4)得到。
5.7.8 定理 设 f f f 是 M n M_{n} M n 上的准范数,即 M n M_{n} M n 上正定、齐次和连续的实值函数,另外设 ⋅ \cdot ⋅ 是 M n M_{n} M n 上给定的矩阵范数,则存在有限正常数 C m C_{m} C m 和 C M C_{M} C M ,使得
C m ∣ A ′ ∣ ⩽ f ( A ) ⩽ C M ∣ A ′ ∣ (5.7.9) C _ {m} \left| A ^ {\prime} \right| \leqslant f (A) \leqslant C _ {M} \left| A ^ {\prime} \right| \tag {5.7.9} C m ∣ A ′ ∣ ⩽ f ( A ) ⩽ C M ∣ A ′ ∣ ( 5.7.9 ) 对所有 A ∈ M n A \in M_{n} A ∈ M n 成立,特别是当 f ( ⋅ ) f(\cdot) f ( ⋅ ) 是 M n M_{n} M n 上的向量范数时,这两个不等式成立。
如果把有关矩阵范数的结论推广到关于矩阵的向量范数或更一般地推广到关于矩阵的准向量范数,不等式(5.7.9)是很有用的。例如,极限(5.6.14)就可以在这个意义下推广。
5.7.10 推论 如果 f f f 是 M n M_{n} M n 上的准范数,则对所有 A ∈ M n A \in M_{n} A ∈ M n , lim k → ∞ [ f ( A k ) ] 1 − k \lim_{k \to \infty} [f(A^{k})]^{1 - k} lim k → ∞ [ f ( A k ) ] 1 − k 存在,且对所有 A ∈ M n A \in M_{n} A ∈ M n ,
lim k → ∞ [ f ( A k ) ] 1 k = ρ ( A ) . \lim _ {k \rightarrow \infty} [ f (A ^ {k}) ] ^ {1 k} = \rho (A). k → ∞ lim [ f ( A k ) ] 1 k = ρ ( A ) . 特别是, f ( ⋅ ) f(\cdot) f ( ⋅ ) 是 M n M_{n} M n 上的向量范数时,这个极限成立.
证明:设 ∥ ⋅ ∥ \| \cdot \| ∥ ⋅ ∥ 是 M n M_{n} M n 上的矩阵范数,考虑不等式
C m ∥ A k ∥ ⩽ f ( A k ) ⩽ C M ∥ A k ∥ , (322) C _ {m} \left\| A ^ {k} \right\| \leqslant f \left(A ^ {k}\right) \leqslant C _ {M} \left\| A ^ {k} \right\|, \tag {322} C m A k ⩽ f ( A k ) ⩽ C M A k , ( 322 ) 它蕴涵
C m 1 , k ∥ A k ∥ 1 , k ⩽ f ( A k ) ] 1 , k ⩽ C M 1 , k ∥ A k ∥ 2 , k , C _ {m} ^ {1, k} \left\| A ^ {k} \right\| ^ {1, k} \leqslant f (A ^ {k}) ] ^ {1, k} \leqslant C _ {M} ^ {1, k} \| A ^ {k} \| ^ {2, k}, C m 1 , k A k 1 , k ⩽ f ( A k ) ] 1 , k ⩽ C M 1 , k ∥ A k ∥ 2 , k , 其中 k = 1 , 2 , 3 , … k = 1,2,3,\dots k = 1 , 2 , 3 , … ,但是,当 k → ∞ k\to \infty k → ∞ 时, C m 1 , k → 1 C_{m}^{1,k}\rightarrow 1 C m 1 , k → 1 , C M η k → 1 C_M^{\eta_k}\rightarrow 1 C M η k → 1 和 ∥ A k ∥ 1 / k → ρ ( A ) \| A^k\|^{1 / k}\rightarrow \rho (A) ∥ A k ∥ 1/ k → ρ ( A ) ,所以我们得知, lim k → ∞ [ f ( A k ) ] 1 / k \lim_{k\to \infty}[f(A^k)]^{1 / k} lim k → ∞ [ f ( A k ) ] 1/ k 存在且等于 ρ ( A ) \rho (A) ρ ( A )
在另一种意义下, M n M_{n} M n 上的任一个向量范数都等价于一个矩阵范数,这在前面的例5中已举例作了说明。可以用常数因子 n n n 修改向量范数 ∥ ⋅ ∥ \| \cdot \| ∥ ⋅ ∥ 使它成矩阵范数。这种情况不是偶然的:每个向量范数都可以这样修改。
5.7.11 定理 对于 M n M_{n} M n 上每个向量范数 G ( ⋅ ) G(\cdot) G ( ⋅ ) ,存在有限正常数 c ( G ) c(G) c ( G ) ,使得 c ( G ) G ( ⋅ ) c(G)G(\cdot) c ( G ) G ( ⋅ ) 是 M n M_{n} M n 上的矩阵范数。如果 ∥ ⋅ ∥ \| \cdot \| ∥ ⋅ ∥ 是 M n M_{n} M n 上的矩阵范数,又如果对所有 A ∈ M n A \in M_{n} A ∈ M n 有
C m ∥ A i t ⩽ G ( A ) ⩽ C M ∥ A ∥ , (5.7.11a) C _ {m} \| A _ {i t} \leqslant G (A) \leqslant C _ {M} \| A \|, \tag {5.7.11a} C m ∥ A i t ⩽ G ( A ) ⩽ C M ∥ A ∥ , ( 5.7.11a ) 则
c ( G ) ⩽ C M C m 2 . c (G) \leqslant \frac {C _ {M}}{C _ {m} ^ {2}}. c ( G ) ⩽ C m 2 C M . 此外,存在一个矩阵范数,使得关于 ( G ) (G) ( G ) 的这个上界是可以达到的,所以
( C ( G ) = min { C M C m v i o l : ∥ ⋅ ∥ 是 矩 阵 范 数 且 (5 . 7 . 1 1 a)成 立 } . \left. \right.\left(C (G) = \min \left\{\frac {C _ {M}}{C _ {m} ^ {\mathrm {v i o l}}} : \| \cdot \| \text {是 矩 阵 范 数 且 (5 . 7 . 1 1 a)} \text {成 立} \right\}. \right. ( C ( G ) = min { C m viol C M : ∥ ⋅ ∥ 是 矩 阵 范 数 且 (5 . 7 . 1 1 a) 成 立 } . 证明:对任意 c > 0 c > 0 c > 0 ,函数 ∥ ⋅ ∥ = c G ( ⋅ ) \| \cdot \| = cG(\cdot) ∥ ⋅ ∥ = c G ( ⋅ ) 可能不满足次乘性公理,但它满足矩阵范数的所有其他公理.此外,很容易从 G ( ⋅ ) G(\cdot) G ( ⋅ ) 的连续性和 G ( ⋅ ) G(\cdot) G ( ⋅ ) 的单位球的紧性推导出
c ( G ) ≡ max A ≠ 0 ≠ B G ( A B ) G ( A ) G ( B ) = max ( A ) = 1 = G ( B ) G ( A B ) c (G) \equiv \max _ {A \neq 0 \neq B} \frac {G (A B)}{G (A) G (B)} = \max _ {(A) = 1 = G (B)} G (A B) c ( G ) ≡ A = 0 = B max G ( A ) G ( B ) G ( A B ) = ( A ) = 1 = G ( B ) max G ( A B ) 是有限正数。于是,对所有 A , B ∈ M n A, B \in M_n A , B ∈ M n
G ( A B ) ⩽ c ( G ) G ( A ) G ( B ) 和 c ( G ) G ( A B ) ⩽ c ( G ) G ( A ) c ( G ) G ( B ) G (A B) \leqslant c (G) G (A) G (B) \text {和} c (G) G (A B) \leqslant c (G) G (A) c (G) G (B) G ( A B ) ⩽ c ( G ) G ( A ) G ( B ) 和 c ( G ) G ( A B ) ⩽ c ( G ) G ( A ) c ( G ) G ( B ) 假定 ⋅ \cdot ⋅ 是 M n M_{n} M n 上的矩阵范数,且假定给出了 G ( ⋅ ) G(\cdot) G ( ⋅ ) 与 ∥ ⋅ ∥ \| \cdot \| ∥ ⋅ ∥ 间的不等式.于是
G ( A B ) ⩽ C M ∥ A B ∥ ⩽ C M ∥ A ∥ ∥ B ∥ ⩽ C M C m 2 G ( A ) G ( B ) , G (A B) \leqslant C _ {M} \| A B \| \leqslant C _ {M} \| A \| \| B \| \leqslant \frac {C _ {M}}{C _ {m} ^ {2}} G (A) G (B), G ( A B ) ⩽ C M ∥ A B ∥ ⩽ C M ∥ A ∥∥ B ∥ ⩽ C m 2 C M G ( A ) G ( B ) , 323 因而
c ( G ) ⩽ C M C m 2 . c (G) \leqslant \frac {C _ {M}}{C _ {m} ^ {2}}. c ( G ) ⩽ C m 2 C M . 如果我们特别选取矩范阵数 ∥ ⋅ ∥ = c ( G ) G ( ⋅ ) \| \cdot \| = c(G)G(\cdot) ∥ ⋅ ∥ = c ( G ) G ( ⋅ ) ,则 C M = c ( G ) C_M = c(G) C M = c ( G ) ,且 C m = 1 / c ( G ) C_m = 1 / c(G) C m = 1/ c ( G ) ,所以 C M / C m 2 = c ( G ) C_M / C_m^2 = c(G) C M / C m 2 = c ( G ) 。
练习 证明,如果 k ⩾ c ( G ) k \geqslant c(G) k ⩾ c ( G ) ,则 k G ( ⋅ ) kG(\cdot) k G ( ⋅ ) 是矩阵范数。特别地,证明 C M G ( ⋅ ) / C m 2 C_{M}G(\cdot) / C_{m}^{2} C M G ( ⋅ ) / C m 2 总是矩阵范数。
练习 试直接由(5.7.11)推导出(5.7.10)中的有关向量范数的结果。
矩阵范数次乘性的一个推论是下述事实:相应于 M n M_{n} M n 上的每种矩阵范数,都有 C n \mathbf{C}^{n} C n 上的某个相容向量范数。次乘性的另一个推论是,对每个矩阵范数 ∥ ⋅ ∥ \| \cdot \| ∥ ⋅ ∥ 有 ∥ A ∥ ⩾ ρ ( A ) \| A \| \geqslant \rho(A) ∥ A ∥ ⩾ ρ ( A ) ; M n M_{n} M n 上的向量范数 G ( ⋅ ) G(\cdot) G ( ⋅ ) 如果对所有 A ∈ M n A \in M_{n} A ∈ M n 有 ∥ A ∥ ⩾ ρ ( A ) \| A \| \geqslant \rho(A) ∥ A ∥ ⩾ ρ ( A ) ,就称它为谱优势的。有趣的是 M n M_{n} M n 上的有些向量范数在 C n \mathbf{C}^{n} C n 上有相容向量范数,而有些则没有。那些在 C n \mathbf{C}^{n} C n 上没有相容的向量范数的广义范数当中,有些是谱优势的,而有些则不是。于是, M n M_{n} M n 上的向量范数在 C n \mathbf{C}^{n} C n 上可能有相容的向量范数,而它又不是矩阵范数。
5.7.12 定义 C n \mathbf{C}^n C n 上的向量范数 ∥ ⋅ ∥ \|\cdot\| ∥ ⋅ ∥ 称为与 M n M_n M n 上的向量范数 G ( ⋅ ) G(\cdot) G ( ⋅ ) 是相容的,指的是对所有 x ∈ C n x \in \mathbf{C}^n x ∈ C n 和所有 A ∈ M n A \in M_n A ∈ M n 有
∥ A x ∥ ⩽ G ( Λ ) ∥ x ∥ . \| A x \| \leqslant G (\Lambda) \| x \|. ∥ A x ∥ ⩽ G ( Λ ) ∥ x ∥. 有时采用术语协和的,而有时称向量范数 ∥ ⋅ ∥ \|\cdot\| ∥ ⋅ ∥ 从属于广义矩阵范数 G ( ⋅ ) G(\cdot) G ( ⋅ ) ,在前一节[例如,(5.6.27),(5.6.30)]中,已经述及了这些概念。在这里要特别论述几个有关的结果。
5.7.13 定理 如果 ∥ ⋅ ∥ \| \cdot \| ∥ ⋅ ∥ 是 M n M_{n} M n 上的矩阵范数,则在 C n \mathbf{C}^{n} C n 上存在某个与它相容的向量范数。
证明:如果我们定义 ∥ x ∥ ≡ { [ x 00 … 0 ] } \| x \| \equiv \left\{ \begin{array}{l} [x00\dots 0] \end{array} \right\} ∥ x ∥ ≡ { [ x 00 … 0 ] } ,那么 ∥ A x ∥ = ∥ [ A x 0 … 0 ] ∥ = ∥ A [ x 0 … 0 ] ∥ ⩽ ∥ A ∥ ∥ [ x 0 … 0 ] ∥ = ∥ A ∥ ∥ x ∥ \| Ax \| = \left\| [Ax0\dots 0] \right\| = \left\| A[x0\dots 0] \right\| \leqslant \left\| A \right\|\left\| [x0\dots 0] \right\| = \left\| A \right\|\left\| x \right\| ∥ A x ∥ = ∥ [ A x 0 … 0 ] ∥ = ∥ A [ x 0 … 0 ] ∥ ⩽ ∥ A ∥ ∥ [ x 0 … 0 ] ∥ = ∥ A ∥ ∥ x ∥ 。
我们已经知道了它的逆命题。定理(5.6.2)说明,如果 ∥ ⋅ ∥ \|\cdot\| ∥ ⋅ ∥ 是 C n \mathbf{C}^{n} C n 上给定的向量范数,则存在与它相容的矩阵范数[诱导范数(5.6.1)]。
练习 试说明由(5.7.13)确保的 C n \mathbf{C}^n C n 上的相容向量范数不一定唯一。实际上, ∥ x ∥ ≡ ∥ [ x x ⋯ x ] ∥ \| x \| \equiv \left\| [x x \cdots x] \right\| ∥ x ∥ ≡ ∥ [ xx ⋯ x ] ∥ 也是可行的,因为对任意非零向量 y ∈ C n y \in \mathbf{C}^n y ∈ C n 有 ∥ x ∥ ≡ ∥ x ∗ y ∥ \| x \| \equiv \left\| x^* y \right\| ∥ x ∥ ≡ ∥ x ∗ y ∥ 。
5.7.14 定理 设 G ( ⋅ ) G(\cdot) G ( ⋅ ) 是 M n M_{n} M n 上的向量范数,且在 C n \mathbf{C}^{n} C n 上有相容向量范数 ∥ ⋅ ∥ \|\cdot\| ∥ ⋅ ∥ ,则 G ( A ) ⩾ p ( A ) G(A) \geqslant_{p}(A) G ( A ) ⩾ p ( A ) 对所有 A ∈ M n A \in M_{n} A ∈ M n 成立。更一般地,
G ( A 1 ) G ( A 2 ) … G ( A k ) ⩾ ρ ( A 1 A 2 … A k ) (5.7.15) G \left(A _ {1}\right) G \left(A _ {2}\right) \dots G \left(A _ {k}\right) \geqslant \rho \left(A _ {1} A _ {2} \dots A _ {k}\right) \tag {5.7.15} G ( A 1 ) G ( A 2 ) … G ( A k ) ⩾ ρ ( A 1 A 2 … A k ) ( 5.7.15 ) 对所有 A 1 , A 2 , ⋯ , A k ∈ M n A_{1}, A_{2}, \cdots, A_{k} \in M_{n} A 1 , A 2 , ⋯ , A k ∈ M n 和所有 k = 1 , 2 , ⋯ k = 1, 2, \cdots k = 1 , 2 , ⋯ 成立.
证明:假定 k = 2 k = 2 k = 2 ,且设 x ∈ C n x\in \mathbf{C}^n x ∈ C n 是适合 A 1 A 2 , x = λ x A_{1}A_{2},x = \lambda x A 1 A 2 , x = λ x 的非零向量,其中 ∣ λ ∣ = ρ ( A 1 A 2 ) \mid \lambda \mid = \rho (A_1A_2) ∣ λ ∣= ρ ( A 1 A 2 ) ,则
ρ ( A 1 A 2 ) ∥ x ∥ = ∥ λ r ∥ = ∣ A 1 A 2 x ∥ = ∥ A 1 ( A 2 x ) ∥ ⩽ G ( A 1 ) ∥ A 2 x ∥ ⩽ G ( A 1 ) G ( A 2 ) ∥ x ∥ . \begin{array}{l} \rho \left(A _ {1} A _ {2}\right) \| x \| = \| \lambda r \| = | A _ {1} A _ {2} x \| \\ = \| A _ {1} \left(A _ {2} x\right) \| \leqslant G \left(A _ {1}\right) \| A _ {2} x \| \leqslant G \left(A _ {1}\right) G \left(A _ {2}\right) \| x \|. \\ \end{array} ρ ( A 1 A 2 ) ∥ x ∥ = ∥ λ r ∥ = ∣ A 1 A 2 x ∥ = ∥ A 1 ( A 2 x ) ∥ ⩽ G ( A 1 ) ∥ A 2 x ∥ ⩽ G ( A 1 ) G ( A 2 ) ∥ x ∥. 因为 ∥ x ∥ ≠ 0 \| x\| \neq 0 ∥ x ∥ = 0 ,由此得出 ρ ( A 1 A 2 ) ⩽ G ( A 1 ) G ( A 2 ) \rho (A_1A_2)\leqslant G(A_1)G(A_2) ρ ( A 1 A 2 ) ⩽ G ( A 1 ) G ( A 2 ) ,类似地用归纳法可以证明一般情形.
什么时候 M n M_{n} M n 上给定的向量范数在 C n \mathbf{C}^n C n 上有相容的向量范数呢?条件(5.7.15)是必要的;为了证明它也是充分条件,需要一个技巧性引理。
5.7.16 引理 设 G ( ⋅ ) G(\cdot) G ( ⋅ ) 是 M n M_{n} M n 上适合(5.7.15)的向量范数,又设 ∥ ⋅ ∥ 2 \| \cdot \|_{2} ∥ ⋅ ∥ 2 表示 M n M_{n} M n 上的谱范数,则存在有限正常数 c − c ( G ) c - c(G) c − c ( G ) ,使得
G ( A 1 ) G ( A 2 ) … G ( A k ) ⩾ c ∣ A 1 A 2 … A k ∥ 2 G \left(A _ {1}\right) G \left(A _ {2}\right) \dots G \left(A _ {k}\right) \geqslant c \left| A _ {1} A _ {2} \dots A _ {k} \right\| _ {2} G ( A 1 ) G ( A 2 ) … G ( A k ) ⩾ c ∣ A 1 A 2 … A k ∥ 2 对所有 Λ 1 , Λ 2 , … , A k ∈ M n \Lambda_{1},\Lambda_{2},\dots ,A_{k}\in M_{n} Λ 1 , Λ 2 , … , A k ∈ M n 和所有 k = 1 , 2 , … k = 1,2,\dots k = 1 , 2 , … 成立.
证明:根据推论(5.1.5),存在有限正常数 b = b ( G ) b = b(G) b = b ( G ) ,使得 ∥ A ∥ 2 ⩾ b G ( A ) \| A\|_{2}\geqslant bG(A) ∥ A ∥ 2 ⩾ b G ( A ) 对所有 A ∈ M n A\in M_n A ∈ M n 成立.设 k k k 是给定的正整数,且设 A 1 , A 2 , … , A k ∈ M n A_{1},A_{2},\dots ,A_{k}\in M_{n} A 1 , A 2 , … , A k ∈ M n 是给定的矩阵.根据奇异值分解定理(7.3.5),有酉矩阵 V V V , W W W 以及对角矩阵 Σ = d i a g ( σ 1 , σ 2 , … , σ n ) \Sigma = \mathrm{diag}(\sigma_1,\sigma_2,\dots ,\sigma_n) Σ = diag ( σ 1 , σ 2 , … , σ n ) ,其中,所有 σ i ⩾ 0 \sigma_i\geqslant 0 σ i ⩾ 0 ,使得 A 1 A 2 … A k = V Σ W ∗ A_{1}A_{2}\dots A_{k} = V\Sigma W^{*} A 1 A 2 … A k = V Σ W ∗ 和 ρ ( Σ ) = max { σ 1 , σ 2 , … , σ n } = ∥ A 1 A 2 … A k ∥ 2 \rho (\Sigma) = \max \{\sigma_1,\sigma_2,\dots ,\sigma_n\} = \| A_1A_2\dots A_k\| _2 ρ ( Σ ) = max { σ 1 , σ 2 , … , σ n } = ∥ A 1 A 2 … A k ∥ 2 根据(5.7.15),有
G ( V ∗ ) G ( A 1 ) G ( A 2 ) … G ( A k ) G ( W ) ⩾ ρ ( V ∗ A 1 A 2 … A k W ) = ρ ( Σ ) = ∥ Σ ∥ 2 = ∥ V ∗ A 1 A 2 … A ⋆ W ∥ 2 = ∣ A 1 A 2 … A k ∣ ∣ 2 . \begin{array}{l} G (V ^ {*}) G \left(A _ {1}\right) G \left(A _ {2}\right) \dots G \left(A _ {k}\right) G (W) \geqslant \rho \left(V ^ {*} A _ {1} A _ {2} \dots A _ {k} W\right) \\ = \rho (\Sigma) \\ = \left\| \Sigma \right\| _ {2} \\ = \left\| V ^ {*} A _ {1} A _ {2} \dots A _ {\star} W \right\| _ {2} \\ = \left| A _ {1} A _ {2} \dots A _ {k} \right| | _ {2}. \\ \end{array} G ( V ∗ ) G ( A 1 ) G ( A 2 ) … G ( A k ) G ( W ) ⩾ ρ ( V ∗ A 1 A 2 … A k W ) = ρ ( Σ ) = ∥ Σ ∥ 2 = ∥ V ∗ A 1 A 2 … A ⋆ W ∥ 2 = ∣ A 1 A 2 … A k ∣ ∣ 2 . 后一个等式成立是因为谱范数是酉不变的,因而得出,
G ( A 1 ) G ( A 2 ) … G ( A k ) ⩾ 1 G ( V ∗ ) G ( W ) ∥ A 1 A 2 … A l ∥ 2 ⩾ b 2 ∥ V ∗ ∥ 2 ∥ W ∥ 2 ∥ A 1 A 2 … A k ∥ 2 = b 2 ∥ A 1 A 2 … A k ∥ 2 . \begin{array}{l} G \left(A _ {1}\right) G \left(A _ {2}\right) \dots G \left(A _ {k}\right) \geqslant \frac {1}{G \left(V ^ {*}\right) G (W)} \| A _ {1} A _ {2} \dots A _ {l} \| _ {2} \geqslant \frac {b ^ {2}}{\| V ^ {*} \| _ {2} \| W \| _ {2}} \| A _ {1} A _ {2} \dots A _ {k} \| _ {2} \\ = b ^ {2} \left\| A _ {1} A _ {2} \dots A _ {k} \right\| _ {2}. \\ \end{array} G ( A 1 ) G ( A 2 ) … G ( A k ) ⩾ G ( V ∗ ) G ( W ) 1 ∥ A 1 A 2 … A l ∥ 2 ⩾ ∥ V ∗ ∥ 2 ∥ W ∥ 2 b 2 ∥ A 1 A 2 … A k ∥ 2 = b 2 ∥ A 1 A 2 … A k ∥ 2 . 如果取 c ≡ b 2 c \equiv b^2 c ≡ b 2 ,引理的结论就证明了。
5.7.17 定理 设 G ( ⋅ ) G(\cdot) G ( ⋅ ) 是 M n M_{n} M n 上的向量范数,则存在 C n \mathbf{C}^n C n 上的向量范数 ∥ ⋅ ∥ \| \cdot \| ∥ ⋅ ∥ 使得
∥ A x ∥ ⩽ G ( A ) ∥ x ∥ \| A x \| \leqslant G (A) \| x \| ∥ A x ∥ ⩽ G ( A ) ∥ x ∥ 对所有 x ∈ C n x \in \mathbf{C}^n x ∈ C n 和所有 A ∈ M n A \in M_n A ∈ M n 成立,当且仅当
G ( A 1 ) G ( A 2 ) … G ( A k ) ⩾ ρ ( A 1 A 2 … A k ) G (A _ {1}) G (A _ {2}) \dots G (A _ {k}) \geqslant \rho (A _ {1} A _ {2} \dots A _ {k}) G ( A 1 ) G ( A 2 ) … G ( A k ) ⩾ ρ ( A 1 A 2 … A k ) 对所有 A 1 , A 2 , ⋯ , A k ∈ M n A_{1}, A_{2}, \cdots, A_{k} \in M_{n} A 1 , A 2 , ⋯ , A k ∈ M n 和所有 k = 1 , 2 , ⋯ k = 1, 2, \cdots k = 1 , 2 , ⋯ 成立.
证明:必要性已在定理(5.7.4)中证明。关于充分性,需要证明,存在 M n M_{n} M n 上的矩阵范数 ∥ ⋅ ∥ \| \cdot \| ∥ ⋅ ∥ 使得 G ( A ) ⩾ ∣ A ∣ G(A) \geqslant |A| G ( A ) ⩾ ∣ A ∣ 对所有 A ∈ M n A \in M_{n} A ∈ M n 成立。设 ∥ ⋅ ∥ \| \cdot \| ∥ ⋅ ∥ 是 C n \mathbf{C}^{n} C n 上与 ∥ ⋅ ∥ \| \cdot \| ∥ ⋅ ∥ 相容的向量范数[定理
(5.7.13) 保证它存在, 且设 x ∈ C n x \in \mathbb{C}^n x ∈ C n 和 A ∈ M n A \in M_n A ∈ M n 是给定的. 因此, 如果能构造出以 G ( ⋅ ) G(\cdot) G ( ⋅ ) 为优势范数的矩阵范数, 就证明了 ∥ A x ∥ ⩽ ∥ A ∥ ∥ x ∥ ⩽ G ( A ) ∥ x ∥ \| Ax \| \leqslant \| A \| \| x \| \leqslant G(A) \| x \| ∥ A x ∥ ⩽ ∥ A ∥∥ x ∥ ⩽ G ( A ) ∥ x ∥ .
对于给定的矩阵 A ∈ M n A \in M_{n} A ∈ M n ,有无数多种方式把 A A A 表示成若干个矩阵的乘积或若干个矩阵的乘积之和。定义
∥ A ∥ ≡ inf { ∑ i G ( A n i ) … G ( A n k i ) : ∑ i A n i … A n k i = A , 且 所 有 A n k j ∈ M n } . \parallel A \parallel \equiv \inf \Big \{\sum_ {i} G (A _ {n i}) \dots G (A _ {n k _ {i}}): \sum_ {i} A _ {n i} \dots A _ {n k _ {i}} = A, \text {且 所 有} A _ {n k _ {j}} \in M _ {n} \Big \}. ∥ A ∥≡ inf { i ∑ G ( A ni ) … G ( A n k i ) : i ∑ A ni … A n k i = A , 且 所 有 A n k j ∈ M n } . 如果 ∑ A i 1 … A i k = A \sum A_{i_1}\dots A_{i_k} = A ∑ A i 1 … A i k = A ,则根据引理(5.7.16)和关于谱范数的三角不等式,有
∑ i G ( A i 1 ) … G ( A i k i ) ⩾ ∑ i c ∥ A i 1 … A i k i ∥ 2 ⩾ c ∥ ∑ i A i 1 … A i k i ∥ 2 = c ∥ A ∥ 2 . \sum_ {i} G \left(A _ {i 1}\right) \dots G \left(A _ {i k _ {i}}\right) \geqslant \sum_ {i} c \| A _ {i 1} \dots A _ {i k _ {i}} \| _ {2} \geqslant c \| \sum_ {i} A _ {i 1} \dots A _ {i k _ {i}} \| _ {2} = c \| A \| _ {2}. i ∑ G ( A i 1 ) … G ( A i k i ) ⩾ i ∑ c ∥ A i 1 … A i k i ∥ 2 ⩾ c ∥ i ∑ A i 1 … A i k i ∥ 2 = c ∥ A ∥ 2 . 由这个不等式可推出,所构造的函数 ∥ ⋅ ∥ \| \cdot \| ∥ ⋅ ∥ 是正定的. ∣ ⋅ ∥ |\cdot \| ∣ ⋅ ∥ 的齐次性可直接从 G ( ⋅ ) G(\cdot) G ( ⋅ ) 的齐次性得出.关于 ∣ ⋅ ∥ |\cdot \| ∣ ⋅ ∥ 的三角不等式和次乘性可由它作为乘积之和的下确界的定义得出. □
练习 详细证明,上述定理中所构造的函数满足三角不等式,且有次乘性质。提示:如果 C = A + B C = A + B C = A + B 或 C = A B C = AB C = A B ,则(分别)作为乘积之和的 A A A 与 B B B 的每个表示式给出 C C C 作为乘积之和的表示式,但是,并非 C C C 的所有这些表示式都以这种形式出现。
练习 考虑 M 2 M_2 M 2 上的向量范数(5.7.5),假如它在 C 2 \mathbf{C}^2 C 2 上有相容向量范数 ∥ ⋅ ∥ \| \cdot \| ∥ ⋅ ∥ ,则可证明
∥ [ 1 0 ] ∥ = ∥ [ 0 1 0 0 ] [ 0 1 ] ∥ ⩽ G [ 0 1 0 0 ] ∥ [ 0 1 ] ∥ , \left\| \left[ \begin{array}{l} 1 \\ 0 \end{array} \right] \right\| = \left\| \left[ \begin{array}{l l} 0 & 1 \\ 0 & 0 \end{array} \right] \left[ \begin{array}{l} 0 \\ 1 \end{array} \right] \right\| \leqslant G \left[ \begin{array}{l l} 0 & 1 \\ 0 & 0 \end{array} \right] \left\| \left[ \begin{array}{l} 0 \\ 1 \end{array} \right] \right\|, [ 1 0 ] = [ 0 0 1 0 ] [ 0 1 ] ⩽ G [ 0 0 1 0 ] [ 0 1 ] , 且
∥ [ 0 1 ] ∥ = ∥ [ 0 0 1 0 ] [ 1 0 ] ∥ ⩽ G [ 0 0 1 0 ] ∥ [ 1 0 ] ∥ , \left\| \left[ \begin{array}{l} 0 \\ 1 \end{array} \right] \right\| = \left\| \left[ \begin{array}{l l} 0 & 0 \\ 1 & 0 \end{array} \right] \left[ \begin{array}{l} 1 \\ 0 \end{array} \right] \right\| \leqslant G \left[ \begin{array}{l l} 0 & 0 \\ 1 & 0 \end{array} \right] \left\| \left[ \begin{array}{l} 1 \\ 0 \end{array} \right] \right\|, [ 0 1 ] = [ 0 1 0 0 ] [ 1 0 ] ⩽ G [ 0 1 0 0 ] [ 1 0 ] , 它蕴涵
∥ [ 1 0 ] ∥ ⩽ G [ 0 1 0 0 ] G [ 0 0 1 0 ] ∥ [ 1 0 ] ∥ , \left\| \left[ \begin{array}{l} 1 \\ 0 \end{array} \right] \right\| \leqslant G \left[ \begin{array}{l l} 0 & 1 \\ 0 & 0 \end{array} \right] G \left[ \begin{array}{l l} 0 & 0 \\ 1 & 0 \end{array} \right] \left\| \left[ \begin{array}{l} 1 \\ 0 \end{array} \right] \right\|, [ 1 0 ] ⩽ G [ 0 0 1 0 ] G [ 0 1 0 0 ] [ 1 0 ] , 因而
1 ⩽ G [ 0 1 0 0 ] G [ 0 0 1 0 ] . 1 \leqslant G \left[ \begin{array}{l l} 0 & 1 \\ 0 & 0 \end{array} \right] G \left[ \begin{array}{l l} 0 & 0 \\ 1 & 0 \end{array} \right]. 1 ⩽ G [ 0 0 1 0 ] G [ 0 1 0 0 ] . 试证明这是不能成立的,由此可知 M 2 M_2 M 2 上的向量范数 G ( ⋅ ) G(\cdot) G ( ⋅ ) 在 C 2 \mathbf{C}^2 C 2 上不可能有相容向量范数.
练习(续)即使 M 7 M_{7} M 7 上的向量范数(5.7.5)在 C 2 \mathbf{C}^2 C 2 上没有任何相容向量范数,也可证明它是谱优势的。试根据定理(5.7.17)进行讨论。
现在,知道了关于 M n M_{n} M n 上的向量范数在 C n \mathbf{C}^{n} C n 上有相容向量范数的有用的必要充分条件。同时也知道,只要在 C n \mathbf{C}^{n} C n 上有一个向量范数,则诱导矩阵范数(5.6.1)就是与它相容的 M n M_{n} M n 上的次乘性向量范数。那么,什么时候 C n \mathbf{C}^{n} C n 上的向量范数在 M n M_{n} M n 上有非次乘性的相容向量范数呢?这样的范数总是有的。
5.7.18 定理 设 ∥ ⋅ ∥ \|\cdot\| ∥ ⋅ ∥ 是 C n \mathbb{C}^n C n 上给定的向量范数, 则在 M n M_n M n 上存在不是矩阵范数的向量范数 G ( ⋅ ) G(\cdot) G ( ⋅ ) , 使得
∥ A x ∥ ⩽ G ( A ) ∥ x ∥ \| A x \| \leqslant G (A) \| x \| ∥ A x ∥ ⩽ G ( A ) ∥ x ∥ 对所有的 x ∈ C n x \in \mathbf{C}^n x ∈ C n 和 A ∈ M n A \in M_n A ∈ M n 成立.
证明:设 P ∈ M n P \in M_{n} P ∈ M n 是具有零主对角线的任一置换矩阵,例如, P = [ p i j ] P = [p_{ij}] P = [ p ij ] ,其中,如果 j = i + 1 j = i + 1 j = i + 1 ,或 i = n i = n i = n 且 j = 1 j = 1 j = 1 ,则 p i j = 1 p_{ij} = 1 p ij = 1 ;否则, p i j = 0 p_{ij} = 0 p ij = 0 。设 ∥ ⋅ ∥ \|\cdot\| ∥ ⋅ ∥ 表示 M n M_{n} M n 上由向量范数 ∥ ⋅ ∥ \|\cdot\| ∥ ⋅ ∥ [通过(5.6.1)]诱导的矩始阵数。在 M n M_{n} M n 上定义 G ( ⋅ ) G(\cdot) G ( ⋅ ) 为
G ( A ) ≡ ∣ A ∥ + ∥ P ∥ ∥ P T ∥ max 1 ⩽ i ⩽ n ∣ a n ∣ . G (A) \equiv | A \| + \| P \| \| P ^ {T} \| \max _ {1 \leqslant i \leqslant n} | a _ {n} |. G ( A ) ≡ ∣ A ∥ + ∥ P ∥∥ P T ∥ 1 ⩽ i ⩽ n max ∣ a n ∣. 显然, G ( ⋅ ) G(\cdot) G ( ⋅ ) 是 M n M_{n} M n 上的向量范数, G ( A ) ⩾ ∥ A ∥ G(A)\geqslant \parallel A\parallel G ( A ) ⩾ ∥ A ∥ 对所有 A ∈ M n A\in M_n A ∈ M n 成立,且
∥ A x ∥ ⩽ ∥ A ∥ ∥ x ∥ ⩽ G ( A ) ∥ x ∥ \left\| A x \right\| \leqslant \left\| A \right\| \left\| x \right\| \leqslant G (A) \| x \| ∥ A x ∥ ⩽ ∥ A ∥ ∥ x ∥ ⩽ G ( A ) ∥ x ∥ 对所有 A ∈ M n A \in M_{n} A ∈ M n 和所有 x ∈ C n x \in \mathbf{C}^{n} x ∈ C n 成立. 但是,
G ( P P T ) = G ( I ) = ∥ I ∣ + ∥ P ∣ ∥ P Γ ∥ = 1 + ∥ P ∣ ∥ P ⊤ ∥ G ( P ) = ∥ P ∥ G ( P T ) = ∣ P T ∣ G ( P P T ) > G ( P ) G ( P T ) . \begin{array}{l} G \left(P P ^ {T}\right) = G (I) = \left\| I \right\vert + \left\| P \right\vert \left\| P ^ {\Gamma} \right\| = 1 + \left\| P \right\vert \left\| P ^ {\top} \right\| \\ G (P) = \left\| P \right\| \\ G \left(P ^ {T}\right) = \left| P ^ {T} \right| \\ G \left(P P ^ {T}\right) > G (P) G \left(P ^ {T}\right). \\ \end{array} G ( P P T ) = G ( I ) = ∥ I ∣ + ∥ P ∣ P Γ = 1 + ∥ P ∣ P ⊤ G ( P ) = ∥ P ∥ G ( P T ) = P T G ( P P T ) > G ( P ) G ( P T ) . 因此, M n M_{n} M n 上的范数 G ( ⋅ ) G(\cdot) G ( ⋅ ) 与 C n \mathbf{C}^{n} C n 上给定的向量范数 ∥ ⋅ ∥ \| \cdot \| ∥ ⋅ ∥ 相容,而它不是次乘性范数。
练习 设 A = [ a i j ] ∈ M n A = [a_{ij}] \in M_n A = [ a ij ] ∈ M n ,考虑极大行和矩阵范数的下述变更:
∥ A ∥ : ≡ ∥ A + diag ( a 11 , a 22 , … a m ) ∥ ∞ . \| A \|: \equiv \| A + \operatorname {d i a g} (a _ {1 1}, a _ {2 2}, \dots a _ {m}) \| _ {\infty}. ∥ A ∥ :≡ ∥ A + diag ( a 11 , a 22 , … a m ) ∥ ∞ . 证明这是形如(5.7.2)的Hadamard乘积范数,因而它是 M n M_{n} M n 上的向量范数.证明这个范数与 C n \mathbf{C}^n C n 上的向量范数 ∥ ⋅ ∥ ∞ \| \cdot \|_{\infty} ∥ ⋅ ∥ ∞ 相容.然后计算
∥ [ 0 1 1 0 ] ∥ 1 和 ∥ [ 0 1 1 0 ] 2 ∥ \left\| \left[ \begin{array}{l l} 0 & 1 \\ 1 & 0 \end{array} \right] \right\| _ {1} \text {和} \left\| \left[ \begin{array}{l l} 0 & 1 \\ 1 & 0 \end{array} \right] ^ {2} \right\| [ 0 1 1 0 ] 1 和 [ 0 1 1 0 ] 2 并且证明这个范数不是次乘性范数.
习题
设 G ( ⋅ ) G(\cdot) G ( ⋅ ) 是 M n M_{n} M n 上的向量范数,设 y ∈ C n y \in \mathbf{C}^{n} y ∈ C n 是给定的非零向量。证明函数
∥ x ∥ ≡ G ( x y ⋅ ) \| x \| \equiv G (x y ^ {\cdot}) ∥ x ∥ ≡ G ( x y ⋅ ) 是 C n \mathbf{C}^n C n 上的向量范数. 当
y = [ 1 , 1 , … , 1 ] t 或 y = [ 1 , 0 , 0 , … , 0 ] t y = [ 1, 1, \dots , 1 ] ^ {t} \text {或} y = [ 1, 0, 0, \dots , 0 ] ^ {t} y = [ 1 , 1 , … , 1 ] t 或 y = [ 1 , 0 , 0 , … , 0 ] t 时,这个范数是什么?
328
设 ∥ ⋅ ∥ \|\cdot\| ∥ ⋅ ∥ 是 M n M_{n} M n 上的任意向量范数,设 A ∈ M n A \in M_{n} A ∈ M n 是给定的矩阵,且 ε > 0 \varepsilon > 0 ε > 0 是给定的数。证明存在某个 K = K ( ε , A ) > 0 K = K(\varepsilon, A) > 0 K = K ( ε , A ) > 0 ,使得
[ ρ ( A ) − ε ] k ⩽ ∥ A k ∥ ⩽ [ ρ ( A ) + ε ] k \left[ \rho (A) - \varepsilon \right] ^ {k} \leqslant \left\| A ^ {k} \right\| \leqslant \left[ \rho (A) + \varepsilon \right] ^ {k} [ ρ ( A ) − ε ] k ⩽ A k ⩽ [ ρ ( A ) + ε ] k 对所有 k > K k > K k > K 成立.
设 ∥ ⋅ ∥ \| \cdot \| ∥ ⋅ ∥ 是 M n M_{n} M n 上的任意向量范数,且设 A ∈ M n A \in M_{n} A ∈ M n 是给定的矩阵。(a)利用习题2证明,如果 ρ ( A ) < 1 \rho(A) < 1 ρ ( A ) < 1 ,则当 k → ∞ k \to \infty k → ∞ 时 ∥ A k ∥ → 0 \| A^{k} \| \to 0 ∥ A k ∥ → 0 。它以什么速度收敛?(b)反过来,如果当 k → ∞ k \to \infty k → ∞ 时 ∥ A k ∥ → 0 \| A^{k} \| \to 0 ∥ A k ∥ → 0 ,证明 ρ ( A ) < 1 \rho(A) < 1 ρ ( A ) < 1 。提示:如果 A x = λ x Ax = \lambda x A x = λ x 且 x ≠ 0 x \neq 0 x = 0 ,考虑 ∥ A k [ x ⋯ x ] ∥ \| A^{k}[x \cdots x] \| ∥ A k [ x ⋯ x ] ∥ ,(c)关于利用向量范数讨论矩阵幂级数的收敛性,你能说些什么?
设 G ( ⋅ ) G(\cdot) G ( ⋅ ) 是 M n M_{n} M n 上给定的向量范数,且定义函数 G ′ : M n → R G^{\prime}: M_{n} \rightarrow \mathbf{R} G ′ : M n → R 为
G ′ ( B ) ≡ max ( A , A ) = 1 G ( B A ) . G ^ {\prime} (B) \equiv \max _ {(A, A) = 1} G (B A). G ′ ( B ) ≡ ( A , A ) = 1 max G ( B A ) . 证明 G ′ ( ∙ ) G^{\prime}(\bullet) G ′ ( ∙ ) 总是 M n M_{n} M n 上的矩阵范数,证明总有 G ′ ( I ) = 1 G^{\prime}(I) = 1 G ′ ( I ) = 1 ,如果 G ( I ) = 1 G(I) = 1 G ( I ) = 1 ,证明 G ′ ( B ) ⩾ G ( B ) G^{\prime}(B)\geqslant G(B) G ′ ( B ) ⩾ G ( B ) 对所有 B ∈ M n B\in M_n B ∈ M n 成立.
以下四个习题是习题4的延伸.
如果 G ( ⋅ ) G(\cdot) G ( ⋅ ) 是 M n M_{n} M n 上的矩阵范数,证明 G ′ ( B ) ⩽ G ( B ) G^{\prime}(B) \leqslant G(B) G ′ ( B ) ⩽ G ( B ) 对所有 B ∈ M n B \in M_{n} B ∈ M n 成立,并且证明,如果 G ( I ) = 1 G(I) = 1 G ( I ) = 1 ,则 G ′ ( ⋅ ) = G ( ⋅ ) G^{\prime}(\cdot) = G(\cdot) G ′ ( ⋅ ) = G ( ⋅ ) .
证明总有 G ′ ′ ( ⋅ ) = G ′ ( ⋅ ) G''(\cdot) = G'(\cdot) G ′′ ( ⋅ ) = G ′ ( ⋅ ) .
如果 G ( ⋅ ) G(\cdot) G ( ⋅ ) 是 M n M_{n} M n 上的向量范数,且 G ( I ) = 1 G(I) = 1 G ( I ) = 1 ,证明 G ( ⋅ ) G(\cdot) G ( ⋅ ) 是矩阵范数,当且仅当 G ′ ( B ) ⩽ G ( B ) G^{\prime}(B)\leqslant G(B) G ′ ( B ) ⩽ G ( B ) 对所有 B ∈ M n B\in M_n B ∈ M n 成立.
证明,在习题4中定义 G ′ ( ⋅ ) G'(\cdot) G ′ ( ⋅ ) 时,可以颠倒 A A A 与 B B B 出现的顺序,从而得到另一个矩阵范数。用例子说明,这另一个范数不一定等于 G ′ ( ⋅ ) G'(\cdot) G ′ ( ⋅ ) 。
证明与 M n M_{n} M n 上一个给定的向量范数相容的 C n \mathbf{C}^{n} C n 上的所有向量半范数组成的集合是凸集一实际上它是一个锥.
说明数值半径 r ( ⋅ ) r(\cdot) r ( ⋅ ) 不是 M n M_{n} M n 上的矩阵范数,试考察(5.7.4)中的各矩阵且比较 r ( A B ) r(AB) r ( A B ) 与 r ( A ) r ( B ) r(A)r(B) r ( A ) r ( B ) .
定理(5.6.9)中的不等式 ∥ A ∥ ⩾ ρ ( A ) \| A\| \geqslant \rho (A) ∥ A ∥ ⩾ ρ ( A ) 可以由关于矩阵范数 ∥ ⋅ ∥ \| \cdot \| ∥ ⋅ ∥ 的次乘性公理(4)得出. 但是, 可能有这种情形, M n M_{n} M n 上的一个向量范数满足这个不等式(即它是谱优势的), 而它不是矩阵范数. 证明 r ( A ) ⩾ ρ ( A ) r(A)\geqslant \rho (A) r ( A ) ⩾ ρ ( A ) 对每个 A ∈ M n A\in M_n A ∈ M n 成立. 更一般地, 证明 σ ( A ) ⊂ { x ∗ A x : x ∗ x = 1 } \sigma (A)\subset \{x^{*}Ax:x^{*}x = 1\} σ ( A ) ⊂ { x ∗ A x : x ∗ x = 1 } .
证明 M n M_{n} M n 上的向量范数 ∥ ⋅ ∥ ∞ \| \cdot \|_{\infty} ∥ ⋅ ∥ ∞ 在 C n \mathbf{C}^{n} C n 上不可能有任何相容的量范数。提示:考虑 ∥ J n ∥ ∞ \| J_{n} \|_{\infty} ∥ J n ∥ ∞ 和 ρ ( J n ) \rho(J_{n}) ρ ( J n ) 。但是,证明 n ∥ ⋅ ∥ n \| \cdot \| n ∥ ⋅ ∥ 是 M n M_{n} M n 上的矩阵范数,因而它在 C n \mathbf{C}^{n} C n 上有相容向量范数。
设 A = [ a i j ] ∈ M m , n A = [a_{ij}] \in M_{m,n} A = [ a ij ] ∈ M m , n , A A A 的第 i i i 行的转置用 r i ( A ) = [ a i 1 , a i 2 , … , a m ] T r_i(A) = [a_{i1}, a_{i2}, \dots, a_m]^T r i ( A ) = [ a i 1 , a i 2 , … , a m ] T 表示, 而 A A A 的第 j j j 列用 c j ( A ) = [ a 1 j , a 2 j , … , a m j ] T c_j(A) = [a_{1j}, a_{2j}, \dots, a_{mj}]^T c j ( A ) = [ a 1 j , a 2 j , … , a mj ] T 表示. 义假定 ∥ ⋅ ∥ a \|\cdot\|_a ∥ ⋅ ∥ a 和 ∥ ⋅ ∥ b \|\cdot\|_b ∥ ⋅ ∥ b 分别是 C n \mathbf{C}^n C n 和 C m \mathbf{C}^m C m 上的向量范数, 然后, 定义 G j , a : M m , n → R G_{j,a}: M_{m,n} \to \mathbb{R} G j , a : M m , n → R 为
G β , α ( A ) ≡ ∥ [ ∥ r 1 ( A ) ∥ α , ∥ r 2 ( A ) ∥ α , … , ∥ r m ( A ) ∥ α ] I ∥ β . G _ {\beta , \alpha} (A) \equiv \| [ \| r _ {1} (A) \| _ {\alpha}, \| r _ {2} (A) \| _ {\alpha}, \dots , \| r _ {m} (A) \| _ {\alpha} ] ^ {I} \| _ {\beta}. G β , α ( A ) ≡ ∥ [ ∥ r 1 ( A ) ∥ α , ∥ r 2 ( A ) ∥ α , … , ∥ r m ( A ) ∥ α ] I ∥ β . 类似地,定义 G p , q : M m , n → R G^{p,q}:M_{m,n}\to \mathbf{R} G p , q : M m , n → R 为
G α , β ( A ) ≡ ∥ [ ∥ c 1 ( A ) ∥ β , ∥ r 2 ( A ) ∥ β , … , ∥ c n ( A ) ∥ β ] 2 ∥ α . G ^ {\alpha , \beta} (A) \equiv \| [ \| c _ {1} (A) \| _ {\beta}, \| r _ {2} (A) \| _ {\beta}, \dots , \| c _ {n} (A) \| _ {\beta} ] ^ {2} \| _ {\alpha}. G α , β ( A ) ≡ ∥ [ ∥ c 1 ( A ) ∥ β , ∥ r 2 ( A ) ∥ β , … , ∥ c n ( A ) ∥ β ] 2 ∥ α . 证明, G β , α ( ⋅ ) G_{\beta, \alpha}(\cdot) G β , α ( ⋅ ) 和 G α , β ( ⋅ ) G^{\alpha, \beta}(\cdot) G α , β ( ⋅ ) 各为 M m , n M_{m,n} M m , n 上的向量范数,但 G α , β ( ⋅ ) G^{\alpha, \beta}(\cdot) G α , β ( ⋅ ) 与 G α , β ( ⋅ ) G_{\alpha, \beta}(\cdot) G α , β ( ⋅ ) 不一定相同。注意这是在矩阵空间上定义向量范数的自然方式。
试比较习题 13 中的 G β , α ( ⋅ ) G_{\beta, \alpha}(\cdot) G β , α ( ⋅ ) 与 (5.6) 节习题 4 中定义的范数 ∥ ⋅ ∥ α , β \| \cdot \|_{\alpha, \beta} ∥ ⋅ ∥ α , β ,并且用例子说明,即使 m = n m = n m = n (且 ∥ ⋅ ∥ α = ∥ ⋅ ∥ β \| \cdot \|_{\alpha} = \| \cdot \|_{\beta} ∥ ⋅ ∥ α = ∥ ⋅ ∥ β ), G β , α ( ⋅ ) G_{\beta, \alpha}(\cdot) G β , α ( ⋅ ) 也不一定是 M n M_{n} M n 上的矩阵范数。
在习题 13 中,当 ∥ ⋅ ∥ α = ∥ ⋅ ∥ 2 = ∥ ⋅ ∥ β \|\cdot\|_{\alpha} = \|\cdot\|_{2} = \|\cdot\|_{\beta} ∥ ⋅ ∥ α = ∥ ⋅ ∥ 2 = ∥ ⋅ ∥ β 时, G β , α ( ⋅ ) G_{\beta, \alpha}(\cdot) G β , α ( ⋅ ) 是什么范数? G α , β ( ⋅ ) G^{\alpha, \beta}(\cdot) G α , β ( ⋅ ) 是什么范数?
在习题 13 中, 当 ∥ ⋅ ∥ α = ∥ ⋅ ∥ 1 \| \cdot \|_{\alpha} = \| \cdot \|_{1} ∥ ⋅ ∥ α = ∥ ⋅ ∥ 1 且 ∥ ⋅ ∥ β = ∥ ⋅ ∥ γ \| \cdot \|_{\beta} = \| \cdot \|_{\gamma} ∥ ⋅ ∥ β = ∥ ⋅ ∥ γ 时, G β , α ( ⋅ ) G_{\beta, \alpha}(\cdot) G β , α ( ⋅ ) 是什么范数? G β , α ( ⋅ ) G^{\beta, \alpha}(\cdot) G β , α ( ⋅ ) 是什么范数? G α , β ( ⋅ ) G_{\alpha, \beta}(\cdot) G α , β ( ⋅ ) 与 G α , β ( ⋅ ) G^{\alpha, \beta}(\cdot) G α , β ( ⋅ ) 有什么关系?
若 G ( ⋅ ) G(\cdot) G ( ⋅ ) 是 M n M_{n} M n 上的向量范数,定义 G ( ⋅ ) G(\cdot) G ( ⋅ ) 的谱示性数为
m ( G ) ≡ max G ( A ) ⩽ 1 ρ ( A ) m (G) \equiv \max _ {G (A) \leqslant 1} \rho (A) m ( G ) ≡ G ( A ) ⩽ 1 max ρ ( A ) 证明, G ( ⋅ ) G(\cdot) G ( ⋅ ) 是谱优势的当且仅当 m ( G ) ⩽ 1 m(G) \leqslant 1 m ( G ) ⩽ 1 。然后证明, M n M_{n} M n 上的任一向量范数在乘上一个常数[其中最小常数一定是 m ( G ) m(G) m ( G ) ]后可以变成一个谱优势范数。如果 m ( G ) = 1 m(G) = 1 m ( G ) = 1 ,则称 M n M_{n} M n 上的范数 G ( ⋅ ) G(\cdot) G ( ⋅ ) 为极小谱优势的。
证明,任何诱导矩阵范数是习题17中所定义的极小谱优势范数。说明有一些范数是极小谱优势范数但不是诱导范数。证明数值半径 r ( A ) r(A) r ( A ) 是极小谱优势的。
证明谱示性数是由 M n M_{n} M n 上的向量范数组成的锥上的凸函数,因而证明 M n M_{n} M n 上的所有谱优势向量范数组成的集合是凸集。
证明, M n M_{n} M n 上的向量范数 G ( ⋅ ) G(\cdot) G ( ⋅ ) 是谱优势的,当且仅当对每个 A ∈ M n A \in M_{n} A ∈ M n 存在一个常数 r A r_{A} r A [只与 G ( ⋅ ) G(\cdot) G ( ⋅ ) 和 A A A 有关],使得对所有整数 k > 0 k > 0 k > 0 ,有
G ( A k ) ⩽ r A G ( A ) k . G (A ^ {k}) \leqslant r _ {A} G (A) ^ {k}. G ( A k ) ⩽ r A G ( A ) k . 21.(a)证明,当 A A A 是正规矩阵时,数值半径 r ( ⋅ ) r(\cdot) r ( ⋅ ) 适合 r ( A ) = ρ ( A ) = ∥ A ∥ 2 r(A) = \rho (A) = \| A\|_{2} r ( A ) = ρ ( A ) = ∥ A ∥ 2 ,但是一般 r ( A ) ⩽ ∥ A ∥ 2 r(A)\leqslant \| A\|_{2} r ( A ) ⩽ ∥ A ∥ 2 .给出一个关于矩阵 A ∈ M n A\in M_{n} A ∈ M n 的例子使得 r ( A ) < ∥ A ∥ 2 r(A) < \| A\|_{2} r ( A ) < ∥ A ∥ 2 .提示:证明当 U ∈ M n U\in M_{n} U ∈ M n 是酉矩阵时 r ( U ⋅ A U ) = r ( A ) r(U\cdot AU) = r(A) r ( U ⋅ A U ) = r ( A ) ,然后利用 A A A 可酉对角化的事实.再说明一般地有
r ( Λ ) = max ∥ x ∥ 2 = 1 ∣ x ∗ A x ∣ ⩽ max ∥ x ∥ 2 = 1 ∥ A x ∥ 2 ∥ x ∥ 2 = ∥ A ∥ 2 . r (\Lambda) = \max _ {\| x \| _ {2} = 1} | x ^ {*} A x | \leqslant \max _ {\| x \| _ {2} = 1} \| A x \| _ {2} \| x \| _ {2} = \| A \| _ {2}. r ( Λ ) = ∥ x ∥ 2 = 1 max ∣ x ∗ A x ∣ ⩽ ∥ x ∥ 2 = 1 max ∥ A x ∥ 2 ∥ x ∥ 2 = ∥ A ∥ 2 . (b) 证明,对所有 A ∈ M n A \in M_n A ∈ M n 都有 r ( A ) = r ( A ∗ ) r(A) = r(A^*) r ( A ) = r ( A ∗ ) ,(c) 按如下所述证明对所有 A ∈ M n A \in M_n A ∈ M n 都有 ∥ A ∥ 2 ⩽ 2 r ( A ) \| A \|_2 \leqslant 2r(A) ∥ A ∥ 2 ⩽ 2 r ( A ) ;记
A = ( A + A ∗ ) / 2 + ( A − A ∗ ) / 2 ≡ A 1 + A 2 , A = \left(A + A ^ {*}\right) / 2 + \left(A - A ^ {*}\right) / 2 \equiv A _ {1} + A _ {2}, A = ( A + A ∗ ) /2 + ( A − A ∗ ) /2 ≡ A 1 + A 2 , 并注意到 A 1 A_{1} A 1 和 A 2 A_{2} A 2 是正规矩阵,然后证明
∥ A ∣ 2 ⩽ ∥ A 1 ∥ 2 + ∣ A 2 ∥ 2 = r ( A 1 ) + r ( A 2 ) ⩽ r ( A ) + r ( A ∗ ) = 2 r ( A ) . \left\| A \right| _ {2} \leqslant \left\| A _ {1} \right\| _ {2} + \left| A _ {2} \right\| _ {2} = r \left(A _ {1}\right) + r \left(A _ {2}\right) \leqslant r (A) + r \left(A ^ {*}\right) = 2 r (A). ∥ A ∣ 2 ⩽ ∥ A 1 ∥ 2 + ∣ A 2 ∥ 2 = r ( A 1 ) + r ( A 2 ) ⩽ r ( A ) + r ( A ∗ ) = 2 r ( A ) . (d) 试考察适当的 n × n n \times n n × n 矩阵,如 [ 1 0 0 0 ] \left[ \begin{array}{ll}1 & 0\\ 0 & 0 \end{array} \right] [ 1 0 0 0 ] 和 [ 0 1 0 0 ] \left[ \begin{array}{ll}0 & 1\\ 0 & 0 \end{array} \right] [ 0 0 1 0 ] ,说明(a)和(c)中给出的界
1 2 ∥ A ∥ 2 ⩽ r ( A ) ⩽ ∥ A ∥ 2 (i) \frac {1}{2} \| A \| _ {2} \leqslant r (A) \leqslant \| A \| _ {2} \tag {i} 2 1 ∥ A ∥ 2 ⩽ r ( A ) ⩽ ∥ A ∥ 2 ( i ) 是可以达到的.
试用习题 21(d) 中的不等式以及定理 (5.7.11) 中给出的关于 c ( r ) c(r) c ( r ) 的界证明, 函数 4 r ( ⋅ ) 4r(\cdot) 4 r ( ⋅ ) 是 M n M_{n} M n 上的矩阵范数. 试考察 A = [ 0 1 0 0 ] A = \begin{bmatrix} 0 & 1 \\ 0 & 0 \end{bmatrix} A = [ 0 0 1 0 ] , A ′ A' A ′ 和 A A ′ AA' A A ′ , 证明 c ( r ) = 4 c(r) = 4 c ( r ) = 4 .
由习题21(d)中的(i)以及(5.6)节习题23给出的不等式,
1 n ∥ Λ ∥ 2 ⩽ ∥ A ∥ 2 ⩽ ∥ A ∥ 2 (ii) \frac {1}{\sqrt {n}} \| \Lambda \| _ {2} \leqslant \| A \| _ {2} \leqslant \| A \| _ {2} \tag {ii} n 1 ∥Λ ∥ 2 ⩽ ∥ A ∥ 2 ⩽ ∥ A ∥ 2 ( ii ) 试推出,对所有的 Λ ∈ M n \Lambda \in M_{n} Λ ∈ M n ,不等式
1 2 n ∥ A ∥ 2 ⩽ r ( A ) ⩽ ∥ A ∥ 2 (iii) \frac {1}{2 \sqrt {n}} \| A \| _ {2} \leqslant r (A) \leqslant \| A \| _ {2} \tag {iii} 2 n 1 ∥ A ∥ 2 ⩽ r ( A ) ⩽ ∥ A ∥ 2 ( iii ) 成立,并且证明其上界是可以达到的。验证 A = [ 0 1 0 0 ] A = \begin{bmatrix} 0 & 1 \\ 0 & 0 \end{bmatrix} A = [ 0 0 1 0 ] 和 A = I A = I A = I 分别给出了 (i) 和 (ii) 的下界中
331
等式成立的例子,然后验证 A = [ 1 0 0 0 ] A = \begin{bmatrix} 1 & 0 \\ 0 & 0 \end{bmatrix} A = [ 1 0 0 0 ] 是 (i) 和 (ii) 的上界中等式成立的例子。由此说明,为什么 (iii) 中的上界是可以达到的,而 (iii) 中的下界不一定能达到。为什么对所有的 A ∈ M n A \in M_n A ∈ M n 存在一个有限正常数 c n c_n c n 使得 c n ∥ A ∥ 2 ⩽ r ( A ) c_n \| A \|_2 \leqslant r(A) c n ∥ A ∥ 2 ⩽ r ( A ) ?实际上, n n n 为偶数时 c n = ( 2 n ) − 1.2 c_n = (2n)^{-1.2} c n = ( 2 n ) − 1.2 ,而 n n n 为奇数时 c n = ( 2 n − 1 ) − 1.2 c_n = (2n - 1)^{-1.2} c n = ( 2 n − 1 ) − 1.2 。对于偶数 n n n ,相等的情形要求矩阵酉相似于形如 r ( A ) [ 0 1 0 0 ] r(A) \begin{bmatrix} 0 & 1 \\ 0 & 0 \end{bmatrix} r ( A ) [ 0 0 1 0 ] 的诸矩阵的直和;当 n n n 为奇数时,矩阵的直和一定要附加一个 ∣ x ∣ |x| ∣ x ∣ 的被加单项 [ α ] [\alpha] [ α ] ,且 ∣ α ∣ = r ( A ) |\alpha| = r(A) ∣ α ∣ = r ( A ) 。
证明 [ A , B ] ≡ tr A B [A, B] \equiv \operatorname{tr} AB [ A , B ] ≡ tr A B 定义 M n M_{n} M n 上的一个内积,而 M n M_{n} M n 上的 l 2 l_{2} l 2 范数可由 [ ⋅ , ⋅ ] [\cdot, \cdot] [ ⋅ , ⋅ ] 导出;即 ∥ A ∥ 2 = [ A , A ] 1 , 2 \| A \|_{2} = [A, A]^{1,2} ∥ A ∥ 2 = [ A , A ] 1 , 2 对所有 A ∈ M n A \in M_{n} A ∈ M n 成立。证明,如果 X = x x ∗ X = xx^{*} X = x x ∗ 是秩 1 Hermite 矩阵,则 ∥ X ∥ 2 = ∥ x ∥ 2 2 \| X \|_{2} = \| x \|_{2}^{2} ∥ X ∥ 2 = ∥ x ∥ 2 2 。证明给定的矩阵 A ∈ M n A \in M_{n} A ∈ M n 的值域正好是 A A A 到范数为 1 的秩 1 Hermite 矩阵的集合(关于内积 [ ⋅ , ⋅ ] [\cdot, \cdot] [ ⋅ , ⋅ ] )的射影组成的集合,并且证明 r ( A ) = max { ∣ [ A , X ] ∣ : X r(A) = \max \{|[A, X]|: X r ( A ) = max { ∣ [ A , X ] ∣ : X 是秩 1 Hermite 矩阵且 ∥ X ∥ 2 = 1 } \| X \|_{2} = 1\} ∥ X ∥ 2 = 1 } 。利用 Cauchy-Schwarz 不等式证明 r ( A ) ⩽ ∥ A ∥ 2 r(A) \leqslant \| A \|_{2} r ( A ) ⩽ ∥ A ∥ 2 。
数值半径与自然逼近问题有联系。设 A ∈ M n A \in M_{n} A ∈ M n 是给定的,并且假定我们想在最小二乘方的意义下用一个秩为 1 的 Hermite 矩阵的纯量倍去尽可能地逼近 A A A 。如果记 X = c x x ∗ X = cxx^{*} X = c x x ∗ , c ∈ C c \in \mathbf{C} c ∈ C , ∥ x ∥ 2 = 1 \|x\|_{2} = 1 ∥ x ∥ 2 = 1 ,试证明,当 c = [ A , x ~ x ~ ∗ ] c = [A, \tilde{x}\tilde{x}^{*}] c = [ A , x ~ x ~ ∗ ] 且其中的单位向量 x ~ \tilde{x} x ~ 可使(5.7.6)中的极大值达到时,则
∥ A − X ∥ 2 2 = ∥ A − c r r ∗ ∥ 2 2 ⩾ ∥ A ∥ 2 2 − 2 ∣ c [ A , x x ∗ ] ∣ + ∣ c ∣ 2 \| A - X \| _ {2} ^ {2} = \| A - c r r ^ {*} \| _ {2} ^ {2} \geqslant \| A \| _ {2} ^ {2} - 2 | c [ A, x x ^ {*} ] | + | c | ^ {2} ∥ A − X ∥ 2 2 = ∥ A − cr r ∗ ∥ 2 2 ⩾ ∥ A ∥ 2 2 − 2∣ c [ A , x x ∗ ] ∣ + ∣ c ∣ 2 可以达到极小。由此断定,如果对所有纯量 c c c 以及所有具有 ∥ X ∥ 2 = 1 \|X\|_2 = 1 ∥ X ∥ 2 = 1 的秩 1 Hermite 矩阵, ∥ A − c X ∥ 2 \|A - cX\|_2 ∥ A − c X ∥ 2 可以达到极小,则 ∣ c ∣ = r ( A ) |c| = r(A) ∣ c ∣ = r ( A ) 。
前面两个习题引出了数值半径和值域的一个自然推广。设 Φ ⊂ M n \Phi \subset M_{n} Φ ⊂ M n 是一个非空的矩阵集合,且适合以下条件:
(a) 若 X ∈ Φ X \in \Phi X ∈ Φ ,则对所有 a ∈ C a \in \mathbf{C} a ∈ C 有 a X ∈ Φ aX \in \Phi a X ∈ Φ ; (b)对所有 X ∈ Φ X \in \Phi X ∈ Φ 有 [ A , X ] = tr A X ∗ = 0 [A, X] = \operatorname{tr} A X^{*} = 0 [ A , X ] = tr A X ∗ = 0 当且仅当 A = 0 A = 0 A = 0 (c) Φ \Phi Φ 是一个闭集.
若 A ∈ M n A \in M_{n} A ∈ M n , 定义
ϕ ( A ) ≡ max X ∈ Φ ∥ X ∥ p < 1 ∣ [ A , X ] ∣ = max X ∈ Φ ∥ X ∥ p < 1 ∣ tr A X ∗ ∣ . \phi (A) \equiv \max _ {\substack {X \in \Phi \\ \| X \| _ {p} < 1}} | [ A, X ] | = \max _ {\substack {X \in \Phi \\ \| X \| _ {p} < 1}} | \operatorname {t r} A X ^ {*} |. ϕ ( A ) ≡ X ∈ Φ ∥ X ∥ p < 1 max ∣ [ A , X ] ∣ = X ∈ Φ ∥ X ∥ p < 1 max ∣ tr A X ∗ ∣. 说明 ϕ ( ⋅ ) \phi(\cdot) ϕ ( ⋅ ) 是有意义的,它是 M n M_{n} M n 上的向量范数,且满足 ∣ ϕ ( A ) ∣ ⩽ ∥ A ∥ 2 |\phi(A)| \leqslant \|A\|_{2} ∣ ϕ ( A ) ∣ ⩽ ∥ A ∥ 2 ,证明对每个 A ∈ M n A \in M_{n} A ∈ M n 都存在某个 X A ∈ Φ X_{A} \in \Phi X A ∈ Φ 使得 ∥ X A ∥ 2 = 1 \|X_{A}\|_{2} = 1 ∥ X A ∥ 2 = 1 且 ϕ ( A ) = ∣ [ A , X A ] ∥ \phi(A) = |[A, X_{A}]\| ϕ ( A ) = ∣ [ A , X A ] ∥ .
考虑用 Φ \Phi Φ 中的矩阵去逼近给定的矩阵 A ∈ M n A \in M_{n} A ∈ M n ,即求某个 X ∈ Φ X \in \Phi X ∈ Φ ,使得 ∥ A − X ∥ 2 \| A - X \|_{2} ∥ A − X ∥ 2 达到极小。证明,矩阵 ϕ ( A ) X A \phi(A)X_{A} ϕ ( A ) X A 给出了一个最佳逼近,其中 ϕ ( A ) = ∣ [ A , X A ] ∣ \phi(A) = |[A, X_{A}]| ϕ ( A ) = ∣ [ A , X A ] ∣ ,并且用任意 X ∈ Φ X \in \Phi X ∈ Φ 逼近 A A A 的误差有最大下界 ∥ A − X ∥ 2 2 ⩾ ∥ A ∥ 2 2 − ∣ [ A , X A ] ∣ 2 ⩾ 0 \| A - X \|_{2}^{2} \geqslant \| A \|_{2}^{2} - |[A, X_{A}]|^{2} \geqslant 0 ∥ A − X ∥ 2 2 ⩾ ∥ A ∥ 2 2 − ∣ [ A , X A ] ∣ 2 ⩾ 0 .
证明,若 Φ \Phi Φ 是由秩1Hermite矩阵的所有纯量倍组成的集合,则 ϕ ( A ) = r ( A ) \phi (A) = r(A) ϕ ( A ) = r ( A ) ,在 Φ \Phi Φ 是酉矩阵的所有纯量倍的集合的情形将在例(7.4.6)中讨论;在这种情形下 ϕ ( A ) \phi (A) ϕ ( A ) 是 A A A 的各奇异值的平均值.另一个值得注意的情形是 Φ \Phi Φ 是所有奇异矩阵的集合,这将在例(7.4.1)中讨论,在这种情形下 ϕ ( A ) \phi (A) ϕ ( A ) 是 A A A 的最小奇异值.还有一个值得注意的情形是,秩是已知的正定矩阵、Hermite矩阵或正规矩阵的所有纯量倍的集合,或者是由酉相似于一个给定的矩阵的所有矩阵
的所有纯量倍组成的集合。在上述每一种情形,与值域类似的是集合 { [ A , X ] : X ∈ Φ } \{[A, X] : X \in \Phi\} {[ A , X ] : X ∈ Φ } 。
即使数值半径 r ( A ) r(A) r ( A ) 不是矩阵范数,但对所有 m = 1 , 2 , ⋯ m = 1, 2, \cdots m = 1 , 2 , ⋯ 和所有 A ∈ M n A \in M_n A ∈ M n ,它的确满足幂不等式 r ( A m ) ⩽ [ r ( A ) ] m r(A^m) \leqslant [r(A)]^m r ( A m ) ⩽ [ r ( A ) ] m ,试按以下步骤证明这个结论。
(a) 说明只要证明下述结论就足够了:若 r ( A ) ⩽ 1 r(A) \leqslant 1 r ( A ) ⩽ 1 ,则对所有 m = 1 , 2 , ⋯ m = 1, 2, \cdots m = 1 , 2 , ⋯ 有 r ( A n ) ⩽ 1 r(A^{n}) \leqslant 1 r ( A n ) ⩽ 1 .
设 m ⩾ 2 m \geqslant 2 m ⩾ 2 是给定的正整数,转到余下的论证,设 { w k } = { e 2 π i k / m } k − 1 m \{w_{k}\} = \{e^{2\pi ik / m}\}_{k - 1}^{m} { w k } = { e 2 πik / m } k − 1 m 表示 m m m 次单位根的集合,注意到 { w k } \{w_{k}\} { w k } 是一个有限乘法群,并且对每个 j = 1 , 2 , … , m j = 1, 2, \dots, m j = 1 , 2 , … , m 有 { w j w k } k = 1 m = { w k } k = 1 m \{w_{j}w_{k}\}_{k = 1}^{m} = \{w_{k}\}_{k = 1}^{m} { w j w k } k = 1 m = { w k } k = 1 m .
(b)说明
1 − z m = ∏ k = 1 m ( 1 − w k z ) , 1 - z ^ {m} = \prod_ {k = 1} ^ {m} (1 - w _ {k} z), 1 − z m = k = 1 ∏ m ( 1 − w k z ) , 然后证明,对所有 z ∈ C z \in \mathbb{C} z ∈ C 有
p ( z ) ≡ 1 m ∑ j = 1 m ∏ k = 1 k ≠ j m ( 1 − w k z ) ≡ 1. p (z) \equiv \frac {1}{m} \sum_ {j = 1} ^ {m} \prod_ {\substack {k = 1 \\ k \neq j}} ^ {m} (1 - w _ {k} z) \equiv 1. p ( z ) ≡ m 1 j = 1 ∑ m k = 1 k = j ∏ m ( 1 − w k z ) ≡ 1. 提示:注意到 p ( z ) p(z) p ( z ) 是次数至多为 m − 1 m - 1 m − 1 的多项式,且
p ( z ) = 1 m ∑ j = 1 m 1 − z m 1 − w j z p (z) = \frac {1}{m} \sum_ {j = 1} ^ {m} \frac {1 - z ^ {m}}{1 - w _ {j} z} p ( z ) = m 1 j = 1 ∑ m 1 − w j z 1 − z m 对所有 z ∈ C z \in \mathbf{C} z ∈ C 都有 p ( z ) = p ( w 1 z ) = ⋯ = p ( w m z ) p(z) = p(w_1z) = \dots = p(w_mz) p ( z ) = p ( w 1 z ) = ⋯ = p ( w m z ) ,因而 p ( z ) = p(z) = p ( z ) = 常数 = p ( 0 ) − 1 = p(0) - 1 = p ( 0 ) − 1 .
(c)证明
I − A m = ∏ k = 1 m ( I − w k A ) 和 I = 1 m ∑ j = 1 m ∏ k = 1 k ≠ j m ( I − w k A ) . I - A ^ {m} = \prod_ {k = 1} ^ {m} (I - w _ {k} A) \quad \text {和} \quad I = \frac {1}{m} \sum_ {j = 1} ^ {m} \prod_ {\substack {k = 1 \\ k \neq j}} ^ {m} (I - w _ {k} A). I − A m = k = 1 ∏ m ( I − w k A ) 和 I = m 1 j = 1 ∑ m k = 1 k = j ∏ m ( I − w k A ) . (d) 设 x ∈ C n x \in \mathbf{C}^{n} x ∈ C n 是任一单位向量, ∥ x ∥ 2 = 1 \| x \|_{2} = 1 ∥ x ∥ 2 = 1 ,又设 A ∈ M n A \in M_{n} A ∈ M n ,验证
1 − x ∗ A m x = x ∗ ( I − A m ) x = ( I x ) ∗ ( I ∼ A m ) x = [ 1 m ∑ j = 1 m ∏ k = 1 k ≠ j m ( I − w k A ) x ] ∗ [ ∏ k = 1 m ( I − w k A ) x ] = 1 m ∑ j = 1 m z j ∗ [ ( I − w j A ) z j ] , z j ≡ ∏ k = 1 k ≠ j m ( I − w k A ) x − 1 m ∑ j = 1 z j + 0 m ∥ z j ∥ 2 3 2 [ 1 − w j ( z j ∥ z j ∥ 2 ) ∗ A ( z j ∥ z j ∥ 2 ) ] . \begin{array}{l} 1 - x ^ {*} A ^ {m} x = x ^ {*} (I - A ^ {m}) x = (I x) ^ {*} (I \sim A ^ {m}) x \\ = \left[ \frac {1}{m} \sum_ {j = 1} ^ {m} \prod_ {\substack {k = 1 \\ k \neq j}} ^ {m} (I - w _ {k} A) x \right] ^ {*} \left[ \prod_ {k = 1} ^ {m} (I - w _ {k} A) x \right] \\ = \frac {1}{m} \sum_ {j = 1} ^ {m} z _ {j} ^ {*} \left[ (I - w _ {j} A) z _ {j} \right], \quad z _ {j} \equiv \prod_ {\substack {k = 1 \\ k \neq j}} ^ {m} (I - w _ {k} A) x \\ - \frac {1}{m} \sum_ {\substack {j = 1 \\ z _ {j} + 0}} ^ {m} \| z _ {j} \| _ {2} ^ {\frac {3}{2}} \left[ 1 - w _ {j} \left(\frac {z _ {j}}{\| z _ {j} \| _ {2}}\right) ^ {*} A \left(\frac {z _ {j}}{\| z _ {j} \| _ {2}}\right) \right]. \\ \end{array} 1 − x ∗ A m x = x ∗ ( I − A m ) x = ( I x ) ∗ ( I ∼ A m ) x = [ m 1 ∑ j = 1 m ∏ k = 1 k = j m ( I − w k A ) x ] ∗ [ ∏ k = 1 m ( I − w k A ) x ] = m 1 ∑ j = 1 m z j ∗ [ ( I − w j A ) z j ] , z j ≡ ∏ k = 1 k = j m ( I − w k A ) x − m 1 ∑ j = 1 z j + 0 m ∥ z j ∥ 2 2 3 [ 1 − w j ( ∥ z j ∥ 2 z j ) ∗ A ( ∥ z j ∥ 2 z j ) ] . (e) 现在在(d)的恒等式中用 e i θ A e^{i\theta}A e i θ A 代替 A A A ,便得到对任意实数 θ \theta θ 有
1 − e m θ x ∗ A m x = 1 m ∑ j = 1 z j ≠ 0 m ∥ z j ∥ 2 2 [ 1 − e i θ w j ( z j ∥ z j ∥ 2 ) ∗ A ( z j ∥ z j ∥ 2 ) ] . 1 - e ^ {m \theta} x ^ {*} A ^ {m} x = \frac {1}{m} \sum_ {\substack {j = 1 \\ z _ {j} \neq 0}} ^ {m} \| z _ {j} \| _ {2} ^ {2} \left[ 1 - e ^ {i \theta} w _ {j} \left(\frac {z _ {j}}{\| z _ {j} \| _ {2}}\right) ^ {*} A \left(\frac {z _ {j}}{\| z _ {j} \| _ {2}}\right) \right]. 1 − e m θ x ∗ A m x = m 1 j = 1 z j = 0 ∑ m ∥ z j ∥ 2 2 [ 1 − e i θ w j ( ∥ z j ∥ 2 z j ) ∗ A ( ∥ z j ∥ 2 z j ) ] . 然后假定 r ( A ) ⩽ 1 r(A) \leqslant 1 r ( A ) ⩽ 1 ,证明这个恒等式右边的实部对任意 θ ∈ R \theta \in \mathbb{R} θ ∈ R 是非负的,由此推出左边的实部对所有 θ ∈ R \theta \in \mathbb{R} θ ∈ R 也一定是非负的。由于 θ \theta θ 是任意的,证明这蕴涵 ∣ x ∗ A m x ∣ ⩽ 1 |x^{*}A^{m}x| \leqslant 1 ∣ x ∗ A m x ∣ ⩽ 1 ,因而 r ( A m ) ⩽ 1 r(A^{m}) \leqslant 1 r ( A m ) ⩽ 1 。
即使数值半径满足幂不等式 r ( A m ) ⩽ r ( A ) m r(A^{m}) \leqslant r(A)^{m} r ( A m ) ⩽ r ( A ) m ,但它对不等式 r ( A k + m ) ⩽ r ( A k ) r ( A m ) r(A^{k+m}) \leqslant r(A^{k}) r(A^{m}) r ( A k + m ) ⩽ r ( A k ) r ( A m ) 不总成立。试通过考察 A = J 1 ( 0 ) ( 4 × 4 A = J_{1}(0)(4 \times 4 A = J 1 ( 0 ) ( 4 × 4 Jordan 块矩阵), k = 1 k = 1 k = 1 和 m = 2 m = 2 m = 2 来验证这一事实。提示:
利用算术几何平均值不等式证明, r ( A 2 ) = r ( A 3 ) = 1 2 r(A^2) = r(A^3) = \frac{1}{2} r ( A 2 ) = r ( A 3 ) = 2 1 ,然后用Cauchy-Schwarz不等式证明 r ( A ) < 1 r(A) < 1 r ( A ) < 1 。
类似于极小矩阵范数概念(5.6.29),试问在 M n M_{n} M n 上存在关于“极小向量范数”的合理概念吗?
进一步阅读 关于涉及数值半径的不等式的进一步讨论可参看 M. Goldberg and E. Tadmor, “On the Numerical Radius and Its Applications,” Lin. Alg. Appl. 42(1982), 263-284. 习题 27 中关于数值半径的幂不等式的证明取自 C. Pearcy, “An Elementary Proof of the Power Inequality for the Numerical Radius,” Michigan Math. J. 13(1966), 289-291. 本节某些内容是本书作者的研究成果,可参看 C. R. Johnson, “Multiplicativity and Compatibility of Generalized Matrix Norms,” Linear Alg. Appl. 16(1977), 25-37, “Locally Compatible Generalized Matrix Norms,” Numer. Math. 27(1977), 391-394, “Power Inequalities and Spectral Dominance of Generalized Matrix Norms,” Linear Alg. Appl. 28(1979), 117-130, 其中还有其他的结果。