7.7 半正定次序关系 因为Hermite矩阵是实数的推广,而正定矩阵是正实数的推广,自然要问,在Hermite矩阵类中是否有不等式关系或(偏)序关系的适当概念.
7.7.1 定义 设 A , B ∈ M n A, B \in M_{n} A , B ∈ M n 是Hermite矩阵,如果 A − B A - B A − B 是半正定矩阵,我们就用 A ⩾ B A \geqslant B A ⩾ B 表示,类似地 A > B A > B A > B 表示 A − B A - B A − B 是正定矩阵。
练习 证明上述的不等概念与矩阵的相等概念是一致的,即证明 A ⩾ B A \geqslant B A ⩾ B 和 B ⩾ A B \geqslant A B ⩾ A 蕴涵 A = B A = B A = B .
练习 证明,关系 ⩾ \geqslant ⩾ 是传递的和自反的,但它不是全序;即存在Hermite矩阵 A A A , B ∈ M n B\in M_{n} B ∈ M n 使得 A ≥ B A\geq B A ≥ B 和 B ≥ A B\geq A B ≥ A 都不成立.这样的关系称为偏序.
实线性空间上的偏序常常定义如下:确定某个特殊的闭凸锥,并且说一个元素大于或等于另一个元素,是指它们的差位于这个特殊的锥中。在这种情形, n × n n \times n n × n Hermite 矩阵的集合是实线性空间,而半正定矩阵的集合是闭凸锥。这显然是 R \mathbb{R} R 自身为实线性空间而非负实数集为闭凸锥这一熟知情形的推广。不过在 R \mathbb{R} R 上给出的是“普通”的(全)序(而不仅仅是偏序)。
矩阵间的各种其他的“不等”概念(其中最值得注意的是按照分量确定实矩阵的大小)可以用类似的方法来定义:把矩阵的一个锥看作非负实数的推广,并且说 A A A “大于或等于” B B B ,是指它们的差 A − B A - B A − B 位于这个锥中,一般,这样一些不同的“不等”概念可以通过上下文来区别,不过它们的效用取决于与实数集的类似推广到什么程度以及这个“不等”概念与其他不等关系(例如特征值、行列式等之间的不等关系)有多么密切的关系。
注意, A A A 是半正定矩阵,当且仅当 A ⩾ 0 A \geqslant 0 A ⩾ 0 ;而 A A A 是正定矩阵,当且仅当 A > 0 A > 0 A > 0 ,其中 0 0 0 是与 A A A 同阶的零矩阵。
练习 用例子说明半正定偏序关系在下述情形与实数的全序关系不同:如果 A ⩾ B A \geqslant B A ⩾ B 且 A A A 不
等于 B B B ,则得不出 A > B A > B A > B
下面,说明半正定次序关系的某些性质,其中每一个可以看作实数的普通次序关系的推广。其类似程度一般是很强的。
7.7.2 论断 如果 A , B ∈ M n A, B \in M_{n} A , B ∈ M n 是Hermite矩阵,则
A ⩾ B 蕴 涵 T ∗ A T ⩾ T ∗ B T A \geqslant B \text {蕴 涵} T ^ {*} A T \geqslant T ^ {*} B T A ⩾ B 蕴 涵 T ∗ A T ⩾ T ∗ BT 对所有 T ∈ M n , m T \in M_{n,m} T ∈ M n , m 成立;如果 m ⩽ n m \leqslant n m ⩽ n ,且 T ∈ M n , m T \in M_{n,m} T ∈ M n , m 有秩 m m m ,则还有
A > B 蕴 涵 T ∗ A T > T ∗ B T . A > B \text {蕴 涵} T ^ {*} A T > T ^ {*} B T. A > B 蕴 涵 T ∗ A T > T ∗ BT . 证明:如果 A − B A - B A − B 是半正定矩阵,则 y ∗ ( A − B ) y ≥ 0 y^{*}(A - B)y\geq 0 y ∗ ( A − B ) y ≥ 0 对所有 y ∈ C n y\in \mathbf{C}^n y ∈ C n 成立.
于是 x ∗ ( T ∗ A T − T ∗ B T ) x = ( T x ) ∗ ( A − B ) ( T x ) ⩾ 0 x^{*}(T^{*}AT - T^{*}BT)_{x} = (Tx)^{*}(A - B)(Tx)\geqslant 0 x ∗ ( T ∗ A T − T ∗ BT ) x = ( T x ) ∗ ( A − B ) ( T x ) ⩾ 0 对所有 x ∈ C n x\in \mathbf{C}^n x ∈ C n 成立,而这表示 T ∗ A T − T ∗ B T T^{*}AT - T^{*}BT T ∗ A T − T ∗ BT 是半正定矩阵,因此 T ∗ A T ⩾ T ∗ B T T^{*}AT\geqslant T^{*}BT T ∗ A T ⩾ T ∗ BT ,注意,这推广了(7.1.6),而其证明本质上是相同的. □
练习 验证上述第二个论断以完成证明.
7.7.3 定理 设 A , B ∈ M n A, B \in M_{n} A , B ∈ M n 是Hermite 矩阵,又假定 A A A 是正定矩阵且 B B B 是半的定矩阵,则 A ⩾ B A \geqslant B A ⩾ B 当且仅当 ρ ( B A − 1 ) ⩽ 1 \rho(BA^{-1}) \leqslant 1 ρ ( B A − 1 ) ⩽ 1 ,而 A > B A > B A > B 当且仅当 ρ ( B A − 1 ) < 1 \rho(BA^{-1}) < 1 ρ ( B A − 1 ) < 1 .
证明:根据(7.6.5),可以求出非奇异矩阵 C ∈ M n C \in M_{n} C ∈ M n 使得 A = C I C ∗ A = CIC^{*} A = C I C ∗ 和 B = C D C ∗ B = CDC^{*} B = C D C ∗ ,其中 D = diag ( d 1 , d 2 , ⋯ , d n ) D = \operatorname{diag}(d_{1}, d_{2}, \cdots, d_{n}) D = diag ( d 1 , d 2 , ⋯ , d n ) 是对角矩阵。于是 A ⩾ B A \geqslant B A ⩾ B 当且仅当 C [ I − D ] C ∗ ⩾ 0 C[I - D]C^{*} \geqslant 0 C [ I − D ] C ∗ ⩾ 0 ,这又当且仅当 d i ⩽ 1 d_{i} \leqslant 1 d i ⩽ 1 对所有 i = 1 , 2 , ⋯ i = 1, 2, \cdots i = 1 , 2 , ⋯ 成立。但是因为 B A − 1 = C D C ∗ C ∗ − 1 C − 1 = C D C − 1 BA^{-1} = CDC^{*}C^{*^{-1}}C^{-1} = CDC^{-1} B A − 1 = C D C ∗ C ∗ − 1 C − 1 = C D C − 1 ,所以 B A − 1 BA^{-1} B A − 1 的特征值正好是 d 1 , d 2 , ⋯ , d n d_{1}, d_{2}, \cdots, d_{n} d 1 , d 2 , ⋯ , d n [根据(7.6.3)它们都是非负的],且所有 d i ⩽ 1 d_{i} \leqslant 1 d i ⩽ 1 当且仅当 ρ ( B A − 1 ) ⩽ 1 \rho(BA^{-1}) \leqslant 1 ρ ( B A − 1 ) ⩽ 1 。仔细分析刚用过的那些不等式便可得出后一个论断。
7.7.4 推论 如果 A , B ∈ M n A, B \in M_{n} A , B ∈ M n 是正定矩阵,则
(a) A ⩾ B A \geqslant B A ⩾ B 当且仅当 B 1 ⩾ A 1 B^{1} \geqslant A^{1} B 1 ⩾ A 1 ; (b)如果 A ⩾ B A\geqslant B A ⩾ B ,则 det A ⩾ det B \operatorname *{det}A\geqslant \operatorname *{det}B det A ⩾ det B 且 tr A ⩾ tr B ; \operatorname {tr}A\geqslant \operatorname {tr}B; tr A ⩾ tr B ; (c) 更一般地,如果 A A A 和 B B B 的各相应特征值按同一(递增或递减)顺序排列,则 λ k ( A ) ⩾ λ k ( B ) \lambda_{k}(A) \geqslant \lambda_{k}(B) λ k ( A ) ⩾ λ k ( B ) 对所有 k = 1 , 2 , … , n k = 1, 2, \dots, n k = 1 , 2 , … , n 成立.
证明:我们知道 A ⩾ B A \geqslant B A ⩾ B 当且仅当 ρ ( B A − 1 ) ⩽ 1 \rho(BA^{-1}) \leqslant 1 ρ ( B A − 1 ) ⩽ 1 。但是 ρ ( B A − 1 ) = ρ ( A − 1 B ) \rho(BA^{-1}) = \rho(A^{-1}B) ρ ( B A − 1 ) = ρ ( A − 1 B ) ,而(7.7.3)说明 ρ ( A − 1 B ) ⩽ 1 \rho(A^{-1}B) \leqslant 1 ρ ( A − 1 B ) ⩽ 1 当且仅当 B − 1 ⩾ A − 1 B^{-1} \geqslant A^{-1} B − 1 ⩾ A − 1 。如果 A ⩾ B A \geqslant B A ⩾ B ,则 ρ ( B A − 1 ) ⩽ 1 \rho(BA^{-1}) \leqslant 1 ρ ( B A − 1 ) ⩽ 1 ,又由(7.6.3)可知, B A − 1 BA^{-1} B A − 1 的所有特征值是非负的,所以得知它们必定位于区间 ( 0 , 1 ] (0, 1] ( 0 , 1 ] 内。另一方面,它们的乘积至多为 1,所以 det ( B A − 1 ) ⩽ 1 \det(BA^{-1}) \leqslant 1 det ( B A − 1 ) ⩽ 1 ,因而 det A ⩾ det B \det A \geqslant \det B det A ⩾ det B 。在(7.7.3)的证明中,已知 A = C C ∗ A = CC^{*} A = C C ∗ 和 B = C D C ∗ B = CDC^{*} B = C D C ∗ ,其中 C = [ c n ] ∈ M n C = [c_{n}] \in M_{n} C = [ c n ] ∈ M n , D = diag ( d 1 , d 2 , ⋯ , d n ) ∈ M n D = \operatorname{diag}(d_{1}, d_{2}, \cdots, d_{n}) \in M_{n} D = diag ( d 1 , d 2 , ⋯ , d n ) ∈ M n ,且对所有 i = 1 , 2 , ⋯ , n i = 1, 2, \cdots, n i = 1 , 2 , ⋯ , n , 0 ⩽ d i ⩽ 1 0 \leqslant d_{i} \leqslant 1 0 ⩽ d i ⩽ 1 。不难算出。
tr A = tr C C ⋅ − ∑ i , j = 1 n ∣ c i j ∣ 2 , \operatorname {t r} A = \operatorname {t r} C C ^ {\cdot} - \sum_ {i, j = 1} ^ {n} | c _ {i j} | ^ {2}, tr A = tr C C ⋅ − i , j = 1 ∑ n ∣ c ij ∣ 2 , 1
tr B = tr C D C ∗ = tr D C ∗ C = ∑ i , j = 1 n d i ∣ c η ∣ 2 \operatorname {t r} B = \operatorname {t r} C D C ^ {*} = \operatorname {t r} D C ^ {*} C = \sum_ {i, j = 1} ^ {n} d _ {i} | c _ {\eta} | ^ {2} tr B = tr C D C ∗ = tr D C ∗ C = i , j = 1 ∑ n d i ∣ c η ∣ 2 ⩽ ∑ i , j = 1 n 1 i c i j ∣ 2 = tr A . \leqslant \sum_ {i, j = 1} ^ {n} \frac {1}{i} c _ {i j} | ^ {2} = \operatorname {t r} A. ⩽ i , j = 1 ∑ n i 1 c ij ∣ 2 = tr A . 471
最后一个论断(它蕴涵行列式不等式和迹不等式,对此,我们已经给出了两个无关的证明)可直接从Hermite矩阵的有序特征值的Courant-Fischer变分特征推出,并且包括在推论(4.3.3)中. □
练习 如果 A > B > 0 A > B > 0 A > B > 0 ,证明 det A > det B \operatorname{det} A > \operatorname{det} B det A > det B 和 tr A > tr B \operatorname{tr} A > \operatorname{tr} B tr A > tr B .
当把关于分块矩阵的逆的形式(0.7.3)限制到Hermite矩阵的情形时,便得出下述有用的公式:
[ A B B ∗ C ] − 1 = [ ( A − B C − 1 B ∗ ) − 1 A − 1 B ( B ∗ A 1 B − C ) − 1 ( B ∗ A − 1 B − C ) − 1 B ∗ A 1 ( C − B ∗ A − 1 B ) − 1 ] . (7.7.5) \left[ \begin{array}{l l} A & B \\ B ^ {*} & C \end{array} \right] ^ {- 1} = \left[ \begin{array}{c c} (A - B C ^ {- 1} B ^ {*}) ^ {- 1} & A ^ {- 1} B (B ^ {*} A ^ {1} B - C) ^ {- 1} \\ (B ^ {*} A ^ {- 1} B - C) ^ {- 1} B ^ {*} A ^ {1} & (C - B ^ {*} A ^ {- 1} B) ^ {- 1} \end{array} \right]. \tag {7.7.5} [ A B ∗ B C ] − 1 = [ ( A − B C − 1 B ∗ ) − 1 ( B ∗ A − 1 B − C ) − 1 B ∗ A 1 A − 1 B ( B ∗ A 1 B − C ) − 1 ( C − B ∗ A − 1 B ) − 1 ] . ( 7.7.5 ) 在这个公式中,假定 A A A 和 C C C 是方阵且需求逆的矩阵是非奇异的.
如果矩阵 [ A B B ∗ C ] \left[ \begin{array}{ll}A & B\\ B^{*} & C \end{array} \right] [ A B ∗ B C ] 是正定矩阵,则 [ A B B ∗ C ] − 1 \left[ \begin{array}{ll}A & B\\ B^{*} & C \end{array} \right]^{-1} [ A B ∗ B C ] − 1 存在且为正定矩阵.于是从(7.7.5)和(7.1.2)推出 ( A − B C − 1 B ∗ ) − 1 (A - BC^{-1}B^{*})^{-1} ( A − B C − 1 B ∗ ) − 1 和 A − B C − 1 B ∗ A - BC^{-1}B^{*} A − B C − 1 B ∗ 是正定矩阵.类似地, C − B ∗ A − 1 B C - B^{*}A^{-1}B C − B ∗ A − 1 B , A A A 和 C C C 是正定矩阵.因此,如果分块Hermite矩阵 [ A B B ∗ C ] \left[ \begin{array}{ll}A & B\\ B^{*} & C \end{array} \right] [ A B ∗ B C ] 是正定的,则有
A > 0 , C > 0 , A > B C 1 B ∗ 和 C > B ∗ A − 1 B . A > 0, \quad C > 0, \quad A > B C ^ {1} B ^ {*} \text {和} C > B ^ {*} A ^ {- 1} B. A > 0 , C > 0 , A > B C 1 B ∗ 和 C > B ∗ A − 1 B . 7.7.6 定理 假定一个Hermite矩阵块分成
[ A B B ∗ C ] , \left[ \begin{array}{c c} A & B \\ B ^ {*} & C \end{array} \right], [ A B ∗ B C ] , 其中 A A A 和 C C C 是方阵。这个矩阵是正定的当且仅当 A A A 是正定矩阵且 C > B ∗ A − 1 B C > B^{*}A^{-1}B C > B ∗ A − 1 B 。此外,这个条件等价于一定有 ρ ( B ∗ A − 1 B C − 1 ) < 1 \rho(B^{*}A^{-1}BC^{-1}) < 1 ρ ( B ∗ A − 1 B C − 1 ) < 1 。
证明:这两个条件的必要性已在上面做了论述。关于充分性,假定 A A A 是正定矩阵且 C > B ∗ A − 1 B C > B^{*}A^{-1}B C > B ∗ A − 1 B ,对 X = − A − 1 B X = -A^{-1}B X = − A − 1 B ,算出
[ I 0 X ⋅ I ] [ A B B ⋅ C ] [ I X 0 I ] = [ A 0 0 C − B ⋅ A − 1 B ] , \left[ \begin{array}{l l} I & 0 \\ X ^ {\cdot} & I \end{array} \right] \left[ \begin{array}{l l} A & B \\ B ^ {\cdot} & C \end{array} \right] \left[ \begin{array}{l l} I & X \\ 0 & I \end{array} \right] = \left[ \begin{array}{l l} A & 0 \\ 0 & C - B ^ {\cdot} A ^ {- 1} B \end{array} \right], [ I X ⋅ 0 I ] [ A B ⋅ B C ] [ I 0 X I ] = [ A 0 0 C − B ⋅ A − 1 B ] , 因为右边是正定矩阵,所以
[ A B B ∗ C ] \left[ \begin{array}{c c} A & B \\ B ^ {*} & C \end{array} \right] [ A B ∗ B C ] 472
的正定性可从所给出的相合及(7.1.6)或(7.7.2)推出。把(7.7.3)应用于不等式 C > B ∗ A − 1 B C > B^{*}A^{-1}B C > B ∗ A − 1 B 便得到后一个论断。
练习 如果 [ A B B ∗ C ] > 0 \left[ \begin{array}{cc}A & B\\ B^* & C \end{array} \right] > 0 [ A B ∗ B C ] > 0 ,证明 det C > det B ∗ A − 1 B \operatorname *{det}C > \operatorname *{det}B^{*}A^{-1}B det C > det B ∗ A − 1 B 和 det A > det B C − 1 B ∗ \operatorname *{det}A > \operatorname *{det}BC^{-1}B^{*} det A > det B C − 1 B ∗ ,当 B ∈ M n , 1 B\in M_{n,1} B ∈ M n , 1 时,这说明什么?证明,如果 B B B 是方阵,则 det A det C ⩾ ∣ det B ∣ 2 . \operatorname *{det}A\operatorname *{det}C\geqslant |\operatorname *{det}B|^2. det A det C ⩾ ∣ det B ∣ 2 .
练习 假定 A ∈ M n A \in M_{n} A ∈ M n , C ∈ M n C \in M_{n} C ∈ M n 和 B ∈ M n , m B \in M_{n,m} B ∈ M n , m , 又假定 A A A 和 C C C 都是正定矩阵. 证明 [ A B B ∗ C ] ⩾ 0 \left[ \begin{array}{cc} A & B \\ B^* & C \end{array} \right] \geqslant 0 [ A B ∗ B C ] ⩾ 0
当且仅当 ρ ( B ∗ A − 1 B C − 1 ) ⩽ 1 \rho(B^{*}A^{-1}BC^{-1}) \leqslant 1 ρ ( B ∗ A − 1 B C − 1 ) ⩽ 1 .
(7.7.6)中的分块正定矩阵与出现在复变函数和调和分析中的某些双线性不等式有关,这些不等式都具有正定偏序的某些性质。
7.7.7 定理 设 A ∈ M n A \in M_{n} A ∈ M n 和 C ∈ M m C \in M_{m} C ∈ M m 是正定矩阵,且设 B ∈ M n , m B \in M_{n,m} B ∈ M n , m ,则下列条件等价:
(a) ( x ∗ A x ) ( y ∗ C y ) ⩾ ∣ x ∗ B y ∣ 2 (x^{*}Ax)(y^{*}Cy)\geqslant |x^{*}By|^{2} ( x ∗ A x ) ( y ∗ C y ) ⩾ ∣ x ∗ B y ∣ 2 对所有 x ∈ C n x\in \mathbf{C}^n x ∈ C n 和所有 y ∈ C m y\in \mathbf{C}^m y ∈ C m 成立; (b) x ∗ A x + y ∗ C y ⩾ 2 ∣ x ∗ B y ∣ x^{*}Ax + y^{*}Cy\geqslant 2|x^{*}By| x ∗ A x + y ∗ C y ⩾ 2∣ x ∗ B y ∣ 对所有 x ∈ C n x\in \mathbf{C}^n x ∈ C n 和所有 y ∈ C m y\in \mathbf{C}^m y ∈ C m 成立; (c) ρ ( B ∗ A − 1 B C − 1 ) ⩽ 1 \rho(B^{*}A^{-1}BC^{-1}) \leqslant 1 ρ ( B ∗ A − 1 B C − 1 ) ⩽ 1 ; (d) [ A B B ′ C ] ⩾ 0. \left[ \begin{array}{ll}A & B\\ B^{\prime} & C \end{array} \right]\geqslant 0. [ A B ′ B C ] ⩾ 0.
证明:我们来证明,(a)蕴涵(b),(b)蕴涵(c),(c)蕴涵(a);已经知道(c)和(d)是等价的.如果(a)成立,则由算术一几何平均值不等式有
1 2 ( x ∗ A x + y ∗ C y ) ⩾ ( x ∗ A x ) 1 / 2 ( y ∗ C y ) 1 / 2 ⩾ ∣ x ∗ B y ∣ , \frac {1}{2} \left(x ^ {*} A x + y ^ {*} C y\right) \geqslant \left(x ^ {*} A x\right) ^ {1 / 2} \left(y ^ {*} C y\right) ^ {1 / 2} \geqslant | x ^ {*} B y |, 2 1 ( x ∗ A x + y ∗ C y ) ⩾ ( x ∗ A x ) 1/2 ( y ∗ C y ) 1/2 ⩾ ∣ x ∗ B y ∣ , 所以(b)成立.如果假定(b)成立,则
x ∗ A x + y ∗ C y = ( A 1 , 2 x ) ∗ ( A 1 , 2 x ) + ( C 1 , 2 y ) ∗ ( C 1 , 2 y ) ⩾ 2 ∣ x ∗ B y ∣ x^{*}Ax + y^{*}Cy = (A^{1,2}x)^{*}(A^{1,2}x) + (C^{1,2}y)^{*}(C^{1,2}y)\geqslant 2\mid x^{*}By\mid x ∗ A x + y ∗ C y = ( A 1 , 2 x ) ∗ ( A 1 , 2 x ) + ( C 1 , 2 y ) ∗ ( C 1 , 2 y ) ⩾ 2 ∣ x ∗ B y ∣ ,因而对每个 x ∈ C n x\in \mathbf{C}^n x ∈ C n 和每个 y ∈ C m y\in \mathbf{C}^m y ∈ C m 有
x ⋅ x + y ⋅ y ⩾ 2 ∣ ( A − 12 x ) ⋅ B ( C 12 y ) ∣ = 2 ∣ x ⋅ A − 1 / 2 B C − 1 / 2 y ∣ . x ^ {\cdot} x + y ^ {\cdot} y \geqslant 2 \mid (A ^ {- 1 2} x) ^ {\cdot} B (C ^ {1 2} y) \mid = 2 \mid x ^ {\cdot} A ^ {- 1 / 2} B C ^ {- 1 / 2} y \mid . x ⋅ x + y ⋅ y ⩾ 2 ∣ ( A − 12 x ) ⋅ B ( C 12 y ) ∣= 2 ∣ x ⋅ A − 1/2 B C − 1/2 y ∣ . 如果在这个不等式中令 x ≡ A 1 / 2 B C − 1 / 2 y x \equiv A^{1/2} BC^{-1/2} y x ≡ A 1/2 B C − 1/2 y ,便得
y ∗ C 1 / 2 B ∗ A − 1 B C 1 / 2 y + y ∗ y ⩾ 2 ∣ y ∗ C − 1 / 2 B ∗ A 1 B C − 1 / 2 y ∣ . y ^ {*} C ^ {1 / 2} B ^ {*} A ^ {- 1} B C ^ {1 / 2} y + y ^ {*} y \geqslant 2 \left| y ^ {*} C ^ {- 1 / 2} B ^ {*} A ^ {1} B C ^ {- 1 / 2} y \right|. y ∗ C 1/2 B ∗ A − 1 B C 1/2 y + y ∗ y ⩾ 2 y ∗ C − 1/2 B ∗ A 1 B C − 1/2 y . 因为矩阵 C − 1 , 2 B ∗ A − 1 , 2 B C − 1 , 2 C^{-1,2}B^{*}A^{-1,2}BC^{-1,2} C − 1 , 2 B ∗ A − 1 , 2 B C − 1 , 2 是半正定的,这等价于对所有 y ∈ C n y \in \mathbf{C}^n y ∈ C n 有
y ^ {*} y \geqslant y ^ {*} C ^ {- 1} ^ {2} B ^ {*} A ^ {1} B C ^ {- 1 ^ {\prime}} y.
如果选取 y y y 为 C − 1 , 2 B ∗ A 1 B C − 1 , 2 C^{-1,2}B^{*}A^{1}BC^{-1,2} C − 1 , 2 B ∗ A 1 B C − 1 , 2 的特征向量,这个不等式说明,(一定非负)的相应特征值不大于1,于是得知谱半径至多是1;即 1 ⩾ ρ ( C − 1 / 2 B ∗ A 1 B C 1 / 2 ) = ρ ( B ∗ A 1 B C − 1 ) 1 \geqslant \rho(C^{-1/2}B^{*}A^{1}BC^{1/2}) = \rho(B^{*}A^{1}BC^{-1}) 1 ⩾ ρ ( C − 1/2 B ∗ A 1 B C 1/2 ) = ρ ( B ∗ A 1 B C − 1 ) ,因而(c)成立。最后,如果(c)成立,则对任意 x ∈ C n x \in \mathbf{C}^n x ∈ C n 和任意 y ∈ C m y \in \mathbf{C}^m y ∈ C m 有
∣ x ′ ( A − 12 B C 172 y ) ∣ 2 ⩽ ∥ x ∥ 2 2 ∥ A − 172 B C 172 y ∥ 2 2 = ( x ∗ x ) ( y ∗ C 12 B ∗ A 1 B C − 12 y ) ⩽ ( x ∗ x ) ( y ∗ y ) , \begin{array}{l} \left| x ^ {\prime} \left(A ^ {- 1 2} B C ^ {1 7 2} y\right) \right| ^ {2} \leqslant \left\| x \right\| _ {2} ^ {2} \left\| A ^ {- 1 7 2} B C ^ {1 7 2} y \right\| _ {2} ^ {2} \\ = \left(x ^ {*} x\right) \left(y ^ {*} C ^ {1 2} B ^ {*} A ^ {1} B C ^ {- 1 2} y\right) \leqslant \left(x ^ {*} x\right) \left(y ^ {*} y\right), \\ \end{array} x ′ ( A − 12 B C 172 y ) 2 ⩽ ∥ x ∥ 2 2 A − 172 B C 172 y 2 2 = ( x ∗ x ) ( y ∗ C 12 B ∗ A 1 B C − 12 y ) ⩽ ( x ∗ x ) ( y ∗ y ) , 其中 ∥ x ∥ 2 ≡ ( x ∗ x ) 1 / 2 \| x\| _2\equiv (x^* x)^{1 / 2} ∥ x ∥ 2 ≡ ( x ∗ x ) 1/2 是Euclid范数.如果我们现在作代换 x → A 1 / 2 x x\to A^{1 / 2}x x → A 1/2 x 和 y → C 1 / 2 y y\rightarrow C^{1 / 2}y y → C 1/2 y ,则对所有 x ∈ C n x\in \mathbf{C}^n x ∈ C n 和所有 y ∈ C n y\in \mathbf{C}^n y ∈ C n ,有
∣ x ∗ B y ∣ 2 ⩽ ( x ∗ A r ) ( y ′ C y ) . \left| x ^ {*} B y \right| ^ {2} \leqslant \left(x ^ {*} A r\right) \left(y ^ {\prime} C y\right). ∣ x ∗ B y ∣ 2 ⩽ ( x ∗ A r ) ( y ′ C y ) . 对于由(7.7.5)产生的另一种不等式,我们考虑能应用于正定矩阵的两种可能运算:基于指定的指标集选定主子矩阵与求矩阵的逆。我们知道这两种运算保持正定性,但是按两种可能的顺序实施这两运算的结果之间存在什么关系呢?研究结果表明,这两种运算“除了相差一个不等关系以外是可交换的”。
7.7.8 定理 假定 P ∈ M n P \in M_{n} P ∈ M n 是正定矩阵,且设 S ⊂ { 1 , 2 , … , n } S \subset \{1, 2, \dots, n\} S ⊂ { 1 , 2 , … , n } 是一个指标集,则
P 1 ( S ) ⩾ [ P ( S ) ] − 1 , P ^ {1} (S) \geqslant [ P (S) ] ^ {- 1}, P 1 ( S ) ⩾ [ P ( S ) ] − 1 , 其中,这个不等式左边是划去 P − 1 P^{-1} P − 1 的标号为 S S S 的诸行和诸列后所确定的 P − 1 P^{-1} P − 1 的主子矩阵,而右边是 P P P 的相应主子矩阵的逆。
证明:因为正定矩阵的集合在置换相合下封闭,我们可以假定
P = [ A B B ∗ C ] P = \left[ \begin{array}{l l} A & B \\ B ^ {*} & C \end{array} \right] P = [ A B ∗ B C ] 及 P ( S ) = A P(S) = A P ( S ) = A ,于是 P − 1 ( S ) = ( A − B C − 1 B ∗ ) − 1 P^{-1}(S) = (A - BC^{-1}B^{*})^{-1} P − 1 ( S ) = ( A − B C − 1 B ∗ ) − 1 且 [ P ( S ) ] † = A − 1 [P(S)]^{\dagger} = A^{-1} [ P ( S ) ] † = A − 1 ,由于 C > 0 C > 0 C > 0 (这是因为 P > 0 P > 0 P > 0 ),所以有 B C − 1 B ∗ ⩾ 0 BC^{-1}B^{*} \geqslant 0 B C − 1 B ∗ ⩾ 0 和
A ⩾ A − B C − 1 B ⋅ ⩾ 0. A \geqslant A - B C ^ {- 1} B ^ {\cdot} \geqslant 0. A ⩾ A − B C − 1 B ⋅ ⩾ 0. 于是所断言的不等式可由(7.7.4a)推出.
定理(7.7.8)可以解释为“一个正定矩阵的主子矩阵的逆小于或等于该矩阵的逆的相应主子矩阵。”
(7.7.8)的一个应用是从矩阵的 Kronecker 乘积中特殊选择一个主子矩阵来产生其 Hadamard 乘积。如果 A , B ∈ M n A, B \in M_n A , B ∈ M n ,又如果 S = { 1 , n + 2 , 2 n + 3 , 3 n + 4 , … , n 2 } S = \{1, n + 2, 2n + 3, 3n + 4, \dots, n^2\} S = { 1 , n + 2 , 2 n + 3 , 3 n + 4 , … , n 2 } ,则 A ∘ B = ( A ⊗ B ) ( S ) A \circ B = (A \otimes B)(S) A ∘ B = ( A ⊗ B ) ( S ) 。若 A A A 和 B B B 可逆,则 A ⊗ B A \otimes B A ⊗ B 可逆且 ( A ⊗ B ) − 1 = A − 1 ⊗ B − 1 (A \otimes B)^{-1} = A^{-1} \otimes B^{-1} ( A ⊗ B ) − 1 = A − 1 ⊗ B − 1 。因此,如果 A A A 和 B B B 是正定矩阵且把(7.7.8)用于 P = A ⊗ B P = A \otimes B P = A ⊗ B ,则 A − 1 ∘ B − 1 = ( A − 1 ⊗ B − 1 ) ( S ) = ( A ⊗ B ) − 1 ( S ) ⩾ [ ( A ⊗ B ) ( S ) ] − 1 = ( A ∘ B ) − 1 A^{-1} \circ B^{-1} = (A^{-1} \otimes B^{-1})(S) = (A \otimes B)^{-1}(S) \geqslant [(A \otimes B)(S)]^{-1} = (A \circ B)^{-1} A − 1 ∘ B − 1 = ( A − 1 ⊗ B − 1 ) ( S ) = ( A ⊗ B ) − 1 ( S ) ⩾ [( A ⊗ B ) ( S ) ] − 1 = ( A ∘ B ) − 1 。如果取 B = A B = A B = A ,这说明 A − 1 ∘ A − 1 ⩾ ( A ∘ A ) − 1 A^{-1} \circ A^{-1} \geqslant (A \circ A)^{-1} A − 1 ∘ A − 1 ⩾ ( A ∘ A ) − 1 。但是,如果取 B = A − 1 B = A^{-1} B = A − 1 ,这便说明,当 A A A 是正定矩阵时, A − 1 ∘ A ⩾ ( A ∘ A − 1 ) − 1 = ( A − 1 ∘ A ) − 1 A^{-1} \circ A \geqslant (A \circ A^{-1})^{-1} = (A^{-1} \circ A)^{-1} A − 1 ∘ A ⩾ ( A ∘ A − 1 ) − 1 = ( A − 1 ∘ A ) − 1 。
这后一个不等式说明, A − 1 ∘ A A^{-1} \circ A A − 1 ∘ A 优于它自己的逆。关于 A − 1 ∘ A A^{-1} \circ A A − 1 ∘ A ,这指的是什么?如果 C C C 是正定矩阵,且 C = U Λ U ∗ C = U\Lambda U^{*} C = U Λ U ∗ , Λ = d i a g ( λ 1 , … , λ n ) \Lambda = \mathrm{diag}(\lambda_1, \dots, \lambda_n) Λ = diag ( λ 1 , … , λ n ) ,其中所有 λ i > 0 \lambda_i > 0 λ i > 0 ,则 C ⩾ C − 1 C \geqslant C^{-1} C ⩾ C − 1 当且仅当 λ i ⩾ 1 \lambda_i \geqslant 1 λ i ⩾ 1 ,因而 C ⩾ I ⩾ C − 1 C \geqslant I \geqslant C^{-1} C ⩾ I ⩾ C − 1 。我们把这些结论总结为
7.7.9 定理 设 A , B ∈ M n A, B \in M_{n} A , B ∈ M n 是正定矩阵,则
(a) A − 1 ∘ B − 1 ⩾ ( A ∘ B ) − 1 A^{-1} \circ B^{-1} \geqslant (A \circ B)^{-1} A − 1 ∘ B − 1 ⩾ ( A ∘ B ) − 1 ; (b) A − 1 ∘ A − 1 ⩾ ( A ∘ A ) − 1 A^{-1} \circ A^{-1} \geqslant (A \circ A)^{-1} A − 1 ∘ A − 1 ⩾ ( A ∘ A ) − 1 ; (c) A − 1 ∘ A ⩾ I ⩾ ( A − 1 ∘ A ) − 1 A^{-1} \circ A \geqslant I \geqslant (A^{-1} \circ A)^{-1} A − 1 ∘ A ⩾ I ⩾ ( A − 1 ∘ A ) − 1 .
因为 A − 1 A = I A^{-1}A = I A − 1 A = I ,所以(c)的前一部分说明 A − 1 ∘ A ⩾ A − 1 A A^{-1}\circ A\geqslant A^{-1}A A − 1 ∘ A ⩾ A − 1 A ;即在这种情形,Hadamard乘法优于普通乘法.
习题 一般,设 A A A , B ∈ M n B \in M_{n} B ∈ M n 是Hermite矩阵,且 A ⩾ B A \geqslant B A ⩾ B ,证明,如果 λ 1 ⩽ λ 2 ⩽ ⋯ ⩽ λ n \lambda_1 \leqslant \lambda_2 \leqslant \dots \leqslant \lambda_n λ 1 ⩽ λ 2 ⩽ ⋯ ⩽ λ n 是 A A A 的有序特征值,且 μ 1 ⩽ μ 2 ⩽ ⋯ ⩽ μ n \mu_1 \leqslant \mu_2 \leqslant \dots \leqslant \mu_n μ 1 ⩽ μ 2 ⩽ ⋯ ⩽ μ n 是 B B B 的有序特征值,则 λ i ⩾ μ i \lambda_i \geqslant \mu_i λ i ⩾ μ i , i = 1 , 2 , … , n i = 1, 2, \dots, n i = 1 , 2 , … , n 。但是用例子说明逆命题不总是成立的。
如果 A 1 , A 2 , B 1 , B 2 ∈ M n A_{1}, A_{2}, B_{1}, B_{2} \in M_{n} A 1 , A 2 , B 1 , B 2 ∈ M n 都是Hermite矩阵,证明,如果 A 1 ⩾ B 2 A_{1} \geqslant B_{2} A 1 ⩾ B 2 ,且 A 2 ⩾ B 2 A_{2} \geqslant B_{2} A 2 ⩾ B 2 ,则 A 1 + A 2 ⩾ B 1 + B 2 A_{1} + A_{2} \geqslant B_{1} + B_{2} A 1 + A 2 ⩾ B 1 + B 2 .
设 A , B , C ∈ M n A, B, C \in M_{n} A , B , C ∈ M n 是Hermite矩阵;假定 A ⩾ B A \geqslant B A ⩾ B 和 C ⩾ 0 C \geqslant 0 C ⩾ 0 。证明 A ∘ C ⩾ B ∘ C A \circ C \geqslant B \circ C A ∘ C ⩾ B ∘ C .
设 A , B , C , D ∈ M n A, B, C, D \in M_n A , B , C , D ∈ M n 是Hermite矩阵,且假定 A ⩾ B ⩾ 0 A \geqslant B \geqslant 0 A ⩾ B ⩾ 0 和 C ⩾ D ⩾ 0 C \geqslant D \geqslant 0 C ⩾ D ⩾ 0 。利用前一个习题证明 A ∘ C ⩾ B ∘ D ⩾ 0 A \circ C \geqslant B \circ D \geqslant 0 A ∘ C ⩾ B ∘ D ⩾ 0 .
如果 A , B ∈ M n A, B \in M_{n} A , B ∈ M n 是使得 A ⩾ B A \geqslant B A ⩾ B 的Hermite 矩阵,又如果 J ⊂ { 1 , 2 , … , n } J \subset \{1, 2, \dots, n\} J ⊂ { 1 , 2 , … , n } 是任意指标
集. 证明 A ( J ) ⩾ B ( J ) A(J) \geqslant B(J) A ( J ) ⩾ B ( J ) .
说明(7.7.6)推广了 n = 2 n = 2 n = 2 时的(7.2.5).
如果 C ∈ M 1 C \in M_1 C ∈ M 1 ,(7.7.6) 说的是什么?如何为一个正定矩阵增添一行和一列且仍保持正定性?
证明,(7.7.8)的不等式是严格的,当且仅当 P ( S , S ′ ) P(S, S') P ( S , S ′ ) 有满行秩,而当 P ( S , S ′ ) = 0 P(S, S') = 0 P ( S , S ′ ) = 0 时恰好等式成立。这里, P ( S , S ′ ) P(S, S') P ( S , S ′ ) 是从 P P P 中划去标号为 S S S 的诸行和标号为 S ′ S' S ′ 的诸列后得到的 P P P 的子矩阵。提示:证明 rank [ P − 1 ( S ) − P ( S ) − 1 ] = rank P ( S , S ′ ) \operatorname{rank}[P^{-1}(S) - P(S)^{-1}] = \operatorname{rank} P(S, S') rank [ P − 1 ( S ) − P ( S ) − 1 ] = rank P ( S , S ′ ) 。
如果 A ∈ M n A \in M_{n} A ∈ M n 是Hermite矩阵,证明 I ⩾ A I \geqslant A I ⩾ A 当且仅当 A A A 的所有特征值小于或等于1.
试用(7.7.7)给出(7.4)节习题11的另一个解法。提示:证明,若 B > 0 B > 0 B > 0 ,则 [ B I ⌊ I B − 1 ] ⩾ 0 \left[ \begin{array}{cc} B & I \\ \lfloor I & B^{-1} \end{array} \right] \geqslant 0 [ B ⌊ I I B − 1 ] ⩾ 0 .
考虑 A = C A = C A = C 时的(7.7.7). 证明下列条件等价:
(a) ( x ∗ A x ) ( y ∗ A y ) ⩾ ∣ x ∗ B y ∣ 2 (x^{*}Ax)(y^{*}Ay)\geqslant |x^{*}By|^{2} ( x ∗ A x ) ( y ∗ A y ) ⩾ ∣ x ∗ B y ∣ 2 对所有 x x x , y ∈ C n y\in \mathbf{C}^n y ∈ C n 成立;
(b) x ∗ A x + y ∗ A y ⩾ 1 2 ∣ x ∗ B y ∣ 2 x^{*}Ax + y^{*}Ay\geqslant \frac{1}{2}\mid x^{*}By\mid^{2} x ∗ A x + y ∗ A y ⩾ 2 1 ∣ x ∗ B y ∣ 2 对所有 x , x ∈ C n x,x\in \mathbf{C}^n x , x ∈ C n 成立:
(c) ρ ( B ′ A − 1 B A − 1 ) ⩽ 1 \rho(B^{\prime}A^{-1}BA^{-1}) \leqslant 1 ρ ( B ′ A − 1 B A − 1 ) ⩽ 1 ;
(d) x ∗ A x ⩾ ∣ x ∗ B x ∣ x^{*}Ax\geqslant |x^{*}Bx| x ∗ A x ⩾ ∣ x ∗ B x ∣ 对所有 x ∈ C n x\in \mathbf{C}^n x ∈ C n 成立.
证明,如果 A ∈ M n A \in M_{n} A ∈ M n 是可逆对称矩阵,则 A − 1 ∘ A A^{-1} \circ A A − 1 ∘ A 的所有行和等于 1。提示:考察 A − 1 A^{-1} A − 1 各元的代数余子式。这样,如果 A A A 是实正定矩阵,证明,即使 A − 1 ∘ A ⩾ I A^{-1} \circ A \geqslant I A − 1 ∘ A ⩾ I ,也不会有 A − 1 ∘ A > I A^{-1} \circ A > I A − 1 ∘ A > I 。
如果 A ( k ) A^{(k)} A ( k ) 表示 A A A 的 Hadamard k k k 次幂,又如果 A ∈ M n A \in M_n A ∈ M n 是正定矩阵,证明 ( A − 1 ) ( k ) ⩾ ( A ( k ) ) − 1 (A^{-1})^{(k)} \geqslant (A^{(k)})^{-1} ( A − 1 ) ( k ) ⩾ ( A ( k ) ) − 1 对所有 k = 1 , 2 , ⋯ k = 1, 2, \cdots k = 1 , 2 , ⋯ 成立。
进一步阅读 关于(7.7.7)的背景材料以及其他资料可参看C. FitzGerald and R. Horn, “On the Structure of Hermitian-Symmetric Inequalities,” J. London Math. Soc. 15 (2) (1997), 419-430. 与(7.7.8),(7.7.9)有关的其他资料也可参看C. Johnson, “Partitioned and Hadamard Product Matrix Inequalities,” J. Research NBS 83(1978), 585-591.