7.8 关于正定矩阵的不等式 下面,要讨论这样一些不等式,它们所涉及的量与一个或多个正定矩阵相关联。这些不等式与上一节所介绍的不等式是有区别的,尽管关于前者的一些例子与关于后者的一些例子常常是有联系的。例如, A ⩾ B ⩾ 0 A \geqslant B \geqslant 0 A ⩾ B ⩾ 0 蕴涵 det A ⩾ det B \det A \geqslant \det B det A ⩾ det B 。正定矩阵有一些涉及行列式,特征值和其他量的不等式。在这一节,我们考察某些不等式,它们不一定来自矩阵不等式。
关于正定矩阵的基本行列式不等式是Hadamard不等式,许多其他的不等式用不同的方式推广了这一结果.
7.8.1 定理(Hadamard 不等式)如果 A = [ a i j ] ∈ M n A = [a_{ij}] \in M_n A = [ a ij ] ∈ M n 是半正定矩阵,则
det A ⩽ ∏ i n a n . \det A \leqslant \prod_ {i} ^ {n} a _ {n}. det A ⩽ i ∏ n a n . 此外,如果 A A A 是正定矩阵,则等式成立当且仅当 A A A 是对角矩阵。
证明:如果 A A A 是奇异矩阵,就没有什么可证的,因此假定 A A A 是非奇异矩阵且它的所有 a i i ≠ 0 a_{ii} \neq 0 a ii = 0 。定义 d i ≡ a n − 1 / 2 d_i \equiv a_n^{-1/2} d i ≡ a n − 1/2 ,且设 D = diag ( d 1 , d 2 , … , d n ) D = \operatorname{diag}(d_1, d_2, \dots, d_n) D = diag ( d 1 , d 2 , … , d n ) 。因为 det D A D ⩽ 1 \det DAD \leqslant 1 det D A D ⩽ 1 当且仅当 det A ⩽ a 11 a 22 … a n n \det A \leqslant a_{11}a_{22}\dots a_{nn} det A ⩽ a 11 a 22 … a nn ,所以只要假定 A A A 的每个对角元等于 1 就可以了。如果 λ 1 , … , λ n \lambda_1, \dots, \lambda_n λ 1 , … , λ n 是 A A A 的(必定为正的)特征值,则有
det A = ∏ i = 1 n λ i ⩽ ( 1 n ∑ i = 1 n λ i ) n = ( 1 n tr A ) n = 1 \det A = \prod_ {i = 1} ^ {n} \lambda_ {i} \leqslant \left(\frac {1}{n} \sum_ {i = 1} ^ {n} \lambda_ {i}\right) ^ {n} = \left(\frac {1}{n} \operatorname {t r} A\right) ^ {n} = 1 det A = i = 1 ∏ n λ i ⩽ ( n 1 i = 1 ∑ n λ i ) n = ( n 1 tr A ) n = 1 这个不等式可从关于非负实数的算术几何平均值不等式推出。算术一几何平均值不等式中等式成立当且仅当所有 λ i = 1 \lambda_i = 1 λ i = 1 ,但是,因为 A A A 是Hermite矩阵,因而可对角化,所以,这种情况能出现,当且仅当 A = I A = I A = I 。因此,当 A A A 是正定矩阵时,在原不等式中等式成立当且仅当 A A A 是对角矩阵。
关于一般方阵的另一个行列式不等式等价于(7.8.1),它也叫做Hadamard不等式.几何上 ∣ det A ∣ |\det A| ∣ det A ∣ 是 n \pmb{n} n 维平行六面体的体积,它的各生成边是由 A A A 的各行(或各列)给出的.当各生成边相互正交时,这个体积最大,而这时其体积是各边长的乘积.Hadamard不等式是这个几何不等式的代数描述.
7.8.2 推论(Hadamard 不等式)对于任意矩阵 B = [ b i j ] ∈ M n B = [b_{ij}] \in M_n B = [ b ij ] ∈ M n ,有
∣ det B ∣ ⩽ ∏ i = 1 n ( ∑ j n ∣ b i j ∣ 2 ) 1 ′ 2 \mid \det B \mid \leqslant \prod_ {i = 1} ^ {n} \left(\sum_ {j} ^ {n} \mid b _ {i j} \mid^ {2}\right) ^ {1 ^ {\prime} 2} ∣ det B ∣ ⩽ i = 1 ∏ n ( j ∑ n ∣ b ij ∣ 2 ) 1 ′ 2 和
∣ det B ∣ ⩽ ∏ j = 1 n ( ∑ i = 1 n ∣ b i , ∣ 2 ) 1 / 2 . \mid \det B \mid \leqslant \prod_ {j = 1} ^ {n} \left(\sum_ {i = 1} ^ {n} \mid b _ {i}, \mid^ {2}\right) ^ {1 / 2}. ∣ det B ∣ ⩽ j = 1 ∏ n ( i = 1 ∑ n ∣ b i , ∣ 2 ) 1/2 . 此外,等式成立当且仅当 B B B 的各行(相应地,各列)相互正交
证明:如果 B B B 是奇异矩阵,那就没有什么要证的。如果 B B B 是非奇异矩阵,把(7.8.1)应用正定矩阵 A ≡ B B ∗ A \equiv BB^{*} A ≡ B B ∗ ,然后取方根。第一个不等式右边是 A A A 的各对角元的乘积的方根,而左边是 det A \det A det A 的方根。当 A A A 是对角矩阵时,即在(7.8.1)中等式成立的情形恰好 B B B 的各行互相正交。把第一个不等式应用于 B ∗ B^{*} B ∗ 便可推出第二个不等式。
练习 我们已经从(7.8.1)推导出(7.8.2). 现在证明(7.8.1)可由(7.8.2)推出. 提示: 如果 A A A 是正定矩阵, 则存在唯一的正定矩阵 B B B 使 B 2 = A B^{2} = A B 2 = A . 把(7.8.2)应用于 B B B 和它的平方.
练习 你能利用Hadamard不等式(及其变形)给出
det [ 1 1 1 1 − 1 − 1 1 − 1 1 ] \det \left[ \begin{array}{r r r} 1 & 1 & 1 \\ 1 & - 1 & - 1 \\ 1 & - 1 & 1 \end{array} \right] det 1 1 1 1 − 1 − 1 1 − 1 1 的最大界吗?
对关于正定矩阵的 Hadamard 不等式作出改进的两个推广应归功于 Fischer 和 Szasz. 在 Fischer 不等式中, 4 余主子矩阵所起的作用相当于对角元在 Hadamard 不等式中所起的作用.
7.8.3 定理(Fischer不等式) 假定
P = [ A B B ∗ C ] P = \left[ \begin{array}{c c} A & B \\ B ^ {*} & C \end{array} \right] P = [ A B ∗ B C ] 是正定矩阵,其中子块 A A A 和 C C C 是非空方阵(参看本节14题)。则
det P ⩽ ( det A ) ( det C ) \det P \leqslant (\det A) (\det C) det P ⩽ ( det A ) ( det C ) 证明:设 X = − A − 1 B X = -A^{-1}B X = − A − 1 B ,然后算出
det P = det [ I 0 X ∗ I ] [ A B B ∗ C ] [ I X 0 I ] = det [ A 0 0 C − B ∗ A − 1 B ] = ( det A ) ( det [ C − B ∗ A − 1 B ] ) ⩽ ( det A ) ( det C ) \begin{array}{l} \det P = \det \left[ \begin{array}{l l} I & 0 \\ X ^ {*} & I \end{array} \right] \left[ \begin{array}{l l} A & B \\ B ^ {*} & C \end{array} \right] \left[ \begin{array}{l l} I & X \\ 0 & I \end{array} \right] = \det \left[ \begin{array}{l l} A & 0 \\ 0 & C - B ^ {*} A ^ {- 1} B \end{array} \right] \\ = (\det A) (\det [ C - B ^ {*} A ^ {- 1} B ]) \leqslant (\det A) (\det C) \\ \end{array} det P = det [ I X ∗ 0 I ] [ A B ∗ B C ] [ I 0 X I ] = det [ A 0 0 C − B ∗ A − 1 B ] = ( det A ) ( det [ C − B ∗ A − 1 B ]) ⩽ ( det A ) ( det C ) 后一不等式用到了(7.7.6)和(7.7.4b)以确保 det C ⩾ det ( C − B ∗ A − 1 B ) \operatorname{det} C \geqslant \operatorname{det}(C - B^{*}A^{-1}B) det C ⩾ det ( C − B ∗ A − 1 B ) ,这是因为, C ⩾ C − B ∗ A − 1 B ⩾ 0 C \geqslant C - B^{*}A^{-1}B \geqslant 0 C ⩾ C − B ∗ A − 1 B ⩾ 0 . □
练习 试从 Fischer 不等式推导出 Hadamard 不等式 (7.8.1)。同时,试对于比 (7.8.3) 中的分块(两个主子矩阵)要细但又不如 (7.8.1) 中分块( n n n 个主子矩阵)那么细的 P P P 的分块,提出并叙述 Fischer 不等式。注意,在这种情形,Fischer 不等式的右边小于或等于 Hadamard 不等式的右边。因此,关于加细的各种分块的 Fischer 不等式给出关于 det P \det P det P 的上界的一个单调不减序列。
存在另一种不等式,它给出关于行列式的一系列上界,且包括Hadamard上界。设 P k ( A ) P_{k}(A) P k ( A ) 表示 A A A 的所有 k × k k \times k k × k 主子式 [ 共有 ( n k ) ] \left[\text{共有} \binom{n}{k}\right] [ 共有 ( k n ) ] 个的乘积。我们注意到, P n ( A ) = det A P_{n}(A)=\det A P n ( A ) = det A ,而 P 1 ( A ) = a 11 a 22 ⋯ a n n P_{1}(A)=a_{11} a_{22} \cdots a_{nn} P 1 ( A ) = a 11 a 22 ⋯ a nn 。
7.8.4 定理(Szasz 不等式)如果 A ∈ M n A \in M_{n} A ∈ M n 是正定矩阵,则对所有 k = 1 , 2 , … , n − 1 k = 1, 2, \dots, n - 1 k = 1 , 2 , … , n − 1 有
P k + 1 ( A ) ( n − 1 k ) − 1 ⩽ P k ( A ) ( n − 1 k − 1 ) P _ {k + 1} (A) ^ {\binom {n - 1} {k} - 1} \leqslant P _ {k} (A) ^ {\binom {n - 1} {k - 1}} P k + 1 ( A ) ( k n − 1 ) − 1 ⩽ P k ( A ) ( k − 1 n − 1 ) 证明:因为 A A A 的各对角元正好是 A A A 的各 ( n − 1 ) × ( n − 1 ) (n - 1) \times (n - 1) ( n − 1 ) × ( n − 1 ) 主子式与 det A \det A det A 之比,把(7.8.1)直接应用于正定矩阵 A − 1 A^{-1} A − 1 便推出
1 det A = det A 1 ⩽ P n − 1 ( A ) ( det A ) n , \frac {1}{\det A} = \det A ^ {1} \leqslant \frac {P _ {n - 1} (A)}{(\det A) ^ {n}}, det A 1 = det A 1 ⩽ ( det A ) n P n − 1 ( A ) , 因而
P n ( A ) n − 1 = ( det A ) n − 1 ⩽ P n − 1 ( A ) . P _ {n} (A) ^ {n - 1} = (\det A) ^ {n - 1} \leqslant P _ {n - 1} (A). P n ( A ) n − 1 = ( det A ) n − 1 ⩽ P n − 1 ( A ) . 对这个不等式的两边取 ( n − 1 ) (n - 1) ( n − 1 ) 次方根便得出 Szasz 不等式组中 k = n − 1 k = n - 1 k = n − 1 的情形。余下情形可以归纳地导出,例如,对于 k = n − 2 k = n - 2 k = n − 2 的情形,我们把每个 ( n − 1 ) × ( n − 1 ) (n - 1) \times (n - 1) ( n − 1 ) × ( n − 1 ) 主子矩阵看作一个起始矩阵,然后应用上面的不等式得到
P n − 1 ( A ) n − 2 ⩽ P n − 2 ( A ) 2 P _ {n - 1} (A) ^ {n - 2} \leqslant P _ {n - 2} (A) ^ {2} P n − 1 ( A ) n − 2 ⩽ P n − 2 ( A ) 2 因为 A A A 的每个 ( n − 2 ) × ( n − 2 ) (n - 2) \times (n - 2) ( n − 2 ) × ( n − 2 ) 主子矩阵作为 A A A 的某个 ( n − 1 ) × ( n − 1 ) (n - 1) \times (n - 1) ( n − 1 ) × ( n − 1 ) 主子矩阵的主子矩阵出现两次。对两边取 ( n − 1 ) ( n − 2 ) (n - 1)(n - 2) ( n − 1 ) ( n − 2 ) 次方根得 k = n − 2 k = n - 2 k = n − 2 的情形,而余下的情形可用同样的方式推出。
练习 证明 Szasz 不等式蕴涵 Hadamard 不等式 (7.8.1). 其中等式的情形是什么?
7.8.5 论断 设 A ∈ M n A \in M_{n} A ∈ M n 是半正定矩阵,且定义
α ( A ) ≡ { det A det A 11 , 如 果 A 11 是 正 定 矩 阵 ; 0 , 否 则 ; \alpha (A) \equiv \left\{ \begin{array}{l l} \frac {\det A}{\det A _ {1 1}}, \text {如 果} A _ {1 1} \text {是 正 定 矩 阵}; \\ 0, \text {否 则}; \end{array} \right. α ( A ) ≡ { d e t A 11 d e t A , 如 果 A 11 是 正 定 矩 阵 ; 0 , 否 则 ; 478
479
其中 A 11 A_{11} A 11 是划去 A A A 的第 1 行和第 1 列而得的 A A A 的 ( n − 1 ) × ( n − 1 ) (n - 1) \times (n - 1) ( n − 1 ) × ( n − 1 ) 主子矩阵。设 E 11 ∈ M n E_{11} \in M_n E 11 ∈ M n 是其 1.1 元为 1,而所有其余元为 0 的矩阵,则对所有 t ⩽ α ( A ) t \leqslant \alpha(A) t ⩽ α ( A ) , A − t E 11 A - tE_{11} A − t E 11 是半正定矩阵,而对任意 t > α ( A ) t > \alpha(A) t > α ( A ) , A − t E 11 A - tE_{11} A − t E 11 不是半正定矩阵;特别是, A − α ( A ) E 11 A - \alpha(A)E_{11} A − α ( A ) E 11 是半正定矩阵。
证明:只要考虑 A A A 是正定阵的情形即可,将(7.2.5)应用于各“尾随”主子式。注意到 A − t E 11 A - tE_{11} A − t E 11 的前 n − 1 n - 1 n − 1 个尾随主子式与 A A A 的相同,且 det ( A − t E 11 ) = det A − t det A 11 \det(A - tE_{11}) = \det A - t\det A_{11} det ( A − t E 11 ) = det A − t det A 11 □
练习 给出(7.8.5)的证明细节.
练习 试用(7.8.5)归纳证明Hadamard不等式(7.8.1).
Hadamard 不等式 (7.8.1) 也可以用 Hadamard 乘积叙述为
( det A ) ∏ i = 1 n 1 ⩽ det A ∘ I . (\det A) \prod_ {i = 1} ^ {n} 1 \leqslant \det A \circ I. ( det A ) i = 1 ∏ n 1 ⩽ det A ∘ I . 下述定理是 Oppenheim 的不等式(被 Schur 强化了),它说明在上述不等式中单位矩阵的作用没有什么特殊的,从而推广了 Hadamard 不等式。
7.8.6 定理((ppenheim 不等式) 如果 A , B ∈ M n A, B \in M_{n} A , B ∈ M n 是半正定矩阵, 则
( det A ) ∏ i = 1 n b n ⩽ det A ∘ B . (\det A) \prod_ {i = 1} ^ {n} b _ {n} \leqslant \det A \circ B. ( det A ) i = 1 ∏ n b n ⩽ det A ∘ B . 证明:我们对 n n n 采用归纳法,对 n = 1 n = 1 n = 1 ,结论是明显的.如果 n ⩾ 2 n \geqslant 2 n ⩾ 2 ,且对阶数至多为 n − 1 n - 1 n − 1 的所有矩阵,结论成立,则由归纳假设可知
( det A 11 ) ∏ n = 2 n b n ⩽ det A 11 ∧ B 11 , (\det A _ {1 1}) \prod_ {n = 2} ^ {n} b _ {n} \leqslant \det A _ {1 1} \wedge B _ {1 1}, ( det A 11 ) n = 2 ∏ n b n ⩽ det A 11 ∧ B 11 , 其中的记号与(7.8.5)中相同,注意 A 11 ∘ B 11 = ( A ∘ B ) 11 A_{11} \circ B_{11} = (A \circ B)_{11} A 11 ∘ B 11 = ( A ∘ B ) 11 。因为 A − α E 11 A - \alpha E_{11} A − α E 11 是半正定矩阵,由此得知 ( A − α E 11 ) ∘ B (A - \alpha E_{11}) \circ B ( A − α E 11 ) ∘ B 是半正定矩阵,因而
0 ⩽ det ( A − α E 11 ) ∘ B = ( det A ∘ B ) − α b 11 ( det A 11 ∘ B 11 ) . 0 \leqslant \det (A - \alpha E _ {1 1}) \circ B = (\det A \circ B) - \alpha b _ {1 1} (\det A _ {1 1} \circ B _ {1 1}). 0 ⩽ det ( A − α E 11 ) ∘ B = ( det A ∘ B ) − α b 11 ( det A 11 ∘ B 11 ) . 由此可推出
det A ∘ B ⩾ a b 11 det A 11 ∘ B 11 ⩾ a b 11 ( det A 11 ) ∏ i = 2 n b i = ( det A ) ∏ i = 1 n b n . \det A \circ B \geqslant a b _ {1 1} \det A _ {1 1} \circ B _ {1 1} \geqslant a b _ {1 1} (\det A _ {1 1}) \prod_ {i = 2} ^ {n} b _ {i} = (\det A) \prod_ {i = 1} ^ {n} b _ {n}. det A ∘ B ⩾ a b 11 det A 11 ∘ B 11 ⩾ a b 11 ( det A 11 ) i = 2 ∏ n b i = ( det A ) i = 1 ∏ n b n . 练习 如果 A , B ∈ M n A, B \in M_{n} A , B ∈ M n 是正定矩阵,证明,
( det A ) ( det B ) ⩽ det A ∘ B (\det A) (\det B) \leqslant \det A \circ B ( det A ) ( det B ) ⩽ det A ∘ B 进而证明
( det A ) ( det B ) ⩽ ( det A ) ∏ i = 1 n b i ⩽ det A ∘ B ⩽ ∏ r − 1 n a n ∏ i = 1 n b n . (\det A) (\det B) \leqslant (\det A) \prod_ {i = 1} ^ {n} b _ {i} \leqslant \det A \circ B \leqslant \prod_ {r - 1} ^ {n} a _ {n} \prod_ {i = 1} ^ {n} b _ {n}. ( det A ) ( det B ) ⩽ ( det A ) i = 1 ∏ n b i ⩽ det A ∘ B ⩽ r − 1 ∏ n a n i = 1 ∏ n b n . 练习 如果 A ∈ M n A \in M_{n} A ∈ M n 是正定矩阵,证明 det A ∘ A ⩾ 1 \det A \circ A \geqslant 1 det A ∘ A ⩾ 1
一种类型不同的行列式不等式适应于其 H ( A ) H(A) H ( A ) 是正定矩阵的非Hermite矩阵A. 它可以看作关于复数的不等式 ∣ z ∣ ⩾ ∣ Re z ∣ \mid z\mid \geqslant \mid \operatorname {Re}z\mid ∣ z ∣ ⩾ ∣ Re z ∣ 的推广.
7.8.7 定理(Ostrowski-Taussky)如果 A ∈ M n A \in M_{n} A ∈ M n 使 H ( A ) ≡ ( A + A ∗ ) / 2 H(A) \equiv (A + A^{*}) / 2 H ( A ) ≡ ( A + A ∗ ) /2 为正定矩阵,则
det H ( A ) ⩽ ∣ det A ∣ . \det H (A) \leqslant | \det A |. det H ( A ) ⩽ ∣ det A ∣. 等式成立当且仅当 Λ \Lambda Λ 是Hermite矩阵.
证明:设 S ( A ) = ( A − A ′ ) / 2 S(A) = (A - A^{\prime}) / 2 S ( A ) = ( A − A ′ ) /2 ,因而 A = H ( Λ ) + S ( A ) A = H(\Lambda) + S(A) A = H ( Λ ) + S ( A ) ,于是所要证的不等式可述为
∣ det [ I + H ( A ) − 1 S ( A ) ] ∣ ⩾ 1. \left| \det \left[ I + H (A) ^ {- 1} S (A) \right] \right| \geqslant 1. det [ I + H ( A ) − 1 S ( A ) ] ⩾ 1. 但是 H ( A ) ′ S ( A ) H(A)^{\prime}S(A) H ( A ) ′ S ( A ) 相似于斜Hermite矩阵
H ( A ) 1 ′ 2 S ( A ) H ( A ) − 1 ′ 2 , H (A) ^ {1 ^ {\prime} 2} S (A) H (A) ^ {- 1 ^ {\prime} 2}, H ( A ) 1 ′ 2 S ( A ) H ( A ) − 1 ′ 2 , 因而它只有纯虚特征值。因此只要注意到 ∣ 1 + i t ∣ ⩾ 1 |1 + it| \geqslant 1 ∣1 + i t ∣ ⩾ 1 对任意实数 t t t 成立就可以了。如果 i t 1 , i t 2 , … , i t n it_1, it_2, \dots, it_n i t 1 , i t 2 , … , i t n 是 I I ( A ) − 1 S ( A ) II(A)^{-1}S(A) II ( A ) − 1 S ( A ) 的特征值,则
∣ det [ I + H ( Λ ) − 1 S ( A ) ] ∣ = ∏ j = 1 n ∣ 1 + i t j ∣ ⩾ 1. \left| \det \left[ I + H (\Lambda) ^ {- 1} S (A) \right] \right| = \prod_ {j = 1} ^ {n} | 1 + i t _ {j} | \geqslant 1. det [ I + H ( Λ ) − 1 S ( A ) ] = j = 1 ∏ n ∣1 + i t j ∣ ⩾ 1. 另外,等式成立当且仅当所有 t j = 0 t_j = 0 t j = 0 ,它等价于 S ( A ) = 0 S(A) = 0 S ( A ) = 0 ,这是因为斜Hermite矩阵是可对角化的. □
含有两个正定矩阵之和的重要行列式不等式属于Minkowski. 它的证明与上述结果类似.
7.8.8 定理 (Minkowski 不等式) 如果 A , B ∈ M n A, B \in M_{n} A , B ∈ M n 是正定矩阵, 则
[ det ( A + B ) ] 1 ′ n ⩾ ( det A ) 1 , n + ( det B ) 1 ′ n . \left[ \det (A + B) \right] ^ {1 ^ {\prime} n} \geqslant \left(\det A\right) ^ {1, n} + (\det B) ^ {1 ^ {\prime} n}. [ det ( A + B ) ] 1 ′ n ⩾ ( det A ) 1 , n + ( det B ) 1 ′ n . 证明:注意到所要证的不等式的两边是同次齐次的,用 ( det A 1 , 2 ) 1 / n (\det A^{1,2})^{1 / n} ( det A 1 , 2 ) 1/ n 乘其左边和右边。于是,不失一般性,可以假定 A = I A = I A = I ,且必须证明
[ det ( I + B ) ] 1 / n ⩾ 1 + ( det B ) 1 / n . \left[ \det (I + B) \right] ^ {1 / n} \geqslant 1 + (\det B) ^ {1 / n}. [ det ( I + B ) ] 1/ n ⩾ 1 + ( det B ) 1/ n . 如果 0 < λ 1 ⩽ ⋯ ⩽ λ n 0 < \lambda_1 \leqslant \dots \leqslant \lambda_n 0 < λ 1 ⩽ ⋯ ⩽ λ n 是 B B B 的特征值,则所要证的不等式等价于
∏ 1 n ( 1 + λ r ) ⩾ ( 1 + λ 1 ⋯ λ n n ) n , \prod_ {1} ^ {n} \left(1 + \lambda_ {r}\right) \geqslant \left(1 + \sqrt [ n ]{\lambda_ {1} \cdots \lambda_ {n}}\right) ^ {n}, 1 ∏ n ( 1 + λ r ) ⩾ ( 1 + n λ 1 ⋯ λ n ) n , 只要直接计算不等式两边,然后用算术-几何平均值不等式逐项进行比较便可证明这个不等式.
练习 给出(7.8.8)的证明细节,并且证明等式成立当且仅当 B = c A B = cA B = c A 对某个 c ⩾ 0 c \geqslant 0 c ⩾ 0 成立。习题
不等式(7.8.2)说明,行列式的大小可以用其各行的 l 2 l_{2} l 2 范数的乘积来估计。试把它同如下结果[见(6.1)节习题3]作一比较:行列式的大小可以用其各行的 l 1 l_{1} l 1 范数的乘积来估计。几何上,这每一个界表示什么?还有其他这样的界吗?试一试 l ∼ l_{\sim} l ∼ 。 2.(7.8.2)的左边在 B B B 的左酉乘法下不变,而(7.8.1)的左边在 A A A 的西相似下不变,但是,两者的右边都无相应的不变性。什么时候两个右边达到极小?什么时候它们达到极大?能用这种方式得到较好的界吗?
试用Fischer不等式验证Hadamard不等式(7.8.2)的下述分块形式的推广:设 A = ⌈ A i j ⌉ A = \lceil A_{ij}\rceil A = ⌈ A ij ⌉ 是 n k × n k nk\times nk nk × nk 分块复矩阵,使得每个子块 A i j ∈ M k A_{ij}\in M_k A ij ∈ M k ,于是
∣ det A ∣ ⩽ [ ∏ i = 1 n ( ∑ j = 1 n ∥ A i j ∥ 2 2 ) 1.2 ] k . \left| \det A \right| \leqslant \left[ \prod_ {i = 1} ^ {n} \left(\sum_ {j = 1} ^ {n} \| A _ {i j} \| _ {2} ^ {2}\right) ^ {1. 2} \right] ^ {k}. ∣ det A ∣ ⩽ i = 1 ∏ n ( j = 1 ∑ n ∥ A ij ∥ 2 2 ) 1.2 k . 除了这里所采用的谱范数以外,还可以用其他矩阵范数吗?
试确定(7.8.6)中相等的情形.
设 A , B ∈ M n A, B \in M_{n} A , B ∈ M n 是正定矩阵,试证
det A ∘ B + ( det A ) ( det B ) ⩾ ( det A ) ∏ r = 1 n b n + ( det B ) ∑ τ = 1 n a n . \det A \circ B + (\det A) (\det B) \geqslant (\det A) \prod_ {r = 1} ^ {n} b _ {n} + (\det B) \sum_ {\tau = 1} ^ {n} a _ {n}. det A ∘ B + ( det A ) ( det B ) ⩾ ( det A ) r = 1 ∏ n b n + ( det B ) τ = 1 ∑ n a n . 说明这强化了(7.8.6). 提示:证明
α ( A ∘ B ) ⩾ α ( A ) b 11 + α ( B ) a 11 − α ( A ) α ( B ) , \alpha (A \circ B) \geqslant \alpha (A) b _ {1 1} + \alpha (B) a _ {1 1} - \alpha (A) \alpha (B), α ( A ∘ B ) ⩾ α ( A ) b 11 + α ( B ) a 11 − α ( A ) α ( B ) , 然后把它应用于普通的归纳假设.
证明,可以进一步扩展上一个习题中的不等式得到下述不等式
det A ∘ B + ( det A ) ( det B ) det A 11 ∘ B 11 ( det A 11 ) ( det B 11 ) ⩾ ( det A ) ∏ i = 1 n b n + ( det B ) ∏ i = 1 n a n + ( det A ) b 11 ( det B 11 ) ( a 22 ⋯ a m n det A 11 − 1 ) + [ det ( B ) a 11 ( det A 11 ) ( b 22 ⋯ b n n det B 11 − 1 ) ] . \begin{array}{l} \det A \circ B + (\det A) (\det B) \frac {\det A _ {1 1} \circ B _ {1 1}}{(\det A _ {1 1}) (\det B _ {1 1})} \\ \geqslant (\det A) \prod_ {i = 1} ^ {n} b _ {n} + (\det B) \prod_ {i = 1} ^ {n} a _ {n} + (\det A) b _ {1 1} (\det B _ {1 1}) \left(\frac {a _ {2 2} \cdots a _ {m n}}{\det A _ {1 1}} - 1\right) \\ + \left[ \det (B) a _ {1 1} (\det A _ {1 1}) \left(\frac {b _ {2 2} \cdots b _ {n n}}{\det B _ {1 1}} - 1\right) \right]. \\ \end{array} det A ∘ B + ( det A ) ( det B ) ( d e t A 11 ) ( d e t B 11 ) d e t A 11 ∘ B 11 ⩾ ( det A ) ∏ i = 1 n b n + ( det B ) ∏ i = 1 n a n + ( det A ) b 11 ( det B 11 ) ( d e t A 11 a 22 ⋯ a mn − 1 ) + [ det ( B ) a 11 ( det A 11 ) ( d e t B 11 b 22 ⋯ b nn − 1 ) ] . 如果 A ∈ M n A \in M_{n} A ∈ M n 有正定 Hermite 部分 H = ( A + A ∗ ) / 2 H = (A + A^{*}) / 2 H = ( A + A ∗ ) /2 ,且 n > 1 n > 1 n > 1 ,证明(7.8.7)中的不等式可以强化为
det H ( A ) + ∣ det S ( A ) ∣ ⩽ ∣ det A ∣ . \det H (A) + | \det S (A) | \leqslant | \det A |. det H ( A ) + ∣ det S ( A ) ∣ ⩽ ∣ det A ∣. 什么情形下可取等式?提示:你必须证明
∣ det [ I + H 1 ( A ) S ( A ) ] ∣ ⩾ 1 + ∣ det H ( A ) − 1 S ( A ) ∣ , \left| \det \left[ I + H ^ {1} (A) S (A) \right] \right| \geqslant 1 + \left| \det H (A) ^ {- 1} S (A) \right|, det [ I + H 1 ( A ) S ( A ) ] ⩾ 1 + det H ( A ) − 1 S ( A ) , 这等价于有
∏ j = 1 n ∣ 1 + i t , ∣ ⩾ 1 + ∏ j = 1 n ∣ t , \prod_ {j = 1} ^ {n} | 1 + i t, | \geqslant 1 + \prod_ {j = 1} ^ {n} | t, j = 1 ∏ n ∣1 + i t , ∣ ⩾ 1 + j = 1 ∏ n ∣ t , 证明
∏ j = 1 n ∣ 1 + i t , ∣ 2 = 1 + ∑ j = 1 n t j 2 + ⋯ + ∏ j = 1 n t j 2 ⩾ 1 + n ∏ j = 1 n t j + ( ∏ j = 1 n t j ) 2 ⩾ ( 1 + ∏ j = 1 n ∣ t j ∣ ) 2 . \begin{array}{l} \prod_ {j = 1} ^ {n} | 1 + i t, | ^ {2} = 1 + \sum_ {j = 1} ^ {n} t _ {j} ^ {2} + \dots + \prod_ {j = 1} ^ {n} t _ {j} ^ {2} \\ \geqslant 1 + n \prod_ {j = 1} ^ {n} t _ {j} + \left(\prod_ {j = 1} ^ {n} t _ {j}\right) ^ {2} \geqslant \left(1 + \prod_ {j = 1} ^ {n} | t _ {j} |\right) ^ {2}. \\ \end{array} ∏ j = 1 n ∣1 + i t , ∣ 2 = 1 + ∑ j = 1 n t j 2 + ⋯ + ∏ j = 1 n t j 2 ⩾ 1 + n ∏ j = 1 n t j + ( ∏ j = 1 n t j ) 2 ⩾ ( 1 + ∏ j = 1 n ∣ t j ∣ ) 2 . 你可以进一步强化这个不等式吗?注意:所论证的不等式关于复数的一个自然形式应该是 ∣ z ∣ ⩾ ∣ Re z ∣ + ∣ Im z ∣ |z| \geqslant |\operatorname{Re} z| + |\operatorname{Im} z| ∣ z ∣ ⩾ ∣ Re z ∣ + ∣ Im z ∣ ,而所论证的不等式可以看作它的推广;证明这个自然不等式不成立(因而假定 n > 1 n > 1 n > 1 ),由此可见要证的行列式不等式有点出乎意料之外。
如果 A , B ∈ M n A, B \in M_{n} A , B ∈ M n 是正定矩阵,证明 det ( A + B ) ⩾ det A + det B \det(A + B) \geqslant \det A + \det B det ( A + B ) ⩾ det A + det B .
试用Minkowski不等式证明Fischer不等式。提示:把Minkowski不等式应用于两个正定矩阵
[ A B B ∗ C ] 和 [ I 0 0 − I ] [ A B B ∗ C ] [ I 0 0 − I ] = [ A − B − B ∗ C ] . \left[ \begin{array}{c c} {A} & {B} \\ {B ^ {*}} & {C} \end{array} \right] \quad \text {和} \quad \left[ \begin{array}{c c} {I} & {0} \\ {0} & {- I} \end{array} \right] \left[ \begin{array}{c c} {A} & {B} \\ {B ^ {*}} & {C} \end{array} \right] \left[ \begin{array}{c c} {I} & {0} \\ {0} & {- I} \end{array} \right] = \left[ \begin{array}{c c} {A} & {- B} \\ {- B ^ {*}} & {C} \end{array} \right]. [ A B ∗ B C ] 和 [ I 0 0 − I ] [ A B ∗ B C ] [ I 0 0 − I ] = [ A − B ∗ − B C ] . 一个正定矩阵 P ∈ M n P \in M_{n} P ∈ M n 可以分解成 P = L L ∗ P = L L^{*} P = L L ∗ ,其中 L L L 是只有正对角元的下三角矩阵(7.2.9). 试用这一事实证明 Fischer 不等式.
设 A , B ∈ M n A, B \in M_{n} A , B ∈ M n 是半正定矩阵。如果 A A A 和 B B B 是非奇异的,证明 A ∘ B A \circ B A ∘ B 是非奇异的(且是正定的)。如果 A ∘ B A \circ B A ∘ B 是奇异的,证明 A , B A, B A , B 至少有一个是奇异的。这与(7.5)节的不等式 rank
Λ ∘ B ⩽ ( rank A ) ( rank B ) \Lambda \circ B \leqslant (\operatorname{rank} A)(\operatorname{rank} B) Λ ∘ B ⩽ ( rank A ) ( rank B ) 有何关系?
证明,如果 A = [ a i j ] ∈ M 3 A = [a_{ij}] \in M_3 A = [ a ij ] ∈ M 3 是一个具有实元素的矩阵,且 ∣ a i j ∣ ⩽ 1 |a_{ij}| \leqslant 1 ∣ a ij ∣ ⩽ 1 ,则 ∣ det A ∣ ⩽ 3 3 |\det A| \leqslant 3\sqrt{3} ∣ det A ∣ ⩽ 3 3 。同时证明这个界是不能达到的。提示:
∂ ∂ a i j ( det A ) = ( − 1 ) i + 1 A y 且 ∂ 2 ∂ a y 2 ( det A ) ≡ 0 , \frac {\partial}{\partial a _ {i j}} (\det A) = (- 1) ^ {i + 1} A _ {y} \quad \text {且} \quad \frac {\partial^ {2}}{\partial a _ {y} ^ {2}} (\det A) \equiv 0, ∂ a ij ∂ ( det A ) = ( − 1 ) i + 1 A y 且 ∂ a y 2 ∂ 2 ( det A ) ≡ 0 , 其中 A i j A_{ij} A ij 是 A A A 划去 A A A 的第 i i i 行和第 j j j 列的行列式。如果 A i j = 0 A_{ij} = 0 A ij = 0 ,则 det A \det A det A 与 a i j a_{ij} a ij 的值无关,因而 a i j a_{ij} a ij 可取 ± 1 \pm 1 ± 1 。如果 A i j ≠ 0 A_{ij} \neq 0 A ij = 0 ,则当 0 < a i j < 1 0 < a_{ij} < 1 0 < a ij < 1 时, det A \det A det A 关于 a i j a_{ij} a ij 没有极值。因此,在所有 a i j = ± 1 a_{ij} = \pm 1 a ij = ± 1 的给定的约束内, ∣ det A ∣ |\det A| ∣ det A ∣ 达到它的最大值。对于 n = 3 n = 3 n = 3 ,只有有限个这样的矩阵。一般地,对于 n > 3 n > 3 n > 3 ,其结果又如何?如果 A A A 有复元素,则对解析函数应用最大值原理(最大模定理)证明,在集合 { A ∈ M n \{A \in M_n { A ∈ M n :所有 { a i j ∣ ⩽ 1 } \{a_{ij} \mid \leqslant 1\} { a ij ∣ ⩽ 1 } 内部 ∥ det A ∥ \| \det A \| ∥ det A ∥ 不可能有最大值。
如果 A = [ a i j ] ∈ M n A = [a_{ij}] \in M_n A = [ a ij ] ∈ M n 且 K = max { ∣ a i j ∣ } K = \max \{|a_{ij}|\} K = max { ∣ a ij ∣ } ,试用 Hadamard 不等式证明, ∣ det A ∣ ⩾ K n n n − 2 |\det A| \geqslant K^n n^{n-2} ∣ det A ∣ ⩾ K n n n − 2 。
设 A ∈ M n A \in M_{n} A ∈ M n 是正定矩阵,又设 α ⊆ N = { 1 , … , n } \alpha \subseteq N = \{1, \dots, n\} α ⊆ N = { 1 , … , n } 是一个指标集。Fischer 不等式可以叙述为 det A ⩽ det A ( α ) det A ( α ′ ) \det A \leqslant \det A(\alpha) \det A(\alpha') det A ⩽ det A ( α ) det A ( α ′ ) 。其中 α ′ \alpha' α ′ 是 α \alpha α 关于 N N N 的补集。这个结果的一个推广常称为 Hadamard-Fischer 不等式,那就是
det A ( α ⋃ β ) ⩽ det A ( α ) det A ( β ) det A ( α ⋂ β ) , (7.8.9) \det A (\alpha \bigcup \beta) \leqslant \frac {\det A (\alpha) \det A (\beta)}{\det A (\alpha \bigcap \beta)}, \tag {7.8.9} det A ( α ⋃ β ) ⩽ det A ( α ⋂ β ) det A ( α ) det A ( β ) , ( 7.8.9 ) 它对正定Hermite矩阵 A A A 和所有指标集 α , β ⊆ N \alpha, \beta \subseteq N α , β ⊆ N 成立。通常规定 det A ( ϕ ) ≡ 1 \operatorname{det} A(\phi) \equiv 1 det A ( ϕ ) ≡ 1 。试仅用Fischer不等式和(0.8.4)中的第二个公式证明 Hadamard-Fischer 不等式。提示:不失一般性,假定 α ∪ β = N \alpha \cup \beta = N α ∪ β = N ,且把 Fisher 不等式应用于 A − 1 ( α ′ ∪ β ′ ) A^{-1}(\alpha' \cup \beta') A − 1 ( α ′ ∪ β ′ ) 。然后把(0.8.4)应用于每个子式。
利用正定Hermite矩阵可以写成 L L ∗ LL^{*} L L ∗ 且 L L L 是非奇异下三角矩阵的事实(7.2.9)给出Hadamard-Fischer不等式(7.8.9)的直接证明。提示:假定 1 ⩽ j < k < n 1 \leqslant j < k < n 1 ⩽ j < k < n ,不失一般性,假定 α = { 1 , … , k } \alpha = \{1, \dots, k\} α = { 1 , … , k } 和 β = { 1 , … , j , k + 1 , … , n } \beta = \{1, \dots, j, k + 1, \dots, n\} β = { 1 , … , j , k + 1 , … , n } ,然后考虑 A A A 和 L L L 的一个对应的 3 × 3 3 \times 3 3 × 3 子块。
设 A ∈ M n A \in M_{n} A ∈ M n 是正定矩阵,试用 Hadamard Fischer 不等式(7.8.9)证明
det A ⩽ ∑ i = 1 n − 1 det A ( { i , i + 1 } ) ∏ i = 2 n − 1 a p . \det A \leqslant \frac {\sum_ {i = 1} ^ {n - 1} \det A (\{i , i + 1 \})}{\prod_ {i = 2} ^ {n - 1} a _ {p}}. det A ⩽ ∏ i = 2 n − 1 a p ∑ i = 1 n − 1 det A ({ i , i + 1 }) . 设 A ∈ M n A \in M_{n} A ∈ M n 是正定矩阵,证明
det A = ⋅ min { ∑ i = 1 n v i ∗ A v i : { v 1 , … , v n } ⊂ C n 是 标 准 正 交 组 } . \det A \stackrel {\cdot} {=} \min \bigl \{\sum_ {i = 1} ^ {n} v _ {i} ^ {*} A v _ {i}: \{v _ {1}, \dots , v _ {n} \} \subset \mathbf {C} ^ {n} \text {是 标 准 正 交 组} \bigr \}. det A = ⋅ min { i = 1 ∑ n v i ∗ A v i : { v 1 , … , v n } ⊂ C n 是 标 准 正 交 组 } . 提示:设 V = [ v 1 … v n ] ∈ M n V = [v_{1}\dots v_{n}]\in M_{n} V = [ v 1 … v n ] ∈ M n 且把(7.8.1)应用于 A ~ ≡ V ⋅ A V . \widetilde{A}\equiv V\cdot AV. A ≡ V ⋅ A V .
设 A ∈ M n A \in M_{n} A ∈ M n 是正定矩阵,且设 { u 1 , ⋯ , u n } ⊂ C n \{u_{1}, \cdots, u_{n}\} \subset \mathbf{C}^{n} { u 1 , ⋯ , u n } ⊂ C n 是标准正交组。试用习题 17 证明, { u 1 , ⋯ , u n } \{u_{1}, \cdots, u_{n}\} { u 1 , ⋯ , u n } 是 A A A 的特征向量且 { u 1 ′ A u 1 , ⋯ , u n ′ A u n } \{u_{1}^{\prime} A u_{1}, \cdots, u_{n}^{\prime} A u_{n}\} { u 1 ′ A u 1 , ⋯ , u n ′ A u n } 是 A A A 的相应特征值,当且仅当
det A = ∏ i = 1 n u i ′ A u i . \det A = \prod_ {i = 1} ^ {n} u _ {i} ^ {\prime} A u _ {i}. det A = i = 1 ∏ n u i ′ A u i . 如果 A ∈ M n A \in M_{n} A ∈ M n 是正定矩阵,证明
n ( det A ) 1 n = min { tr A B : B ∈ M n 是正定矩阵且 det B = 1 } n(\det A)^{1^n} = \min \{\operatorname{tr} AB : B \in M_n \text{ 是正定矩阵且 } \det B = 1\} n ( det A ) 1 n = min { tr A B : B ∈ M n 是正定矩阵且 det B = 1 } .
提示:记 A = U Λ U ∗ A = U\Lambda U^{*} A = U Λ U ∗ ,其中, Λ = d i a g ( λ 1 , … , λ n ) \Lambda = \mathrm{diag}(\lambda_1,\dots ,\lambda_n) Λ = diag ( λ 1 , … , λ n ) ,所有 λ i > 0 \lambda_{i} > 0 λ i > 0 ,且 U ∈ M n U\in M_{n} U ∈ M n 是酉矩阵,于是 tr A B = tr Λ ( U ⋆ B U ) \operatorname {tr}AB = \operatorname {tr}\Lambda (U^{\star}BU) tr A B = tr Λ ( U ⋆ B U ) ,然后利用算术一几何平均值不等式和Hadamard不等式(7.8.1)证明
1 n ∑ i = 1 n λ i b n ⩾ ( ∏ i = 1 n λ i b n ) 1 n = ( det A ∏ i = 1 n b n ) 1 , n ⩾ [ det A ] 1 n , \frac {1}{n} \sum_ {i = 1} ^ {n} \lambda_ {i} b _ {n} \geqslant \left(\prod_ {i = 1} ^ {n} \lambda_ {i} b _ {n}\right) ^ {1 ^ {n}} = \left(\det A \prod_ {i = 1} ^ {n} b _ {n}\right) ^ {1, n} \geqslant [ \det A ] ^ {1 ^ {n}}, n 1 i = 1 ∑ n λ i b n ⩾ ( i = 1 ∏ n λ i b n ) 1 n = ( det A i = 1 ∏ n b n ) 1 , n ⩾ [ det A ] 1 n , 且等式可以成立.
试用习题19中的拟线性化证明Minkowski不等式(7.8.8)
设 A ∈ M n A \in M_{n} A ∈ M n 是半正定矩阵,且把 A A A 写成分块形式如下:
A = [ a 11 x x A ~ ] \boldsymbol {A} = \left[ \begin{array}{l l} a _ {1 1} & x \\ x & \tilde {\boldsymbol {A}} \end{array} \right] A = [ a 11 x x A ~ ] 试用(4.1)节习题15中关于行列式的简化公式和(7.2)节习题11证明
det A = a 11 det A ~ − x ∗ ( adj A ~ ) x ⩽ a 11 det A ~ . \det A = a _ {1 1} \det \tilde {A} - x ^ {*} (\operatorname {a d j} \tilde {A}) x \leqslant a _ {1 1} \det \tilde {A}. det A = a 11 det A ~ − x ∗ ( adj A ~ ) x ⩽ a 11 det A ~ . 试用归纳法和这个不等式给出Hadamard不等式(7.8.1)的另一个证明.
进一步阅读 关于定理(7.8.7)的其他信息可参看A.M.Ostrowski and O.Taussky, “On the Variation of the Determinant of a Positive Definite Matrix,” Proc. Kon. Nederl. Acad. Wetensch. Amsterdam, Ser. A, 54 (1951), 383-385. 有一类不等式(当 A A A 是正定矩阵时)把det A A A 与 A A A 的其他广义矩阵函数(见0.3.2)联系起来,同时也推广了Hadamard 不等式(7.8.1),其有关的内容可参看I.Schur, “Über endliche Gruppen und Hermitesche Formen,” Math. Z. 1 (1918), 184-207.