4.1 Hermite 矩阵的定义、性质和特征 4.1.1 定义 矩阵 A = [ a i j ] ∈ M π A = [a_{ij}] \in M_{\pi} A = [ a ij ] ∈ M π 称为Hermite矩阵,是指 A = A ∗ A = A^{*} A = A ∗ ,其中 A ∗ ≡ A ‾ τ = [ a ‾ j i ] A^{*} \equiv \overline{A}^{\tau} = [\overline{a}_{ji}] A ∗ ≡ A τ = [ a ji ] 。如果 A = − A ∗ A = -A^{*} A = − A ∗ ,则称之为斜Hermite矩阵。
关于 A A A , B ∈ M n B\in M_{n} B ∈ M n 的一些论断:
对所有 A ∈ M n A \in M_{n} A ∈ M n , A + A ∗ A + A^{*} A + A ∗ , A A ∗ AA^{*} A A ∗ 和 A ∗ A A^{*}A A ∗ A 都是Hermite矩阵.
如果 A A A 是Hermite 矩阵,那么,对所有 k = 1 , 2 , 3 , … , A k k = 1, 2, 3, \dots, A^{k} k = 1 , 2 , 3 , … , A k 是Hermite 矩阵.如果 A A A
还是非奇异的,那么, A − 1 A^{-1} A − 1 也是Hermite矩阵.
如果 A , B A, B A , B 是Hermite矩阵,那么,对所有实纯量 a , b , a A + b B a, b, aA + bB a , b , a A + b B 是Hermite矩阵。
对所有 A ∈ M n A \in M_{n} A ∈ M n , A − A ∗ A - A^{*} A − A ∗ 是斜Hermite矩阵.
如果 A , B A, B A , B 是斜 Hermite 矩阵,那么,对所有实纯量 a , b , a A + b B a, b, aA + bB a , b , a A + b B 是斜 Hermite 矩阵。
如果 A A A 是Hermite 矩阵,那么 i A iA i A 是斜Hermite.
如果 A A A 是斜Hermite矩阵,那么 i A iA i A 是Hermite矩阵
任意 A ∈ M n A \in M_{n} A ∈ M n 可写成
A = 1 2 ( A + A ∗ ) + 1 2 ( A − A ∗ ) ÷ H ( A ) + S ( A ) , A = \frac {1}{2} (A + A ^ {*}) + \frac {1}{2} (A - A ^ {*}) \div H (A) + S (A), A = 2 1 ( A + A ∗ ) + 2 1 ( A − A ∗ ) ÷ H ( A ) + S ( A ) , 其中 H ( A ) = 1 2 ( Λ + Λ ′ ) H(A) = \frac{1}{2} (\Lambda +\Lambda^{\prime}) H ( A ) = 2 1 ( Λ + Λ ′ ) 是 A A A 的Hermite部分,而 S ( A ) = 1 2 ( A A ′ ) S(A) = \frac{1}{2} (A\quad A^{\prime}) S ( A ) = 2 1 ( A A ′ ) 是 A A A 的斜Hermite部分.
如果 A A A 是Hermite 矩阵,那么 A A A 的主对角元都是实数,为了给出 A A A 的 n 2 n^2 n 2 个元素,我们可以自由地给定任意 n n n 个实数(对于主对角元)和任意 1 2 n ( n − 1 ) \frac{1}{2} n(n - 1) 2 1 n ( n − 1 ) 个复数(对于非对角元)。
4.1.2 定理 每个 A ∈ M n A \in M_{n} A ∈ M n 可以唯一地写成 A = S + t T A = S + tT A = S + tT ,其中 S S S 和 T T T 都是 Hermite 矩阵。它也可以唯一地写成 A = B + C A = B + C A = B + C ,其中 B B B 是 Hermite 矩阵,而 C C C 是斜 Hermite 矩阵。
证明:把 A A A 写成 A = 1 2 ( A + A ∗ ) + i [ ( − i / 2 ) ( A − A ∗ ) ] A = \frac{1}{2} (A + A^{*}) + i\left[(-i / 2)(A - A^{*})\right] A = 2 1 ( A + A ∗ ) + i [ ( − i /2 ) ( A − A ∗ ) ] ,并且注意到 S = 1 2 ( A + A ∗ ) S = \frac{1}{2} (A + A^{*}) S = 2 1 ( A + A ∗ ) 和 T = ( − i / 2 ) ( A − A ∗ ) T = (-i / 2)(A - A^{*}) T = ( − i /2 ) ( A − A ∗ ) 都是Hermite矩阵,关于唯一性论断,我们知道,如果 A = E + i F A = E + iF A = E + i F ,其中 E E E 和 F F F 都是Hermite矩阵,那么
2 S = A + A ′ = ( E + i F ) + ( E + i F ) ′ = E + i F + E ′ − i F ′ = 2 E , 2 S = A + A ^ {\prime} = (E + i F) + (E + i F) ^ {\prime} = E + i F + E ^ {\prime} - i F ^ {\prime} = 2 E, 2 S = A + A ′ = ( E + i F ) + ( E + i F ) ′ = E + i F + E ′ − i F ′ = 2 E , 因而 E = S E = S E = S 。类似地可以证明, F = T F = T F = T 。关于表示式 A = B + C A = B + C A = B + C 的论断也可用同样的方式来证明。
上述论断使我们联想到,如果把 M n M_{n} M n 比作复数,那么Hermite矩阵就可以比作实数.C中的复共轭运算类似于 M n M_{n} M n 上的(伴随)运算。一个实数是使 z = z ‾ z = \overline{z} z = z 的复数 z z z ;一个Hermite矩阵是使 A = A ∗ A = A^{*} A = A ∗ 的矩阵 A ∈ M n A \in M_{n} A ∈ M n ,正如每个复数 z z z 可以写成 z = s + i t z = s + it z = s + i t 一样(其中 a , t ∈ R a, t \in \mathbb{R} a , t ∈ R )。每个复矩阵 A A A 也可以唯一地写成 A = S + i T A = S + iT A = S + i T ,其中 S S S 和 T T T 是Hermite矩阵,还有另外一些性质进一步说明这种类似性。
4.1.3 定理 设 A ∈ M n A \in M_{n} A ∈ M n 是Hermite矩阵,那么
(a) 对所有 x ∈ C n x \in \mathbf{C}^{n} x ∈ C n , x ∗ A x x^{*} A x x ∗ A x 是实数; (b) A A A 的所有特征值都是实数; (c)对所有 S ∈ M n S \in M_{n} S ∈ M n , S ′ A S S^{\prime}AS S ′ A S 是Hermite矩阵.
证明:计算 ( x ∗ A x ‾ ) = ( x ∗ A x ) ∗ = r ∗ A ∗ x = x ∗ A x (\overline{x^{*}Ax}) = (x^{*}Ax)^{*} = r^{*}A^{*}x = x^{*}Ax ( x ∗ A x ) = ( x ∗ A x ) ∗ = r ∗ A ∗ x = x ∗ A x ,于是 x ∗ A x x^{*}Ax x ∗ A x 等于它的复共轭,因而它是实数.如果 A x = λ x Ax = \lambda x A x = λ x 且 x ⋆ x = 1 x^{\star}x = 1 x ⋆ x = 1 ,那么,根据(a), λ = λ x ⋆ x = x ⋆ λ x = x ⋆ A x \lambda = \lambda x^{\star}x = x^{\star}\lambda x = x^{\star}Ax λ = λ x ⋆ x = x ⋆ λ x = x ⋆ A x 是实数.最后, ( S ∗ A S ) ∗ = S ∗ A ∗ S = S ∗ A S (S^{*}AS)^{*} = S^{*}A^{*}S = S^{*}AS ( S ∗ A S ) ∗ = S ∗ A ∗ S = S ∗ A S ,所以 S ∗ A S S^{*}AS S ∗ A S 总是Hermite矩阵. □
169
170
练习 当 n − 1 n - 1 n − 1 时,Hermite 矩阵 A ∈ M n A \in M_{n} A ∈ M n 的上述每个性质指的是什么?
(4.1.3)的每一个性质实际上(几乎都)是Hermite矩阵的一个特征.
4.1.4 定理 设 A = [ a i j ] ∈ M n A = [a_{ij}] \in M_n A = [ a ij ] ∈ M n 是给定的,那么, A A A 是Hermite 矩阵,当且仅当下述条件至少有一个成立:
(a) 对所有 x ∈ C n x \in \mathbf{C}^{n} x ∈ C n , r ∗ A x r^{*} A x r ∗ A x 是实数; (b) A A A 是正规矩阵,且 A A A 的所有特征值都是实数; (c)对所有 S ∈ M n S \in M_{n} S ∈ M n , S ∗ A S S^{*}AS S ∗ A S 是Hermite矩阵.
证明:这只要证明每个条件的充分性就可以了。如果对所有 x ∈ C n x \in \mathbb{C}^n x ∈ C n , x ∗ A x x^* A x x ∗ A x 是实数,那么,对所有 x , y ∈ C n x, y \in \mathbb{C}^n x , y ∈ C n , ( x + y ) ∗ A ( x + y ) = ( x ∗ A x + y ∗ A x ) + ( x ∗ A y + y ∗ A x ) (x + y)^* A (x + y) = (x^* A x + y^* A x) + (x^* A y + y^* A x) ( x + y ) ∗ A ( x + y ) = ( x ∗ A x + y ∗ A x ) + ( x ∗ A y + y ∗ A x ) 是实数。因为根据假设条件, x ∗ A x + y ∗ A y x^* A x + y^* A y x ∗ A x + y ∗ A y 是实数,得出,对所有 x , y ∈ C n x, y \in \mathbb{C}^n x , y ∈ C n , x ∗ A y + y ∗ A x x^* A y + y^* A x x ∗ A y + y ∗ A x 是实数。如果选取 x = e k x = e_k x = e k 和 y = e j y = e_j y = e j ,这就是说, a k j + a j k a_{kj} + a_{jk} a kj + a jk 是实数,因而 Im a k j = − Im a j k \operatorname{Im} a_{kj} = -\operatorname{Im} a_{jk} Im a kj = − Im a jk 。如果选取 x = e k x = e_k x = e k 和 y = e j y = e_j y = e j ,这就是说, − i a k j + i a j k -i a_{kj} + i a_{jk} − i a kj + i a jk 是实数,因而 Re a k j = Re a j k \operatorname{Re} a_{kj} = \operatorname{Re} a_{jk} Re a kj = Re a jk ,这两个恒等式结合起来就等价于有 a k j = a ˉ j k a_{kj} = \bar{a}_{jk} a kj = a ˉ jk ,又因为 j , k j, k j , k 是任意的,因此得出 A = A ∗ A = A^* A = A ∗ 。
如果 A A A 是正规矩阵,它就是可酉对角化的,所以 A = U Λ U ′ A = U\Lambda U^{\prime} A = U Λ U ′ ,其中, Λ = d i a g ( λ 1 , λ 2 , … , \pmb{\Lambda} = \mathrm{diag}(\lambda_1,\lambda_2,\dots , Λ = diag ( λ 1 , λ 2 , … , λ n ) \lambda_{n}) λ n ) 是由 A A A 的各特征值构成的对角矩阵.一般地,有 A ∗ = U A ‾ U ∗ A^{*} = U\overline{A} U^{*} A ∗ = U A U ∗ ,但是,如果 Λ \pmb{\Lambda} Λ 是实矩阵,就有 A ∗ = U Λ U ∗ = A A^{*} = U\Lambda U^{*} = A A ∗ = U Λ U ∗ = A ,最后一个条件推出 A A A 是Hermite矩阵,这只需取 S = I S = I S = I □
因为Hermite矩阵显然是正规矩阵 ( A A ∗ = A 2 = A ∗ A ) (AA^{*} = A^{2} = A^{*}A) ( A A ∗ = A 2 = A ∗ A ) ,第2章中有关正规矩阵的所有结果都适用于Hermite矩阵.例如,相应于不同特征值的特征向量是正交的,存在正交特征向量的一个完备集;Hermite矩阵是可以酉对角化的;等等.
作为参考,我们特别叙述下述重要结果。
4.1.5 定理(Hermite 矩阵的谱定理)设 A ∈ M n A \in M_{n} A ∈ M n 是给定的,那么, A A A 是 Hermite 矩阵,当且仅当存在一个酉矩阵 U ∈ M n U \in M_{n} U ∈ M n 和一个实对角矩阵 Λ ∈ M n \Lambda \in M_{n} Λ ∈ M n ,使得 A = U Λ U ∗ A = U\Lambda U^{*} A = U Λ U ∗ 。此外, A A A 是实 Hermite 矩阵(即实对称的),当且仅当存在一个实正交矩阵 P ∈ M n P \in M_{n} P ∈ M n 和一个实对角矩阵 Λ ∈ M n \Lambda \in M_{n} Λ ∈ M n ,使得 A = P Λ P r A = P\Lambda P^{r} A = P Λ P r 。
虽然Hermite矩阵的实线性组合总是Hermite矩阵,但它们的复线性组合就不一定是Hermite矩阵。例如,如果 A A A 是Hermite矩阵,那么,只有当 A = 0 A = 0 A = 0 时 i A iA i A 才是Hermite矩阵。另外,如果 A A A 和 B B B 是Hermite矩阵,那么 ( A B ) ∗ = B ∗ A ∗ = B A (AB)^{*} = B^{*}A^{*} = BA ( A B ) ∗ = B ∗ A ∗ = B A ,因此, A B AB A B 是Hermite矩阵,当且仅当 A A A 与 B B B 可交换。
关于交换的Hermite矩阵的最著名的结果之一(因为在量子力学中它是到算子的重要推广)是定理(2.5.5)的下述特殊情形。
4.1.6 定理 设 F \mathcal{F} F 是给定的Hermite矩阵族,对所有 A ∈ F A \in \mathcal{F} A ∈ F ,存在酉矩阵 U U U ,使得 U A U ∗ UAU^{*} U A U ∗ 是对角阵,当且仅当对所有 A , B ∈ F A, B \in \mathcal{F} A , B ∈ F 有 A B = B A AB = BA A B = B A .
Hermite 矩阵 A A A 有 A ∗ A^* A ∗ 的性质,推广 Hermite 矩阵概念的一种方式是考察 A A A 相似于 A ∗ A^* A ∗ 的矩阵类。下述定理用几种方式刻划了这一类矩阵,其中第一个是说,这样的矩阵必定相似于(但不一定酉相似于)一个实的(但不一定是对角的)矩阵。
4.1.7 定理 设 Λ ∈ M n \Lambda \in M_{n} Λ ∈ M n 是给定的,下述诸命题等价: (a) A A A 相似于矩阵 B ∈ M π ( R ) B \in M_{\pi}(\mathbf{R}) B ∈ M π ( R ) ; (b) A A A 相似于 A ∗ A^{*} A ∗ (c) A A A 经Hermite相似变换相似于 A ∗ A^{*} A ∗ (d) A = H K A = HK A = HK ,其中 H H H , K ∈ M n K\in M_{n} K ∈ M n 都是Hermite矩阵,且至少有一个是非奇异的; (e) A = H K A = HK A = HK ,其中 H , K ∈ M n H, K \in M_{n} H , K ∈ M n 是Hermite矩阵.
证明:首先要指出的是(a)和(b)等价:如果(a)成立,则 S − 1 A S = B = T − 1 B T = T − 1 B ∗ T S^{-1}AS = B = T^{-1}BT = T^{-1}B^{*}T S − 1 A S = B = T − 1 BT = T − 1 B ∗ T = T − 1 S ∗ A ∗ ( S − 1 ) ∗ T = T^{-1}S^{*}A^{*}(S^{-1})^{*}T = T − 1 S ∗ A ∗ ( S − 1 ) ∗ T ,这就是说, A ∗ = ( S T − 1 S ∗ ) − 1 A ( S T − 1 S ∗ ) A^{*} = (ST^{-1}S^{*})^{-1}A(ST^{-1}S^{*}) A ∗ = ( S T − 1 S ∗ ) − 1 A ( S T − 1 S ∗ ) ,或者说(b)成立.如果(b)成立,那么 Λ \pmb{\Lambda} Λ 和 A ∗ A^* A ∗ 有相同的Jordan标准形.因为对任意矩阵 A \pmb{A} A , Λ \pmb{\Lambda} Λ 与 Λ T \pmb{\Lambda}^T Λ T 相似,这说明,如果 J \pmb{J} J 是 A \pmb{A} A 的Jordan矩阵,那么 J \pmb{J} J 必须相似于 J \pmb{J} J ,因此,对 J \pmb{J} J 中的每个Jordan块 J k ( λ ) J_{k}(\lambda) J k ( λ ) ,在 J ˉ \bar{J} J ˉ 中有一个相应的(相同阶数的)Jordan块 J k ( λ ) J_{k}(\lambda) J k ( λ ) ,如果 λ \lambda λ 是实数,就没什么可说的了,如果 λ \lambda λ 不是实数,这就是说,相应于每个非实特征值的诸Jordan块和它的共轭必须成对出现.利用推导(3.4.5)的论证,得出 J \pmb{J} J 必须相似于形如(3.4.4)的实矩阵的一个直和,因而(a)成立.
为了证明(b)蕴涵(c),假定 S − 1 A S = A ∗ S^{-1}AS = A^{*} S − 1 A S = A ∗ ,且注意到,如果对任意非零 a = r e θ ∈ C a = re^{\theta} \in \mathbf{C} a = r e θ ∈ C , T = a S T = aS T = a S ,那么 T − 1 A T = A T^{-1}AT = A T − 1 A T = A 。因而 A T = T A ∗ AT = TA^{*} A T = T A ∗ ,或等价地 A T ∗ = T ∗ A ∗ AT^{*} = T^{*}A^{*} A T ∗ = T ∗ A ∗ 。相加这两个恒等式得恒等式 A ( T + T ∗ ) = ( T + T ∗ ) A ∗ A(T + T^{*}) = (T + T^{*})A^{*} A ( T + T ∗ ) = ( T + T ∗ ) A ∗ ,而如果 T + T ∗ T + T^{*} T + T ∗ 是非奇异矩阵,这便说明 A A A 可经Hermite矩阵 T + T ∗ T + T^{*} T + T ∗ 相似于 A ∗ A^{*} A ∗ 。但是可选取 a a a 使 T + T ∗ T + T^{*} T + T ∗ 非奇异,这是因为, T + T ∗ T + T^{*} T + T ∗ 非奇异,当且仅当 T − 1 ( T + T ∗ ) = 1 + T − 1 T ∗ T^{-1}(T + T^{*}) = 1 + T^{-1}T^{*} T − 1 ( T + T ∗ ) = 1 + T − 1 T ∗ 非奇异,或当且仅当 − 1 ∈ σ ( T − 1 T ∗ ) -1 \in \sigma(T^{-1}T^{*}) − 1 ∈ σ ( T − 1 T ∗ ) 。但是, T − 1 T ∗ = e − 2 ı θ S − 1 S ∗ T^{-1}T^{*} = e^{-2\imath\theta}S^{-1}S^{*} T − 1 T ∗ = e − 2 θ S − 1 S ∗ ,又因为可以选取 a a a 来得到任意 θ ∈ [ 0 , 2 π ] \theta \in [0, 2\pi] θ ∈ [ 0 , 2 π ] ,所以只需选取 θ \theta θ 使 − e 2 θ ∈ σ ( S − 1 S ∗ ) -e_{2}^{\theta} \in \sigma(S^{-1}S^{*}) − e 2 θ ∈ σ ( S − 1 S ∗ ) 即可。因而(b)蕴涵(c)。
其次,假定(c)成立,并且写出 R − 1 A R = A ∗ R^{-1}AR = A^{*} R − 1 A R = A ∗ ,其中 R ∈ M n R \in M_{n} R ∈ M n 是非奇异Hermite矩阵。于是 R − 1 A = A ∗ R − 1 R^{-1}A = A^{*}R^{-1} R − 1 A = A ∗ R − 1 且 A = R ( A ∗ R − 1 ) A = R(A^{*}R^{-1}) A = R ( A ∗ R − 1 ) 。但 ( A ∗ R − 1 ) ∗ − R − 1 A = A ∗ R − 1 (A^{*}R^{-1})^{*} - R^{-1}A = A^{*}R^{-1} ( A ∗ R − 1 ) ∗ − R − 1 A = A ∗ R − 1 ,因此 A A A 是两个Hermite矩阵 R R R 和 A ∗ R − 1 A^{*}R^{-1} A ∗ R − 1 的乘积,且其中的 R R R 是非奇异的,因而(d)成立。
如果(d)成立,且 A − H K A - HK A − HK ,其中 H H H 是非奇异矩阵,那么 H † A H = K H = ( H K ) ∗ = A ∗ H^{\dagger}AH = KH = (HK)^{*} = A^{*} H † A H = KH = ( HK ) ∗ = A ∗ 从而(b)成立.如果 κ \kappa κ 是非奇异矩阵,证明是类似的.
显然(d)蕴涵(e);我们要证明(e)蕴涵(a). 如果 A = H K A = HK A = HK ,其中 H H H 和 K K K 是Hermite矩阵,且都是奇异的,考虑 U ∗ A U = ( U ∗ H U ) ( U ∗ K U ) U^{*}AU = (U^{*}HU)(U^{*}KU) U ∗ A U = ( U ∗ H U ) ( U ∗ K U ) ,其中, U ∈ M n U \in M_{n} U ∈ M n 是酉矩阵,它把 H H H 对角化成形式
U ∗ H U − [ D 0 0 0 ] − H ′ , U ^ {*} H U - \left[ \begin{array}{c c} D & 0 \\ 0 & 0 \end{array} \right] - H ^ {\prime}, U ∗ H U − [ D 0 0 0 ] − H ′ , 使得 D ∈ M k D \in M_{k} D ∈ M k 是非奇异对角矩阵, k < n k < n k < n 。把矩阵 U ∗ K U U^{*}KU U ∗ K U 划分成与 H ′ H^{\prime} H ′ 同形的分块,使得
U ′ A U = H ′ ( U ′ K U ) = [ D 0 0 0 ] [ K ′ ∗ ∗ ∗ ] = [ D K ′ ∗ − 0 0 ] . \begin{array}{l} U ^ {\prime} A U = H ^ {\prime} (U ^ {\prime} K U) = \left[ \begin{array}{l l} D & 0 \\ 0 & 0 \end{array} \right] \left[ \begin{array}{l l} K ^ {\prime} & * \\ * & * \end{array} \right] \\ = \left[ \begin{array}{c c} D K ^ {\prime} & * \\ - 0 & 0 \end{array} \right]. \\ \end{array} U ′ A U = H ′ ( U ′ K U ) = [ D 0 0 0 ] [ K ′ ∗ ∗ ∗ ] = [ D K ′ − 0 ∗ 0 ] . 子块 D K ′ ∈ M k DK^{\prime}\in M_{k} D K ′ ∈ M k 是两个Hermite矩阵的乘积,其中有一个是非奇异的,于是根据(d)与(a)的等
价性, D K ′ DK^{\prime} D K ′ 相似于实矩阵 B ∈ M k B\in M_{k} B ∈ M k 用 J ∈ M k J\in M_{k} J ∈ M k 表示 B \pmb{B} B 的Jordan标准形,使得 A \pmb{A} A 相似于形如
C = [ J ∗ 0 0 ] C = \left[ \begin{array}{c c} J & * \\ 0 & 0 \end{array} \right] C = [ J 0 ∗ 0 ] 173
的矩阵 C C C 。矩阵 C C C 是上三角矩阵,且它的各特征值是 J J J 的各特征值再附加 n − k n - k n − k 个零特征值,对于相应于任一非零特征值的诸子块, C C C 的 Jordan 标准形的 Jordan 块结构必须与 J J J 的相同,这是因为,如果 λ ≠ 0 \lambda \neq 0 λ = 0 ,每个幂 ( C − λ I ) r (C - \lambda I)^r ( C − λ I ) r 的(列)秩显然等于 n − k n - k n − k ; rank ( J − λ I ) r \operatorname{rank}(J - \lambda I)^r rank ( J − λ I ) r , r = 1 , 2 , … , n r = 1, 2, \dots, n r = 1 , 2 , … , n 。特别是, C C C 的相应于任一非特征值的 Jordan 块必须成共轭对出现,因而 C C C 的 Jordan 标准形相似于形如(3.4.6)的矩阵,它是一个实矩阵。 □ \square □
习题 证明 Hermite 矩阵的每个主子矩阵是 Hermite 矩阵。这一性质对斜 Hermite 矩阵成立吗?对正规矩阵呢?
如果 A ∈ M n A \in M_{n} A ∈ M n 是Hermite矩阵,且 S ∈ M n S \in M_{n} S ∈ M n ,证明 S A S ∗ \mathrm{SAS}^{*} SAS ∗ 是Hermite矩阵。如果 S S S 是非奇异的, S A S − 1 \mathrm{SAS}^{-1} SAS − 1 又怎样呢?
设 A , B ∈ M n A, B \in M_{n} A , B ∈ M n 是 Hermite 矩阵。证明, A A A 与 B B B 相似,当且仅当它们酉相似。提示:如果 A = S B S ∗ A = SBS^{*} A = SB S ∗ ,证明 A = U Λ U ∗ A = U\Lambda U^{*} A = U Λ U ∗ 和 B − V Λ V ∗ B - V\Lambda V^{*} B − V Λ V ∗ ,其中 U U U 和 V V V 是酉矩阵,因而 U ∗ A U = Λ = V ∗ B V U^{*}AU = \Lambda = V^{*}BV U ∗ A U = Λ = V ∗ B V 。
验证(4.1.1)下面的性质 1 ∼ 9 1 \sim 9 1 ∼ 9 .
有时,通过证明一个矩阵与一个Hermite矩阵相似,可以证明它只有实特征值。关于这方面的一个经典例子如下所述:设 A = [ a i j ] ∈ M n ( R ) A = [a_{ij}] \in M_n(\mathbf{R}) A = [ a ij ] ∈ M n ( R ) 是三对角矩阵;即 a i j = 0 a_{ij} = 0 a ij = 0 ,若 ∣ i − j ∣ > 1 |i - j| > 1 ∣ i − j ∣ > 1 。假定它的元素有很弱的对称性质,即对所有 i = 1 , 2 , … , n − 1 i = 1, 2, \dots, n - 1 i = 1 , 2 , … , n − 1 ,有 a i + 1 a i + 1 , i > 0 a_{i + 1}a_{i + 1, i} > 0 a i + 1 a i + 1 , i > 0 。证明,存在一个具有正对角元的实对角矩阵 D D D 使得 D A D − 1 DAD^{-1} D A D − 1 是对称的。因而得出 A A A 只有实特征值。考察 [ 0 1 − 1 0 ] \left[ \begin{array}{cc}0 & 1 \\ -1 & 0\end{array} \right] [ 0 − 1 1 0 ] ,试说明为什么关于非对角元的符号假定是必不可少的。试用极限理论证明,如果 a i + 1 , i a i + 1 a_{i + 1, i}a_{i + 1} a i + 1 , i a i + 1 , i ⩾ 0 i \geqslant 0 i ⩾ 0 ,那么特征值是实的结论仍然成立。
证明在下述意义下每个矩阵 A ∈ M n A \in M_{n} A ∈ M n 由它产生的Hermite型 x ∗ A x x^{*}Ax x ∗ A x 唯一确定:如果 A = [ a i j ] A = [a_{ij}] A = [ a ij ] , B = [ b i j ] ∈ M n B = [b_{ij}] \in M_{n} B = [ b ij ] ∈ M n 是给定的,证明,对所有 x ∈ C n x \in \mathbb{C}^{n} x ∈ C n 有 x ∗ A x = x ∗ B x x^{*}Ax = x^{*}Bx x ∗ A x = x ∗ B x ,当且仅当 A = B A = B A = B 。提示:如果对所有 x ∈ C n x \in \mathbb{C}^{n} x ∈ C n , x ∗ A x = 0 x^{*}Ax = 0 x ∗ A x = 0 ,考虑 ( x + y ) ∗ A ( x + y ) (x + y)^{*}A(x + y) ( x + y ) ∗ A ( x + y ) ,然后证明,对所有 x , y ∈ C n x, y \in \mathbb{C}^{n} x , y ∈ C n ,有 x ∗ A y + y ∗ A x = 0 x^{*}Ay + y^{*}Ax = 0 x ∗ A y + y ∗ A x = 0 。选取 x = e k , y − 1 e i θ e j , θ ∈ R x = e_{k}, y^{-1}e^{i\theta}e_{j}, \theta \in \mathbb{R} x = e k , y − 1 e i θ e j , θ ∈ R ,证明,对所有 θ ∈ R \theta \in \mathbb{R} θ ∈ R 和所有 j , k − 1 , 2 , … , n j, k - 1, 2, \dots, n j , k − 1 , 2 , … , n ,有 a k j e 2 i θ = a j k a_{kj}e^{2i\theta} = a_{jk} a kj e 2 i θ = a jk 。
证明,如果 n ⩾ 2 n \geqslant 2 n ⩾ 2 ,矩阵 A ∈ M n A \in M_n A ∈ M n 不能由它产生的二次型 x T A x x^T A x x T A x 唯一确定;即:如果 n ⩾ 2 n \geqslant 2 n ⩾ 2 ,则存在 A , B ∈ M n A, B \in M_n A , B ∈ M n ,且 A ≠ B A \neq B A = B ,使得对所有 x ∈ C n x \in \mathbf{C}^n x ∈ C n 有 x T A x = x T B x x^T A x = x^T B x x T A x = x T B x 。提示:如果 C = − C T C = -C^T C = − C T , x T C x x^T C x x T C x 是什么?
证明,矩阵 A ∈ M n A \in M_{n} A ∈ M n 不能由它产生的Hermite型的绝对值 ∣ x ∗ A x ∣ \left| x^{*} A x \right| ∣ x ∗ A x ∣ 所确定。提示:设 A = [ 1 1 0 1 ] A = \begin{bmatrix} 1 & 1 \\ 0 & 1 \end{bmatrix} A = [ 1 0 1 1 ] ,然后证明,对所有 x ∈ C 2 x \in \mathbf{C}^2 x ∈ C 2 , ∣ x ∗ A x ∣ = ∣ x ∗ A ′ ′ x ∣ |x^{*} A x| = |x^{*} A'^{'} x| ∣ x ∗ A x ∣ = ∣ x ∗ A ′ ′ x ∣ 。
证明,在下述意义下,矩阵 A A A 几乎由它生成的Hermite双线性型的绝对值所确定:若
A A A , B ∈ M n B\in M_{n} B ∈ M n 是给定的,证明,对所有 x \pmb{x} x , y ∈ C n y\in \mathbb{C}^n y ∈ C n 有 ∣ x ∗ A y ∣ = ∣ x ∗ B y ∣ \mid x^{*}Ay\mid = \mid x^{*}By\mid ∣ x ∗ A y ∣=∣ x ∗ B y ∣ ,当且仅当对某个 θ ∈ R \theta \in \mathbf{R} θ ∈ R 有 A = e i θ B . A = e^{i\theta}B. A = e i θ B . 提示:设 A = [ a i j ] A = [a_{ij}] A = [ a ij ] 且 B = [ b i j ] B = [b_{ij}] B = [ b ij ] .利用 x = e , x = e, x = e , 和 y = e j y = e_j y = e j 证明,对所有 i i i , j = 1 j = 1 j = 1 中 … , n \dots ,n … , n 有 ∣ a i j ∣ = ∣ b i j ∣ \left|a_{ij}\right| = \left|b_{ij}\right| ∣ a ij ∣ = ∣ b ij ∣ .设 x − e i x - e_i x − e i , y = s e j + t e k y = se_j + te_k y = s e j + t e k ,证明 ∣ s a i j + t a i k ∣ 2 = ∣ s b i j + t b i k ∣ 2 \mid sa_{ij} + ta_{ik}\mid^2 = \mid sb_{ij} + tb_{ik}\mid^2 ∣ s a ij + t a ik ∣ 2 =∣ s b ij + t b ik ∣ 2 ,因而对所有s,t∈C有Re( s t ˉ [ a i j a ˙ k − b i j b ˉ k ] ) = 0 \bar{s t}\bigl [a_{i j}\dot{a}_{k} - b_{i j}\bar{b}_{k}\bigr ]\big) = 0 s t ˉ [ a ij a ˙ k − b ij b ˉ k ] ) = 0 若 b i j b i k ≠ 0 b_{ij}b_{ik}\neq 0 b ij b ik = 0 ,推出 a i j / b i j = a i k / b i k a_{ij} / b_{ij} = a_{ik} / b_{ik} a ij / b ij = a ik / b ik
证明, A ∈ M n A \in M_n A ∈ M n 是Hermite矩阵,当且仅当 i A iA i A 是斜Hermite矩阵。证明,一个斜Hermite矩阵的各特征值都是纯虚的,而一个斜Hermite矩阵的平方的各特征值是非正实数。
如果 A , B ∈ M n A, B \in M_{n} A , B ∈ M n 是Hermite 矩阵,证明 tr ( A B ) 2 ⩽ tr A 2 B 2 \operatorname{tr}(AB)^2 \leqslant \operatorname{tr} A^2 B^2 tr ( A B ) 2 ⩽ tr A 2 B 2 。提示:证明 A B − B A AB - BA A B − B A 是斜Hermite 矩阵,然后考虑 tr ( A B − B A ) 2 \operatorname{tr}(AB - BA)^2 tr ( A B − B A ) 2 。
如果 A ∈ M n A \in M_{n} A ∈ M n 是Hermite矩阵,证明, A A A 的秩等于 A A A 的非零特征值的个数,但是对于非Hermite矩阵一般不成立。提示: [ 0 1 0 0 ] \left[ \begin{array}{ll}0 & 1\\ 0 & 0 \end{array} \right] [ 0 0 1 0 ] 。
若 Λ ∈ M n \Lambda \in M_{n} Λ ∈ M n 是Hermite矩阵且 A ≠ 0 A \neq 0 A = 0 ,证明
rank ( A ) ⩾ [ tr A ] 2 tr A 2 \operatorname {r a n k} (A) \geqslant \frac {\left[ \operatorname {t r} A \right] ^ {2}}{\operatorname {t r} A ^ {2}} rank ( A ) ⩾ tr A 2 [ tr A ] 2 上述等式成立当且仅当存在一个具有标准正交列的矩阵 U = [ u 1 … u r ] ∈ M n , r U = [u_{1}\dots u_{r}]\in M_{n,r} U = [ u 1 … u r ] ∈ M n , r 和某个 a ∈ R a\in \mathbb{R} a ∈ R 使得 A = a U U ∗ A = aUU^{*} A = a U U ∗ ;即 A \pmb{A} A 是一个酉射影的实纯量倍数.提示:若 λ 1 , … , λ r \lambda_1,\dots ,\lambda_r λ 1 , … , λ r 是 A \pmb{A} A 的非零特征值,Cauchy-Schwarz不等式是说:
[ tr A ] 2 = ( ∑ i = 1 r λ i ) 2 ⩽ r ∑ i = 1 r λ i 2 = r tr A 2 , \left[ \operatorname {t r} A \right] ^ {2} = \left(\sum_ {i = 1} ^ {r} \lambda_ {i}\right) ^ {2} \leqslant r \sum_ {i = 1} ^ {r} \lambda_ {i} ^ {2} = r \operatorname {t r} A ^ {2}, [ tr A ] 2 = ( i = 1 ∑ r λ i ) 2 ⩽ r i = 1 ∑ r λ i 2 = r tr A 2 , 其中等式成立当且仅当所有 λ i \lambda_{i} λ i 相等.
斜Hermite矩阵 A ∈ M n A \in M_{n} A ∈ M n 满足恒等式 A = − A ∗ A = -A^{*} A = − A ∗ . 如果 θ ∈ R \theta \in \mathbb{R} θ ∈ R , 证明, A = e θ A ∗ A = e^{\theta} A^{*} A = e θ A ∗ , 当且仅当 e − θ A e^{-\theta} A e − θ A 是Hermite矩阵. 对于 θ = π \theta = \pi θ = π , 这是什么? 对 θ = 0 \theta = 0 θ = 0 呢? 说明为什么斜Hermite矩阵类可以看作“广义Hermite”矩阵的无限多个类中的一个, 并且描述每一个这样的矩阵类的结构.
设 Hermite 矩阵 A = [ a i j ] ∈ M n A = \left[ a_{ij} \right] \in M_{n} A = [ a ij ] ∈ M n 已写成如下的分块形式:
A = [ a 11 x ∗ x A ~ ] , A = \left[ \begin{array}{c c} a _ {1 1} & x ^ {*} \\ x & \widetilde {A} \end{array} \right], A = [ a 11 x x ∗ A ] , 其中, x ∈ C n − 1 x\in \mathbf{C}^{n - 1} x ∈ C n − 1 , A ~ ∈ M n − 1 \widetilde{A}\in M_{n - 1} A ∈ M n − 1 ,证明
det A = a 11 det A ~ − x ∗ ( adj A ~ ) x \det A = a _ {1 1} \det \widetilde {A} - x ^ {*} (\operatorname {a d j} \widetilde {A}) x det A = a 11 det A − x ∗ ( adj A ) x 175
其中 adj A ~ \operatorname{adj} \widetilde{A} adj A 是 A ~ \widetilde{A} A 的经典伴随[见(0.8.2)]。使 A A A 满足更弱的什么条件就能保证这个公式成立?提示:按 A A A 的第1列进行行列式的Lanlace余子式展开(0.3.1),然后对所得到诸余子式的第一行进行展开。