2.5 正规矩阵 正规矩阵是在讨论酉等价时自然产生的一类矩阵,它在整个矩阵分析中是很重要的,并且它还推广了酉矩阵,实对称矩阵和Hermite矩阵。
2.5.1 定义 设矩阵 A ∈ M n A \in M_{n} A ∈ M n ,如果 A ∗ A = A A ∗ A^{*}A = AA^{*} A ∗ A = A A ∗ ,即,如果 A A A 与它的Hermite伴随可交换,就称 A A A 为正规矩阵。
练习 证明, A ∈ M n A \in M_{n} A ∈ M n 是正规矩阵,当且仅当酉等价于 A A A 的每一个矩阵都是正规矩阵。这
说明正规矩阵类在酉等价下是封闭的.
2.5.2 例 (a) 如果 U U U 是酉矩阵, 那么 U ′ U = I = U U ′ U^{\prime} U = I = U U^{\prime} U ′ U = I = U U ′ , 因而, 所有酉矩阵是正规矩阵. (b)如果 A ∗ = A A^{*} = A A ∗ = A ,显然 A ∗ A = A A ∗ A^{*}A = AA^{*} A ∗ A = A A ∗ ,因而,所有Hermite矩阵都是正规矩阵. (c) 如果 A ∈ M n A \in M_{n} A ∈ M n 适合 A ∗ = − A A^{*} = -A A ∗ = − A ,就称 A A A 是斜Hermite矩阵。这时, A ∗ A = − A 2 = A A ∗ A^{*}A = -A^{2} = AA^{*} A ∗ A = − A 2 = A A ∗ ,因而所有斜Hermite矩阵也都是正规矩阵。 (d) A = [ 1 − 1 1 1 ] A = \begin{bmatrix} 1 & -1 \\ 1 & 1 \end{bmatrix} A = [ 1 1 − 1 1 ] 是正规矩阵,但它不属于上述任一类矩阵.
练习 用元素间的关系给出 M 2 ( R ) M_2(\mathbb{R}) M 2 ( R ) 中的正规矩阵的特征,并且按(2.5.2a,b和c)的分类作出回答。提示:如果 A ∈ M 2 ( R ) A \in M_2(\mathbb{R}) A ∈ M 2 ( R ) 是正规矩阵,证明,如果 A A A 至少有一个元素为零,那么或 A = A T A = A^T A = A T ,或 A = − A A = -A A = − A 。如果 A A A 的所有元素是非零的,证明, A = A T A = A^T A = A T ,或对某个 a > 0 a > 0 a > 0 , A A T = a I AA^T = aI A A T = a I
练习 给出一个 2 × 2 2 \times 2 2 × 2 非正规实矩阵的例子。同时给出一个 2 × 2 2 \times 2 2 × 2 实矩阵的例子,它是正规矩阵,但不是对称的,斜对称的或正交的。
练习 证明(2.5.2a,b和c)的每一类各自在酉等价下是封闭的。
练习 证明,Hermite 对角矩阵必定是实的,而斜 Hermite 对角矩阵必定是纯虚的。
2.5.3 定义 如果 A ∈ M n A \in M_{n} A ∈ M n 西等价于一个对角矩阵,就称 A A A 是可酉对角化,类似地可定义可正交对角化概念。应注意的是,“可酉(或正交)对角化”蕴涵可对角化(但反之不成立)。
练习 考察(1.3.7)的证明便可得出, A ∈ M n A \in M_{n} A ∈ M n 可西对角化,当且仅当在 C n \mathbf{C}^{n} C n 中有一个由 n n n 个标准正交向量组成的集合,其中每个向量都是 A A A 的特征向量。
下面,列出关于正规矩阵的最基本的事实,在下述定理中,(a)与(b)的等价性常常被称为正规矩阵的谱定理.
2.5.4 定理 如果 A = [ a i j ] ∈ M n A = [a_{ij}] \in M_n A = [ a ij ] ∈ M n 有特征值 λ 1 , … , λ n \lambda_1, \dots, \lambda_n λ 1 , … , λ n ,那么下述命题等价:
(a) A A A 是正规矩阵; (b)A是可酉对角化矩阵; (c) ∑ i , j = 1 n ∣ a i j ∣ 2 = ∑ i = 1 n ∣ λ i ∣ 2 \sum_{i,j=1}^{n} |a_{ij}|^2 = \sum_{i=1}^{n} |\lambda_i|^2 ∑ i , j = 1 n ∣ a ij ∣ 2 = ∑ i = 1 n ∣ λ i ∣ 2 ; (d) 存在由 A A A 的 n n n 个特征向量组成的标准正交基.
证明:由Schur定理保证,在该证明中,始终假定 T = [ t i j ] ∈ M n T = [t_{ij}] \in M_n T = [ t ij ] ∈ M n 是酉等价于 A A A 的上三角矩阵;即对某个酉矩阵 U ∈ M n U \in M_n U ∈ M n ,有 T = U ∗ A U T = U^* A U T = U ∗ A U ,因为 T T T 酉等价于 A A A ,所以命题(a)等价于 T T T 的正规性。我们将证明,(a)与(b)等价,(b)与(c)等价,(b)与(d)等价,从而完成证明。
为了证明(a)蕴涵(b),需做一些计算。如果 A A A 是正规矩阵,那么 T T T 也是正规矩阵。但一个正规的三角矩阵必定是对角矩阵,这只要令 T ∗ T T^{*}T T ∗ T 和 T T ∗ TT^{*} T T ∗ 的对角元相等就可以看出来。 T ∗ T T^{*}T T ∗ T 的1,1元与 T T ∗ TT^{*} T T ∗ 的1,1元相等表明
t ˉ 11 t 11 = t 11 t ˉ 11 + ∑ j = 2 n t 1 j t ˉ 1 j = ∣ t 11 ∣ 2 + ∑ j = 2 n ∣ t 1 j ∣ 2 . \bar {t} _ {1 1} t _ {1 1} = t _ {1 1} \bar {t} _ {1 1} + \sum_ {j = 2} ^ {n} t _ {1 j} \bar {t} _ {1 j} = | t _ {1 1} | ^ {2} + \sum_ {j = 2} ^ {n} | t _ {1 j} | ^ {2}. t ˉ 11 t 11 = t 11 t ˉ 11 + j = 2 ∑ n t 1 j t ˉ 1 j = ∣ t 11 ∣ 2 + j = 2 ∑ n ∣ t 1 j ∣ 2 . 这就是说, 0 = ∑ j = 2 n ∣ t 1 j ∣ 2 0 = \sum_{j = 2}^{n}|t_{1j}|^2 0 = ∑ j = 2 n ∣ t 1 j ∣ 2 ,若干非负项的和为零,那么它的每一项必须为0.由此得出
t 1 j = 0 , j = 2 , … , n . t _ {1 j} = 0, \quad j = 2, \dots , n. t 1 j = 0 , j = 2 , … , n . T ∗ T T^{*} T T ∗ T 和 T T ∗ TT^{*} T T ∗ 的 2, 2 元相等表明
t ˉ 22 t 22 = t 22 t ˉ 22 + ∑ j = 3 N t 2 j t ˉ 2 j = ∣ t 22 ∣ 2 + ∑ j = 3 N ∣ t 2 j ∣ 2 , \bar {t} _ {2 2} t _ {2 2} = t _ {2 2} \bar {t} _ {2 2} + \sum_ {j = 3} ^ {N} t _ {2 j} \bar {t} _ {2 j} = | t _ {2 2} | ^ {2} + \sum_ {j = 3} ^ {N} | t _ {2 j} | ^ {2}, t ˉ 22 t 22 = t 22 t ˉ 22 + j = 3 ∑ N t 2 j t ˉ 2 j = ∣ t 22 ∣ 2 + j = 3 ∑ N ∣ t 2 j ∣ 2 , 同理可得
t 2 j = 0 , j = 3 , … , n . t _ {2 j} = 0, \quad j = 3, \dots , n. t 2 j = 0 , j = 3 , … , n . 假定采用同样的方法已经验证
t n = 0 , j > i 和 i = 1 , 2 , … , k − 1 t _ {n} = 0, \quad j > i \text {和} i = 1, 2, \dots , k - 1 t n = 0 , j > i 和 i = 1 , 2 , … , k − 1 由此可以得出
t i j = 0 , j > i , i = k , t _ {i j} = 0, \quad j > i, \quad i = k, t ij = 0 , j > i , i = k , 依次讨论 T ∗ T T^{*}T T ∗ T 和 T T ∗ TT^{*} T T ∗ 的每个对角元,最后得到
t i j = 0 , j > i , i = 1 , 2 , … , n , t _ {i j} = 0, \quad j > i, \quad i = 1, 2, \dots , n, t ij = 0 , j > i , i = 1 , 2 , … , n , 因为 T T T 是上三角矩阵,所以又有
t i j = 0 , j < i , i − 1 , 2 , … , n . t _ {i j} = 0, \quad j < i, \quad i - 1, 2, \dots , n. t ij = 0 , j < i , i − 1 , 2 , … , n . 因此,证明了 T T T 是对角矩阵,因而(b)成立.由于对角矩阵显然是正规矩阵,又酉等价保持正规性,所以(b)也蕴涵(a).
要证明(b)与(c)等价,需借助于(2.2.2).因为任一与 A A A 酉等价的对角矩阵的对角元是特征值 λ 1 , … , λ n \lambda_{1},\dots ,\lambda_{n} λ 1 , … , λ n (按某个顺序排列),(2.2.2)使我们从(b)推出(c).另一方面,因为 λ i , i = 1 , … , n \lambda_{i},i = 1,\dots ,n λ i , i = 1 , … , n ,是 T T T 的对角元(按某个顺序排列),所以,(2.2.2)也表示
∑ t , j = 1 n ∣ a i j ∣ 2 = ∑ i = 1 n ∣ λ i ∣ 2 + ∑ i ∼ j ∣ t i j ∣ 2 . \sum_ {t, j = 1} ^ {n} \left| a _ {i j} \right| ^ {2} = \sum_ {i = 1} ^ {n} \left| \lambda_ {i} \right| ^ {2} + \sum_ {i \sim j} \left| t _ {i j} \right| ^ {2}. t , j = 1 ∑ n ∣ a ij ∣ 2 = i = 1 ∑ n ∣ λ i ∣ 2 + i ∼ j ∑ ∣ t ij ∣ 2 . 但是(c)意味着
∑ i ∼ j n ∣ t i j ∣ 2 = 0. \sum_ {i \sim j} ^ {n} | t _ {i j} | ^ {2} = 0. i ∼ j ∑ n ∣ t ij ∣ 2 = 0. 或 T T T 是对角矩阵,由此推出(b)成立.
[102]
(b)与(d)的等价性,是本定理之前的那个练习所要证明的事实.
[.]
练习 如果 T ∈ M n T \in M_{n} T ∈ M n 是三角矩阵,且 T ∗ T T^{*}T T ∗ T 与 T T ∗ TT^{*} T T ∗ 的第 i i i 个对角元相同, i = 1 , … , n i = 1, \dots, n i = 1 , … , n ,证明 T T T 是对角矩阵。说明为什么这个结论连同正规性在酉相似下是不变的结论是正规矩阵可酉对角化的基本理由。
练习 证明一个正规矩阵是非亏损的(每个特征值几何重数等于它的代数重数).
练习 证明,如果 A ∈ M n A \in M_{n} A ∈ M n 是正规矩阵,那么 x ∈ C n x \in \mathbb{C}^{n} x ∈ C n 是 A A A 的相应于特征值 λ \lambda λ 的右特征向量,当且仅当 x x x 是 A A A 的相应于 λ \lambda λ 的左特征向量;即 A x = λ x Ax = \lambda x A x = λ x 等价于 x ⋆ A = λ x ⋆ x^{\star}A = \lambda x^{\star} x ⋆ A = λ x ⋆ ,提示:正规化 x x x ,且记 A = U Λ U ⋆ A = U\Lambda U^{\star} A = U Λ U ⋆ ,使 x x x 为 U U U 的第1列。那么, A ⋆ A^{\star} A ⋆ 及 A ⋆ x A^{\star}x A ⋆ x 各是什么?参看本节后面的习题20中的另一个证明。
练习 如果 A ∈ M n A \in M_{n} A ∈ M n 是正规矩阵,且 x x x 和 y y y 是相应于不同特征值的特征向量,证明 x x x 与 y y y
正交. 提示: 如果 A x = λ x A x = \lambda x A x = λ x , A y = μ y A y = \mu y A y = μ y , 试证 μ x ∗ y = x ∗ ( A y ) − ( A ∗ x ) ∗ y = ( λ ˉ x ) ∗ y = λ x ∗ y \mu x^{*} y = x^{*}(A y) - (A^{*} x)^{*} y = (\bar{\lambda} x)^{*} y = \lambda x^{*} y μ x ∗ y = x ∗ ( A y ) − ( A ∗ x ) ∗ y = ( λ ˉ x ) ∗ y = λ x ∗ y . 如果 λ ≠ μ \lambda \neq \mu λ = μ , 由此得出 x ∗ y = 0 x^{*} y = 0 x ∗ y = 0 . 参看习题21的另一个证明.
如果已知一个正规矩阵的各特征值,那么它可以通过下面理论描述西对角化。确定每个特征空间,然后求它的一个标准正交基(例如,用Gram-Schmidt过程)。因为每个特征空间的维数等于其相应特征值的重数,又 A A A 是正规矩阵,所以这些基的并就是整个空间的一个标准正交基。把这些向量排成一个酉矩阵的列便得到所要求的对角化变换。
下面说明,可交换的正规矩阵可同酉对角化。
2.5.5 定理 如果 I ⊆ M n \mathbb{I} \subseteq M_{n} I ⊆ M n 是正规矩阵的交换族,那么 I \mathbb{I} I 可同时酉对角化;即存在一个酉相似,它把 I \mathbb{I} I 中每个矩阵变换成对角矩阵。
练习 利用(2.3.3)以及正规的三角矩阵一定是对角矩阵的事实证明(2.5.5). 说明(2.5.5)的条件和结论要比(1.3.19)的强.
将(2.5.4)应用于Hermite矩阵的特殊情形,便得到一个基本结果,常常称之为Hermite矩阵的谱定理。
2.5.6 定理 如果 A ∈ M n A \in M_{n} A ∈ M n 是Hermite矩阵,那么
(a) Λ \Lambda Λ 的所有特征值都是实的;
(b) A A A 是可酉对角化的.
如果 A ∈ M n ( R ) A \in M_{n}(\mathbf{R}) A ∈ M n ( R ) 是对称矩阵,那么 A A A 可实正交对角化。
证明:一个Hermite对角矩阵必定具有实对角元,因而(a)可以从(b)和Hermite矩阵的集合在酉等价下封闭的事实推出。因为Hermite矩阵是正规矩阵,所以命题(b)可以从(2.5.4)推出。如果 A ∈ M n ( R ) A \in M_{n}(\mathbb{R}) A ∈ M n ( R ) 是对称矩阵,那么它就是Hermite矩阵,不过,我们注意到,对角化 A A A 所需一切计算均可在实数域上进行。因为 A A A 的特征值是实数,所以相应的特征向量可以取实向量。
在(2.5.4)和(2.5.6)中,特征值相同或不同已无关紧要了。在(2.5.5)中不必假定可对角化条件,将这些与第1章中可对角化的讨论作一比较是有意义的。Hermite矩阵和正规矩阵从结构上就保证它们有一个线性无关的完备的特征向量组(实际上是标准正交组),这就是为什么它们如此重要且有如此合意的性质的理由。
作为结束,我们证明与(2.5.4)和(2.5.5)相类似的定理,它们是关于实正规矩阵的。这些矩阵是正规矩阵,因此可经一个未必是实的酉相似对角化。如果只经一个实正交相似,那么这样的实正规矩阵可能变成的最好形式是怎样的呢?因为一个实正规矩阵可能没有任何实的特征值,所以不能保证它可经一个实相似对角化。另一方面,任一实矩阵可经一个实正交相似变成特殊的分块上三角形式(见2.3.4),如果这个矩阵还是正规矩阵,就假定它已变成这种特殊的形式。证明要利用(2.3.4),正像在(2.5.4)中用到了(2.3.1)一样。下面的引理可消除一个小的技术障碍,它在(2.5.1)的证明中不曾出现。
2.5.7 引理 如果 A ∈ M n A \in M_{n} A ∈ M n 是Hermite矩阵,且对所有 x ∈ C n x \in \mathbb{C}^{n} x ∈ C n ,有 x ∗ A x ⩾ 0 x^{*}Ax \geqslant 0 x ∗ A x ⩾ 0 ,那么 A A A 的所有特征值非负。如果还有 tr A = 0 \operatorname{tr} A = 0 tr A = 0 ,那么 A = 0 A = 0 A = 0 。
证明:利用(2.5.6)可以写出 A = U Λ U ∗ A = U\Lambda U^{*} A = U Λ U ∗ ,其中, U = [ u 1 u 2 … u n ] ∈ M n U = [u_{1}u_{2}\dots u_{n}] \in M_{n} U = [ u 1 u 2 … u n ] ∈ M n 是两矩阵,而 Λ = d i a g ( λ 1 , λ 2 , … , λ n ) \Lambda = \mathrm{diag}(\lambda_1,\lambda_2,\dots ,\lambda_n) Λ = diag ( λ 1 , λ 2 , … , λ n ) 。于是 Λ = U ∗ A U \Lambda = U^{*}AU Λ = U ∗ A U ,根据假设可知, λ k = u k ∗ A u k ≥ 0 \lambda_k = u_k^*Au_k \geq 0 λ k = u k ∗ A u k ≥ 0 ,从而所有 λ k ≥ 0 \lambda_{k} \geq 0 λ k ≥ 0 。最后, tr A = tr U Λ U ∗ = tr Λ U ∗ U = tr A = λ 1 + ⋯ + λ n \operatorname{tr} A = \operatorname{tr} U\Lambda U^{*} = \operatorname{tr} \Lambda U^{*}U = \operatorname{tr} A = \lambda_{1} + \dots + \lambda_{n} tr A = tr U Λ U ∗ = tr Λ U ∗ U = tr A = λ 1 + ⋯ + λ n ,因此,如果 tr A = 0 \operatorname{tr} A = 0 tr A = 0 和所有 λ k ≥ 0 \lambda_{k} \geq 0 λ k ≥ 0 ,就一定有所有 λ k = 0 \lambda_{k} = 0 λ k = 0 ,因而 A = U Λ U ∗ = U O U ∗ − 0 A = U\Lambda U^{*} = UOU^{*} - 0 A = U Λ U ∗ = U O U ∗ − 0 。
2.5.8 定理 设 A ∈ M n ( R ) A \in M_{n}(\mathbb{R}) A ∈ M n ( R ) ,则 A A A 是正规矩阵,当且仅当存在一个实正交矩阵 Q ∈ M n ( R ) Q \in M_{n}(\mathbb{R}) Q ∈ M n ( R ) ,使得
Q t A Q = [ A 1 0 A 2 ⋱ 0 A k ] ∈ M n ( R ) , 1 ⩽ k ⩽ n , (2.5.9) Q ^ {t} A Q = \left[ \begin{array}{c c c c} A _ {1} & & & 0 \\ & A _ {2} & & \\ & & \ddots & \\ 0 & & & A _ {k} \end{array} \right] \in M _ {n} (\mathbf {R}), \quad 1 \leqslant k \leqslant n, \tag {2.5.9} Q t A Q = A 1 0 A 2 ⋱ 0 A k ∈ M n ( R ) , 1 ⩽ k ⩽ n , ( 2.5.9 ) 其中每个 A j A_{j} A j 或者是 1 × 1 1\times 1 1 × 1 矩阵,或者是形如
A j − [ α j β j − β j α j ] (2.5.10) A _ {j} - \left[ \begin{array}{c c} \alpha_ {j} & \beta_ {j} \\ - \beta_ {j} & \alpha_ {j} \end{array} \right] \tag {2.5.10} A j − [ α j − β j β j α j ] ( 2.5.10 ) 的 2 × 2 2 \times 2 2 × 2 矩阵.
证明:由直接计算可知,每个形如(2.5.10)的矩阵是正规矩阵 [ A i A j T = d i a g ( α j 2 + β j 2 , α j 2 + [A_{i}A_{j}^{T} = \mathrm{diag}(\alpha_{j}^{2} + \beta_{j}^{2},\alpha_{j}^{2}+ [ A i A j T = diag ( α j 2 + β j 2 , α j 2 + β j 2 ) − A j T A j ] \beta_j^2) - A_j^T A_j] β j 2 ) − A j T A j ] ,因而任一个形如(2.5.9)的直和也一定是正规矩阵。由于前面的论断,如果利用(2.3.4)来证明定理,那只需对形如(2.3.5)的实正规矩阵来证明就够了。因为在(2.3.5)中诸主对角子块可以按任意规定的顺序排列,所以可以假定
A = [ R A 01 A 02 … A n k A 11 A 12 … A 1 k A 22 … A 2 k 0 ⋱ ⋮ A k k ] ∈ M n ( R ) (2.5.11) A = \left[ \begin{array}{c c c c c} R & A _ {0 1} & A _ {0 2} & \dots & A _ {n k} \\ & A _ {1 1} & A _ {1 2} & \dots & A _ {1 k} \\ & & A _ {2 2} & \dots & A _ {2 k} \\ 0 & & & \ddots & \vdots \\ & & & & A _ {k k} \end{array} \right] \in M _ {n} (\mathbf {R}) \tag {2.5.11} A = R 0 A 01 A 11 A 02 A 12 A 22 … … … ⋱ A nk A 1 k A 2 k ⋮ A kk ∈ M n ( R ) ( 2.5.11 ) 是正规矩阵,其中
R − [ λ 1 ∗ ⋱ 0 λ p ] ∈ M p ( R ) R - \left[ \begin{array}{c c c} \lambda_ {1} & & * \\ & \ddots & \\ 0 & & \lambda_ {p} \end{array} \right] \in M _ {p} (\mathbf {R}) R − λ 1 0 ⋱ ∗ λ p ∈ M p ( R ) 是上三角矩阵, A 01 , A 02 , ⋯ , A 0 k ∈ M p , 2 ( R ) A_{01}, A_{02}, \cdots, A_{0k} \in M_{p,2}(\mathbb{R}) A 01 , A 02 , ⋯ , A 0 k ∈ M p , 2 ( R ) ,并且对 i , j = 1 , 2 , ⋯ , k i, j = 1, 2, \cdots, k i , j = 1 , 2 , ⋯ , k 以及 j ≥ i j \geq i j ≥ i ,有 A i j ∈ M 2 ( R ) A_{ij} \in M_2(\mathbb{R}) A ij ∈ M 2 ( R ) 。下面要证明 R R R 是对角矩阵,且对所有 j > i j > i j > i , A i j = 0 A_{ij} = 0 A ij = 0 。
比较恒等式 A T A = A A T A^T A = A A^T A T A = A A T 中与(2.5.11)中的子块 R \pmb{R} R 相对应的第一个 p × p p \times p p × p 主对角块元,得到恒等式
R 1 R = R R T + A 01 A 01 2 + ⋯ + A n k A n k T . (2.5.12) R ^ {1} R = R R ^ {T} + A _ {0 1} A _ {0 1} ^ {2} + \dots + A _ {n k} A _ {n k} ^ {T}. \tag {2.5.12} R 1 R = R R T + A 01 A 01 2 + ⋯ + A nk A nk T . ( 2.5.12 ) 我们知道,对某个 E ∈ M p , q E \in M_{p,q} E ∈ M p , q ,每个形如 B − E E ∗ B - EE^{*} B − E E ∗ 的矩阵 B ∈ M p ( C ) B \in M_p(\mathbf{C}) B ∈ M p ( C ) 是Hermite矩阵,且对所有 x ∈ C n x \in \mathbb{C}^n x ∈ C n 有性质 x ∗ B r = x ∗ E E ∗ x = ( E ∗ x ) ∗ ( E ∗ x ) ⩾ 0 x^{*}Br = x^{*}EE^{*}x = (E^{*}x)^{*}(E^{*}x) \geqslant 0 x ∗ B r = x ∗ E E ∗ x = ( E ∗ x ) ∗ ( E ∗ x ) ⩾ 0 ,并且,这样一些矩阵的和也有同样的性
质.因为,按一般的原则,
tr R T R = tr R R T , \operatorname {t r} R ^ {T} R = \operatorname {t r} R R ^ {T}, tr R T R = tr R R T , 而且,由(2.5.12)有
tr R T R = tr R R T + tr A 01 A 01 T + ⋯ + tr A 0 k A 0 k T , \operatorname {t r} R ^ {T} R = \operatorname {t r} R R ^ {T} + \operatorname {t r} A _ {0 1} A _ {0 1} ^ {T} + \dots + \operatorname {t r} A _ {0 k} A _ {0 k} ^ {T}, tr R T R = tr R R T + tr A 01 A 01 T + ⋯ + tr A 0 k A 0 k T , 由此可见
0 = tr A 01 A 01 T + ⋯ + tr A 0 k A 0 k T . 0 = \operatorname {t r} A _ {0 1} A _ {0 1} ^ {T} + \dots + \operatorname {t r} A _ {0 k} A _ {0 k} ^ {T}. 0 = tr A 01 A 01 T + ⋯ + tr A 0 k A 0 k T . 根据引理(2.5.7),且把上述结论应用于实矩阵 B = A 0 j A 0 j ∗ = A 0 j A 0 j T B = A_{0j}A_{0j}^{*} = A_{0j}A_{0j}^{T} B = A 0 j A 0 j ∗ = A 0 j A 0 j T ,有 tr A 0 j A 0 j I ⩾ 0 \operatorname{tr}A_{0j}A_{0j}^{I} \geqslant 0 tr A 0 j A 0 j I ⩾ 0 。因为它们的和是零,所以每一项也是零,因而 A 0 j A 0 j T = 0 , j = 1 , ⋯ , k A_{0j}A_{0j}^{T} = 0, j = 1, \cdots, k A 0 j A 0 j T = 0 , j = 1 , ⋯ , k 。因为 A 0 j A 0 j I A_{0j}A_{0j}^{I} A 0 j A 0 j I 的第 i i i 个主对角元是 A 0 j A_{0j} A 0 j 的第 i i i 行的(实)元素的平方和,因此,这些元素必须全为零,从而 A 0 j = 0 , j = 1 , 2 , ⋯ , k A_{0j} = 0, j = 1, 2, \cdots, k A 0 j = 0 , j = 1 , 2 , ⋯ , k ,且(2.5.12)简化成
R T R = R R T . R ^ {T} R = R R ^ {T}. R T R = R R T . 但是,已经在(2.5.4)中证明,一个正规的三角矩阵必定是对角矩阵,所以有 R = d i a g ( λ 1 , … , λ p ) R = \mathrm{diag}(\lambda_1,\dots ,\lambda_p) R = diag ( λ 1 , … , λ p ) ,这正是我们所断言的。
比较恒等式 A T A = A A T A^T A = A A^T A T A = A A T 中与(2.5.11)中子块 A 11 \pmb{A}_{11} A 11 相对应的 2 × 2 2\times 2 2 × 2 主对角块元,利用对所有 j = 1 , 2 … , k j = 1,2\dots ,k j = 1 , 2 … , k 有 A 0 j = 0 A_{0j} = 0 A 0 j = 0 的事实,便得到恒等式
A 11 T A 11 = A 11 A 11 T + A 12 A 12 T + ⋯ + A 1 k A 1 k T . (2.5.13) A _ {1 1} ^ {T} A _ {1 1} = A _ {1 1} A _ {1 1} ^ {T} + A _ {1 2} A _ {1 2} ^ {T} + \dots + A _ {1 k} A _ {1 k} ^ {T}. \tag {2.5.13} A 11 T A 11 = A 11 A 11 T + A 12 A 12 T + ⋯ + A 1 k A 1 k T . ( 2.5.13 ) 而 tr ( A 11 T A 11 ) \operatorname{tr}(A_{11}^T A_{11}) tr ( A 11 T A 11 ) ,像上面那样运用引理(2.5.7),于是,对 j = 2 , 3 , … , k j = 2, 3, \dots, k j = 2 , 3 , … , k ,有
tr ( A 12 A 12 T ) + ⋯ + tr ( A 1 k A 1 k T ) = 0 , tr ( A 1 j A 1 j T ) ⩾ 0 , tr ( A 1 , A 1 , j T ) = 0 , A 1 , j A 1 , j T = 0 和 A 1 , j = 0 , \begin{array}{l} \operatorname {t r} \left(A _ {1 2} A _ {1 2} ^ {T}\right) + \dots + \operatorname {t r} \left(A _ {1 k} A _ {1 k} ^ {T}\right) = 0, \quad \operatorname {t r} \left(A _ {1 j} A _ {1 j} ^ {T}\right) \geqslant 0, \\ \operatorname {t r} (A _ {1}, A _ {1, j} ^ {T}) = 0, \quad A _ {1, j} A _ {1, j} ^ {T} = 0 \text {和} A _ {1, j} = 0 , \\ \end{array} tr ( A 12 A 12 T ) + ⋯ + tr ( A 1 k A 1 k T ) = 0 , tr ( A 1 j A 1 j T ) ⩾ 0 , tr ( A 1 , A 1 , j T ) = 0 , A 1 , j A 1 , j T = 0 和 A 1 , j = 0 , 因此(2.5.13)简化成 A 11 T A 11 = A 11 A 11 T A_{11}^{T}A_{11} = A_{11}A_{11}^{T} A 11 T A 11 = A 11 A 11 T ;即 2 × 2 2 \times 2 2 × 2 子块 A 11 A_{11} A 11 是正规矩阵。
依次验证恒等式 A Γ A = A A Γ A^{\Gamma}A = AA^{\Gamma} A Γ A = A A Γ 的与(2.5.11)中子块 A n A_{n} A n 相对应的 2 × 2 2 \times 2 2 × 2 主对角块元,其中 i = 2 , 3 , ⋯ , k − 1 i = 2, 3, \cdots, k-1 i = 2 , 3 , ⋯ , k − 1 ,并且运用同样的论证,如我们所断言的那样,可以得出,所有非对角子块都是零,且所有对角子块 A n A_{n} A n 都是正规矩阵。
我们已经证明,一个实正交相似可把一个实正规矩阵化成形式(2.3.5).实际上可化成分块对角形式(2.5.9).只要证明所有对角子块有形式(2.5.10),那就完成了整个证明.
如果 A n = [ a b c d ] ∈ M 2 ( R ) A_{n} = \begin{bmatrix} a & b \\ c & d \end{bmatrix} \in M_2(\mathbf{R}) A n = [ a c b d ] ∈ M 2 ( R ) 是正规矩阵,那么,使恒等式 A n T A n = A i A n T A_{n}^{T} A_{n} = A_{i} A_{n}^{T} A n T A n = A i A n T 的1,1元和1,2元分别相等便得到恒等式
b 2 = c 2 , 从 而 c = ± b , b ^ {2} = c ^ {2}, \quad \text {从 而} c = \pm b, b 2 = c 2 , 从 而 c = ± b , 以及 a c + b d = a b + c d ac + bd = ab + cd a c + b d = ab + c d ,从而,如果 c = − b c = -b c = − b ,则
2 b ( a − d ) = 0. 2 b (a - d) = 0. 2 b ( a − d ) = 0. c = + b c = +b c = + b 及 b = 0 b = 0 b = 0 的情形可以排除在外,因为这时 A i j A_{ij} A ij 将是实对称矩阵,因而只有实特征值;但是按我们的作法,子块 A i j A_{ij} A ij 有一对共轭的非实特征值。因此,只能有 c = − b c = -b c = − b , a = d a = d a = d ,且 A i j A_{ij} A ij 必有形式(2.5.10)。由计算可知,实矩阵 [ a b − b a ] \left[ \begin{array}{cc} a & b \\ -b & a \end{array} \right] [ a − b b a ] 有一对共轭的复特征值 λ = a + a + i b \lambda = a + a + ib λ = a + a + ib 和 = λ a − i b = \lambda a - ib = λa − ib . □
作为这个关于实正规矩阵的定理的推论,容易推导出实矩阵是对称矩阵、斜对称矩阵或正交矩阵时的实标准形。
2.5.14 推论 设 A ∈ M n ( R ) A \in M_n(\mathbf{R}) A ∈ M n ( R ) 。于是有 (a) A = A T A = A^T A = A T ,当且仅当存在一个实正交矩阵 Q ∈ M n ( R ) Q \in M_n(\mathbf{R}) Q ∈ M n ( R ) ,使得
Q r A Q = [ λ 1 0 ⋱ ⋱ 0 λ n ] , 其 中 所 有 λ i ∈ R ; Q ^ {r} A Q = \left[ \begin{array}{c c c} {\lambda_ {1}} & & 0 \\ & {\ddots} & {\ddots} \\ {0} & & {\lambda_ {n}} \end{array} \right], \quad \text {其 中 所 有} \lambda_ {i} \in \mathbf {R}; Q r A Q = λ 1 0 ⋱ 0 ⋱ λ n , 其 中 所 有 λ i ∈ R ; (b) A = − A T A = -A^T A = − A T ,当且仅当存在一个实正交矩阵 Q ∈ M n ( R ) Q \in M_{n}(\mathbb{R}) Q ∈ M n ( R ) ,使得
Q T A Q = [ 0 ⋱ 0 0 A t 0 ⋱ A k ] , Q ^ {T} A Q = \left[ \begin{array}{c c c c c c} 0 & & & & & \\ & \ddots & & & 0 & \\ & & 0 & & & \\ & & & A _ {t} & & \\ & 0 & & & \ddots & \\ & & & & & A _ {k} \end{array} \right], Q T A Q = 0 ⋱ 0 0 A t 0 ⋱ A k , 其中每个 A j ∈ M 2 ( R ) A_{j}\in M_{2}(\mathbf{R}) A j ∈ M 2 ( R ) 有形式
A j = [ 0 β j − β j 0 ] ; A _ {j} = \left[ \begin{array}{c c} 0 & \beta_ {j} \\ - \beta_ {j} & 0 \end{array} \right]; A j = [ 0 − β j β j 0 ] ; (c) A A T = I AA^T = I A A T = I ,当且仅当存在一个实正交矩阵 Q ∈ M n ( R ) Q \in M_n(\mathbb{R}) Q ∈ M n ( R ) ,使得
Q 1 A Q = [ λ 1 ⋱ 0 λ p A 1 0 A k ] , Q ^ {1} A Q = \left[ \begin{array}{c c c c c} \lambda_ {1} & & & & \\ & \ddots & & 0 & \\ & & \lambda_ {p} & & \\ & & & A _ {1} & \\ & 0 & & & \\ & & & & A _ {k} \end{array} \right], Q 1 A Q = λ 1 ⋱ 0 λ p 0 A 1 A k , 其中,每个 λ j = ± 1 \lambda_{j} = \pm 1 λ j = ± 1 ,而每个 A j ∈ M 2 ( R ) A_{j}\in M_{2}(\mathbf{R}) A j ∈ M 2 ( R ) 有形式
A t = [ cos θ j sin θ j − sin θ j cos θ j ] , θ j ∈ R . A _ {t} = \left[ \begin{array}{c c} \cos \theta_ {j} & \sin \theta_ {j} \\ - \sin \theta_ {j} & \cos \theta_ {j} \end{array} \right], \quad \theta_ {j} \in \mathbf {R}. A t = [ cos θ j − sin θ j sin θ j cos θ j ] , θ j ∈ R . 证明:在每一种情形,定理的条件都保证 A A A 是实正规矩阵,因此 A A A 可写成形式(2.5.9)和(2.5.10). 如果 A = A T A = A^T A = A T ,那么每个 A j = A j i A_j = A_j^i A j = A j i ,因而所有 β i = 0 \beta_i = 0 β i = 0 ,而 Q T A Q Q^T A Q Q T A Q 是对角矩阵.如果 Λ − − A T \Lambda - - A^T Λ − − A T ,那么每个 λ j = − λ j \lambda_{j} = -\lambda_{j} λ j = − λ j 且每个 A j = − A j T A_{j} = -A_{j}^{T} A j = − A j T ,因而所有 λ j = 0 \lambda_{j} = 0 λ j = 0 且所有 α j = 0 \alpha_{j} = 0 α j = 0 .如果 A A T = I AA^T = I A A T = I 那么每个 λ j λ j = 1 \lambda_{j}\lambda_{j} = 1 λ j λ j = 1 且每个 A j A j T = I A_{j}A_{j}^{T} = I A j A j T = I ,因而,所有 λ j 2 = 1 \lambda_j^2 = 1 λ j 2 = 1 且所有 α j 2 + β j 2 = 1 \alpha_j^2 +\beta_j^2 = 1 α j 2 + β j 2 = 1 ;这时有 λ j = ± 1 \lambda_{j} = \pm 1 λ j = ± 1 且 α j = cos θ j , β j = sin θ j \alpha_{j} = \cos \theta_{j},\beta_{j} = \sin \theta_{j} α j = cos θ j , β j = sin θ j □
如果有一个由可交换的实正规矩阵组成的族,它们可能不可同时实对角化,但是可以同时把它们都变成分块对角形式(2.5.9).
107
2.5.15 定理 如果 A ⊆ M n ( R ) A \subseteq M_{n}(\mathbf{R}) A ⊆ M n ( R ) 是实正规矩阵的交换族,那么存在实正交矩阵 Q Q Q ,使得对所有 A ∈ I A \in \mathbb{I} A ∈ I , Q T A Q Q^{T}AQ Q T A Q 具有形式(2.5.9)和(2.5.10).
证明:运用(2.3.6),可经实正交相似 Q Q Q 把 I \mathbb{I} I 的每个成员化成形式(2.3.5).(2.3.8)的证明过程说明,它们这时有形式(2.5.9). □
习题 关于 A ∈ M n A \in M_{n} A ∈ M n 的与正规性等价的条件,除了(2.5.4)所列出的以外,还可以罗列出许多。在下面的习题中,其中就包含若干等价条件。
证明, A ∈ M n A \in M_{n} A ∈ M n 是正规矩阵,当且仅当对所有 x ∈ C n x \in \mathbb{C}^{n} x ∈ C n , A x Ax A x 与 A ∗ x A^{*}x A ∗ x 的 Euclid 长度相同。我们知道, ( y ∗ y ) − 1 (y^{*}y)^{-1} ( y ∗ y ) − 1 是 y ∈ C n y \in \mathbb{C}^{n} y ∈ C n 的 Euclid 长度。
证明,正规矩阵是酉矩阵,当且仅当它的所有特征值有绝对值1.
证明,正规矩阵是Hermite矩阵,当且仅当它的所有特征值都是实数。
证明,正规矩阵是斜Hermite矩阵,当且仅当它的所有特征值都是纯虚数(有等于0的实部).
如果 A ∈ M n A \in M_{n} A ∈ M n 是斜 Hermite(相应地,Hermite)矩阵,证明 i A iA i A 是Hermite(相应地,斜Hermite)矩阵。
证明, A ∈ M n A \in M_n A ∈ M n 是正规矩阵,当且仅当它与一个具有互异特征值的正规矩阵可交换。
如同定理(2.1.9)那样,假定 A ∈ M n A \in M_n A ∈ M n 有形式 A = B ′ B ′ A = B^{\prime}B^{\prime} A = B ′ B ′ ,其中 B ∈ M n B \in M_n B ∈ M n 是非奇异矩阵。 (a) 证明, A A A 是酉矩阵,当且仅当 B B B 是正规矩阵。(b) 如果 B B B 有形式 B = H N H B = HNH B = H N H ,其中, N N N 是正规矩阵,而 H H H 是 Hermite 矩阵(且它们都是非奇异矩阵),证明 A A A 相似于一个酉矩阵。
定义 H ( A ) = 1 2 ( A + A ∗ ) H(A) = \frac{1}{2} (A + A^{*}) H ( A ) = 2 1 ( A + A ∗ ) 为 A ∈ M n A\in M_{n} A ∈ M n 的Hermite部分,而 S ( A ) = 1 2 ( A − A ∗ ) S(A) = \frac{1}{2} (A - A^{*}) S ( A ) = 2 1 ( A − A ∗ ) 为 A A A 的斜Hermite部分,那么 A = H ( A ) + S ( A ) A = H(A) + S(A) A = H ( A ) + S ( A ) ,证明 A A A 是正规矩阵,当且仅当 H ( A ) H(A) H ( A ) 与 S ( A ) S(A) S ( A ) 可交换.
如果两个正规矩阵可交换,证明它们的乘积是正规矩阵,并用例子说明,即使两个正规矩阵不可交换,它们的乘积也可以是正规矩阵。
采用习题8的记号,证明,如果 H ( A ) H(A) H ( A ) 的每个特征向量是 S ( A ) S(A) S ( A ) 的(相应地, A A A 的)特征向量,那么 A A A 是正规矩阵。
对于任意复数 z ∈ C z \in \mathbf{C} z ∈ C ,证明存在某个 θ ∈ R \theta \in \mathbb{R} θ ∈ R ,使得 z ‾ = e i θ z \overline{z} = e^{i\theta}z z = e i θ z 。注意 [ e i θ ] ∈ M 1 [e^{i\theta}] \in M_1 [ e i θ ] ∈ M 1 是酉矩阵,想一想,两对角矩阵 U ∈ M p U \in M_p U ∈ M p 像什么呢?
推广习题 11,证明,如果 Λ − diag ( λ 1 , … , λ n ) ∈ M n \Lambda - \operatorname{diag}(\lambda_1, \dots, \lambda_n) \in M_n Λ − diag ( λ 1 , … , λ n ) ∈ M n ,那么存在两对角矩阵 U U U ,使得 Λ ‾ = U Λ − Λ U \overline{\Lambda} = U\Lambda - \Lambda U Λ = U Λ − Λ U .
利用习题 12 证明, 矩阵 A ∈ M n A \in M_{n} A ∈ M n 是正规矩阵当且仅当存在酉矩阵 V ∈ M n V \in M_{n} V ∈ M n , 使得 A ∗ = A V A^{*} = AV A ∗ = A V . 这与习题 7 有什么关系?
如果 A ∈ M n ( R ) A \in M_{n}(\mathbf{R}) A ∈ M n ( R ) ,且 A A A 的所有特征值都是实数,证明, A A A 是正规矩阵,当且仅当它是对称矩阵。
证明,两个同阶正规矩阵相似(实际上是酉等价),当且仅当它们有相同的特征多项式。这对非正规矩阵也成立吗?提示:考察 [ 0 0 0 0 ] \left[ \begin{array}{ll}0 & 0\\ 0 & 0 \end{array} \right] [ 0 0 0 0 ] 和 [ 0 1 0 0 ] \left[ \begin{array}{ll}0 & 1\\ 0 & 0 \end{array} \right] [ 0 0 1 0 ] 。
如果 A , B ∈ M n A, B \in M_{n} A , B ∈ M n 是正规矩阵,说明 A B AB A B 未必是正规矩阵,并说明某个阶数的非奇异正规矩阵不构成一个乘法群。但是西正规矩阵确实构成一个群。非奇异Hermite矩阵构成一个乘法群吗?
如果 A ∈ M n A \in M_{n} A ∈ M n 是正规矩阵,且 p ( t ) p(t) p ( t ) 是给定的多项式,用定义(2.5.1)证明 p ( A ) p(A) p ( A ) 是正规矩阵。利用(2.5.4)对这个结果给出另一个证明。
如果 A ∈ M n A \in M_{n} A ∈ M n 有性质:对某个非零多项式 p ( t ) p(t) p ( t ) , p ( A ) p(A) p ( A ) 是正规矩阵。那么 A A A 是正规矩阵吗?提示:考察 A = ( 0 1 − 2 0 ) A = \begin{pmatrix} 0 & 1 \\ -2 & 0 \end{pmatrix} A = ( 0 − 2 1 0 ) 和 A ′ A' A ′ 。
设 Λ ∈ M n \Lambda \in M_{n} Λ ∈ M n ,且 α ∈ C \alpha \in \mathbf{C} α ∈ C 是给定的。证明, Λ \Lambda Λ 是正规矩阵,当且仅当 Λ + α I \Lambda + \alpha I Λ + α I 是正规矩阵。
设 A ∈ M n A \in M_{n} A ∈ M n 是正规矩阵,并且假定 x ∈ C n x \in \mathbb{C}^{n} x ∈ C n 是使 A x = λ x Ax = \lambda x A x = λ x 的向量。试利用习题1和19证明 A ∗ x = λ ‾ x A^{*}x = \overline{\lambda} x A ∗ x = λ x 。提示:如果向量 ( A − λ I ) x (A - \lambda I)x ( A − λ I ) x 的Euclid长度是零,试证 ( A − λ I ) ∗ x (A - \lambda I)^{*}x ( A − λ I ) ∗ x 的Euclid长度也是零。
利用(2.5.4)证明,如果 A ∈ M n A \in M_{n} A ∈ M n 是正规矩阵,且 A x = λ x Ax = \lambda x A x = λ x 和 A y = μ y Ay = \mu y A y = μ y ,其中 λ ≠ μ \lambda \neq \mu λ = μ ,那么 x x x 与 y y y 正交。提示:设 A = U Λ U ∗ A = U\Lambda U^{*} A = U Λ U ∗ ,其中 U ∈ M n U \in M_{n} U ∈ M n 是两矩阵,而 Λ = d i a g ( λ 1 , … , λ n ) \Lambda = \mathrm{diag}(\lambda_1, \dots, \lambda_n) Λ = diag ( λ 1 , … , λ n ) 。令 U ∗ x = x ′ = [ x ′ , ] U^{*}x = x' = [x',] U ∗ x = x ′ = [ x ′ , ] 和 U ∗ y − y ′ ⌊ y ′ ⌋ U^{*}y - y' \lfloor y'\rfloor U ∗ y − y ′ ⌊ y ′ ⌋ 。证明 Λ x ′ − λ x ′ \Lambda x' - \lambda x' Λ x ′ − λ x ′ ,且由此推出对每个使 λ i ≠ λ \lambda_i \neq \lambda λ i = λ 的指标 i i i ,有 x i ′ = 0 x_i' = 0 x i ′ = 0 ,同理, y ′ y' y ′ 也有类似性质。再证明 x ′ x' x ′ 与 y ′ y' y ′ 正交,从而得出 x x x 与 y y y 正交。
利用(2.5.6)证明,即使Hermite矩阵 A A A 的所有元素不都是实数,它的特征多项式必定有实系数。
证明, [ 1 i i 1 ] \left[ \begin{array}{ll}1 & i\\ i & 1 \end{array} \right] [ 1 i i 1 ] 和 [ i i − i 1 ] \left[ \begin{array}{ll}i & i\\ -i & 1 \end{array} \right] [ i − i i 1 ] 都是复对称矩阵( A = A T A = A^{\mathrm{T}} A = A T ),但一个是正规矩阵,而另一个则不是。因此,在实对称矩阵和复对称矩阵之间存在着很大的差别[见(4.4)节]。
如果 A ∈ M 1 A \in M_{1} A ∈ M 1 既是正规矩阵,又是幂零矩阵,证明 A = 0 A = 0 A = 0
设 A ∈ M n A \in M_{n} A ∈ M n 是给定的矩阵。证明, Λ \Lambda Λ 是正规矩阵,当且仅当存在次数至多为 n − 1 n - 1 n − 1 的多项式 p ( t ) p(t) p ( t ) ,使得 Λ ′ = p ( A ) \Lambda' = p(A) Λ ′ = p ( A ) 。提示:如果 Λ = d i a g ( λ 1 , … , λ n ) \Lambda = \mathrm{diag}(\lambda_1, \dots, \lambda_n) Λ = diag ( λ 1 , … , λ n ) ,用Lagrange插值法构造一个多项式 p ( t ) p(t) p ( t ) 使 p ( Λ ) = Λ ˉ p(\Lambda) = \bar{\Lambda} p ( Λ ) = Λ ˉ ,然后引用(2.5.4)。这是如何“说明”为什么一个正规矩阵与它的伴随可交换的?此外,如果 A A A 是实矩阵,证明使得 A ′ = p ( A ) A' = p(A) A ′ = p ( A ) 的Lagrange插值多项式 p ( ⋅ ) p(\cdot) p ( ⋅ ) 有实系数且 A ′ = p ( A ) A' = p(A) A ′ = p ( A ) 。因此对实正规矩阵 A A A 有 A T = p ( A ) A^T = p(A) A T = p ( A ) ,其中 p ( ⋅ ) p(\cdot) p ( ⋅ ) 是实多项式。见(0.9.11.4)。
给出一个实正规矩阵的例子,它两相似于一个对角矩阵,但不实正交相似于一个对角矩阵。证明,实矩阵 A A A 实正交相似于一个对角矩阵,当且仅当 A A A 是对称矩阵 ( A = A ′ ) (A = A^{\prime}) ( A = A ′ ) 。
证明,已知矩阵 A ∈ M n A \in M_{n} A ∈ M n 是正规矩阵,当且仅当对所有 x , y ∈ C n x, y \in \mathbf{C}^{n} x , y ∈ C n 有
( A x ) ∗ ( A y ) = ( A ∗ x ) ∗ ( A ∗ y ) . (A x) ^ {*} (A y) = \left(A ^ {*} x\right) ^ {*} \left(A ^ {*} y\right). ( A x ) ∗ ( A y ) = ( A ∗ x ) ∗ ( A ∗ y ) . 从几何上看,这表示对所有 x , y ∈ C n x, y \in \mathbb{C}^n x , y ∈ C n , A x Ax A x 与 A y Ay A y 之间的夹角等于 A ∗ x A^* x A ∗ x 与 A ∗ y A^* y A ∗ y 之间的夹角。这与习题1是什么关系?
如果 A ∈ M n A \in M_{n} A ∈ M n 是正规矩阵,证明, Λ x = 0 \Lambda x = 0 Λ x = 0 ,当且仅当 Λ ∗ x = 0 \Lambda^{*}x = 0 Λ ∗ x = 0 。这表明 A A A 的零空间与 A ∗ A^{*} A ∗ 的零空间相同。考察 [ 0 1 0 0 ] \left[ \begin{array}{ll}0 & 1\\ 0 & 0 \end{array} \right] [ 0 0 1 0 ] 和 [ 0 0 1 0 ] \left[ \begin{array}{ll}0 & 0\\ 1 & 0 \end{array} \right] [ 0 1 0 0 ] ,说明这对一般情形不成立。
假定有线性方程组 A x = y Ax = y A x = y ,其中, A ∈ M n A \in M_n A ∈ M n 和 y ∈ C n y \in \mathbb{C}^n y ∈ C n 是已知的,且假定 A A A 是奇异矩阵。所给定的方程组有(非唯一的)解,当且仅当对每个使 A ∗ z = 0 A^*z = 0 A ∗ z = 0 的 z ∈ C n z \in \mathbb{C}^n z ∈ C n [见(0.6.6)]有式 y ∗ z = 0 y^*z = 0 y ∗ z = 0 。可是,如果 A A A 是正规矩阵,便可证明,所给定的方程组有解,当且仅当对每个使 A w = 0 A w = 0 A w = 0 的 w ∈ C n w \in \mathbb{C}^n w ∈ C n 有 y ∗ w = 0 y^*w = 0 y ∗ w = 0 ;即 y y y 正交于 A A A 的零空间。如果想求奇异方程组 A x = y Ax = y A x = y 的所有解,说明为什么在计算上 A A A 是正规矩阵时的求解比 A A A 不是正规矩阵时更简单。
设 n 1 , n 2 , ⋯ , n k n_1, n_2, \cdots, n_k n 1 , n 2 , ⋯ , n k 是给定的正整数,且 A j ∈ M n j , j = 1 , 2 , ⋯ , k A_j \in M_{n_j}, j = 1, 2, \cdots, k A j ∈ M n j , j = 1 , 2 , ⋯ , k 。证明,直和 A = A 1 ⊕ A 2 ⊕ ⋯ ⊕ A k A = A_1 \oplus A_2 \oplus \cdots \oplus A_k A = A 1 ⊕ A 2 ⊕ ⋯ ⊕ A k 是正规矩阵,当且仅当每个 A j A_j A j 都是正规矩阵。
证明,两个正规矩阵相似,当且仅当它们酉等价。提示:证明,如果 U U U 和 V V V 是酉矩阵,那么 U Λ U ∗ U \Lambda U^{*} U Λ U ∗ 和 V Λ V ∗ V \Lambda V^{*} V Λ V ∗ 酉等价。给出一个例子,说明两个(非正规)矩阵相似,但不酉等价。
如果 A ∈ M 3 ( R ) A \in M_3(\mathbb{R}) A ∈ M 3 ( R ) 是实正交矩阵,我们知道, A A A 要么有一个,要么有三个实特征值。如果它有一个正的行列式,利用(2.5.14)证明它正交等价于 [ 1 ] ∈ M 1 [1] \in M_1 [ 1 ] ∈ M 1 与一个平面旋转的直和,从几何上讨论,可把这看作绕某条经 R 3 \mathbf{R}^3 R 3 中原点的固定轴转动 θ \theta θ 角的旋转。这是关于力学的 Euler 定理的一部分:每个刚体运动是一个平移与一个绕某条轴的旋转的合成。
如果 F ⊆ M n \mathcal{F} \subseteq M_n F ⊆ M n 是正规矩阵的交换族,证明存在Hermite 矩阵 B B B ,使得对每个 A α ∈ F A_{\alpha} \in \mathcal{F} A α ∈ F 都有次数至多为 n − 1 n - 1 n − 1 的多项式 p α ( t ) p_{\alpha}(t) p α ( t ) 使 A α = p α ( B ) A_{\alpha} = p_{\alpha}(B) A α = p α ( B ) 。应当指出, B B B 对于 F \mathcal{F} F 的所有元素是固定的,而多项式可能与 F \mathcal{F} F 的元素有关。提示:设 U ∈ M n U \in M_n U ∈ M n 是同时对角化 F \mathcal{F} F 的每个成员的酉矩阵,设 B = U d i a g ( 1 , 2 , … , n ) U ⋆ B = U \mathrm{diag}(1, 2, \dots, n) U^{\star} B = U diag ( 1 , 2 , … , n ) U ⋆ , A α = U A α U ⋆ A_{\alpha} = U A_{\alpha} U^{\star} A α = U A α U ⋆ ,其中 Λ α = d i a g ( λ 1 ( α ) , … , λ n ( α ) ) \Lambda_{\alpha} = \mathrm{diag}(\lambda_1^{(\alpha)}, \dots, \lambda_n^{(\alpha)}) Λ α = diag ( λ 1 ( α ) , … , λ n ( α ) ) ,然后取 p α ( t ) p_{\alpha}(t) p α ( t ) 是使 p α ( k ) = λ k ( α ) p_{\alpha}(k) = \lambda_k^{(\alpha)} p α ( k ) = λ k ( α ) , k = 1 , 2 , … , n k = 1, 2, \dots, n k = 1 , 2 , … , n ,的Lagrange插值多项式。
证明, A ∈ M n A \in M_{n} A ∈ M n 是正规矩阵,当且仅当 A A A 的每个特征向量也是 A ∗ A^{*} A ∗ 的一个特征向量。提示:设 U ∈ M n U \in M_{n} U ∈ M n 是酉矩阵,它的第1列是 A A A (因而是 A ∗ A^{*} A ∗ )的一特征向量。检验 U ∗ A U U^{*}AU U ∗ A U 和 U ∗ A ∗ U = ( U ∗ A U ) ∗ U^{*}A^{*}U = (U^{*}AU)^{*} U ∗ A ∗ U = ( U ∗ A U ) ∗ ,然后继续做下去。
当 A , B ∈ M n A, B \in M_{n} A , B ∈ M n 是正规矩阵时,证明(2.2.8)的下述改进: A A A 西等价于 B B B ,当且仅当 tr A k = tr B k , k = 1 , 2 , ⋯ , n \operatorname{tr} A^{k} = \operatorname{tr} B^{k}, k = 1, 2, \cdots, n tr A k = tr B k , k = 1 , 2 , ⋯ , n 。提示:利用习题15以及(1,2)节习题12。
设 A ∈ M n ( R ) A \in M_{n}(\mathbb{R}) A ∈ M n ( R ) ,且假定 A A T = A T A AA^{T} = A^{T}A A A T = A T A ,因而 A A A 是实正规矩阵。如果 A A T AA^{T} A A T 的特征值各不相同,证明 A A A 必须是对称矩阵。提示:利用定理(2.5.8)。