2.2 酉等价 因为酉矩阵 U U U 有 U ⋆ = U − 1 U^{\star} = U^{-1} U ⋆ = U − 1 ,所以,如果 U U U 是酉矩阵,那么由 A → U ∗ A U A \to U^{*}AU A → U ∗ A U 给出的 M M M 上的变换是相似变换。这种特殊的相似形式称为酉相似或酉等价。
72
2.2.1 定义 设矩阵 A , B ∈ M n A, B \in M_n A , B ∈ M n ,如果存在两矩阵 U ∈ M n U \in M_n U ∈ M n ,使得 B = U ∗ A U B = U^* A U B = U ∗ A U ,就称 B B B 酉等价于 A A A ,如果 U U U 可以取实矩阵(因而是实正交矩阵),那么就称 B B B (实)正交等价于 A A A 。
练习 证明西等价是一个等价关系.
2.2.2 定理 如果 A = [ a i j ] A = [a_{ij}] A = [ a ij ] 和 B = ⌊ b i j ⌋ ∈ M n B = \lfloor b_{ij}\rfloor \in M_n B = ⌊ b ij ⌋ ∈ M n 两等价,那么
∑ i , j = 1 n ∣ b j ∣ 2 = ∑ i , j = 1 n a j ∣ 2 . \sum_ {i, j = 1} ^ {n} \left| b _ {j} \right| ^ {2} = \sum_ {i, j = 1} ^ {n} a _ {j} \left| ^ {2} \right.. i , j = 1 ∑ n ∣ b j ∣ 2 = i , j = 1 ∑ n a j 2 . 证明:作矩阵乘法后便可看出 ∑ i , j ∣ a i j ∣ 2 = tr A ∗ A \sum_{i,j}|a_{ij}|^2 = \operatorname{tr}A^*A ∑ i , j ∣ a ij ∣ 2 = tr A ∗ A 。因此只要验证 tr B ∗ B = tr A ∗ A \operatorname{tr}B^*B = \operatorname{tr}A^*A tr B ∗ B = tr A ∗ A 就够了。如果 B = U ∗ A U B = U^{*}AU B = U ∗ A U ,则因为迹是相似不变量,就有 tr B ∗ B = tr U ∗ A ∗ U U ∗ A U = tr U ∗ A ∗ A U = tr A ∗ A . \operatorname{tr}B^*B = \operatorname{tr}U^*A^*UU^*AU = \operatorname{tr}U^*A^*AU = \operatorname{tr}A^*A. tr B ∗ B = tr U ∗ A ∗ U U ∗ A U = tr U ∗ A ∗ A U = tr A ∗ A . □
练习 定理(2.2.2)说明 tr A ∗ A \operatorname{tr} A^{*} A tr A ∗ A 是酉相似不变量。不用 A ∗ A A^{*} A A ∗ A 还可以作出另一个证明,不过要利用上一节的结果:用一个酉矩阵乘一个向量不会改变其 Euclid 长度,要注意的是,从左做起的矩阵乘法是乘被乘矩阵的各列,而从右做起的矩阵乘法是乘被乘矩阵的各行。
练习 证明
[ 3 1 − 2 0 ] 和 [ 1 1 0 2 ] \left[ \begin{array}{c c} {3} & {1} \\ {- 2} & {0} \end{array} \right] \quad \text {和} \quad \left[ \begin{array}{c c} {1} & {1} \\ {0} & {2} \end{array} \right] [ 3 − 2 1 0 ] 和 [ 1 0 1 2 ] 相似,但不西等价.
因为西等价蕴涵相似,但是反之不成立,所以,与相似等价关系相比,西等价关系把 M n M_{n} M n 划分成更细的等价类。跟相似一样,西等价对应一个基变换,不过它是一种特殊形式的基变换——它把一个标准正交基变成另一个标准正交基。基的标准正交变换不改变向量的各分量的绝对值的平方和,而这个量在基的一个非标准正交变换下是可以改变的。因为求共轭转置要比
计算逆容易得多,所以在计算上,西等价关系要比相似关系更简单。在出现舍入误差的情况下,它也能较好地保证精确性。因此,在数值计算中,它是可取的。关于这方面的细致理由就不在这里阐述了,但是,可以作一个直观的解释,那就是用一个酉矩阵做乘法有保持长度的性质。
下述两种特殊的(又很简单的)酉矩阵形式给出两种西等价变换,它们在特征值的计算中非常重要.
2.2.3 例:平面旋转 设 U ( θ ; i , j ) = [ 1 ⋱ 0 1 … cos θ 0 … 0 − sin θ … 0 1 0 ⋮ ⋱ 0 0 0 1 … … sin θ 0 … 0 cos θ … 1 ⋱ ⋮ 0 1 ] i 行 U (\theta ; i, j) = \left[ \begin{array}{c c c c c c c c c} 1 & & & & & & & \\ & \ddots & & & 0 & & & \\ & & 1 & & & & & \\ & & \dots & \cos \theta & 0 & \dots & 0 & - \sin \theta & \dots \\ & & & 0 & 1 & & & \\ & & 0 & \vdots & & \ddots & & & 0 \\ & & & 0 & 0 & & 1 & & \\ & \dots & \dots & \sin \theta & 0 & \dots & 0 & \cos \theta & \dots \\ & & & & & & & 1 & \\ & & & & & & & \ddots \\ & \vdots & & & 0 & & & 1 \end{array} \right] \quad i \text {行} U ( θ ; i , j ) = 1 ⋱ … ⋮ 1 … 0 … cos θ 0 ⋮ 0 sin θ 0 0 1 0 0 0 … ⋱ … 0 1 0 − sin θ cos θ 1 ⋱ 1 … 0 … i 行 它相当于一个单位矩阵,只是它的 i i i , i i i 元和 j j j , j j j 元代之以 cos θ \cos \theta cos θ ,而 i i i , j j j 元(相应地 j j j , i i i 元)用 sin θ \sin \theta sin θ (相应地 sin θ \sin \theta sin θ )来代替.
练习 对于任一对指标 1 ⩽ i < j ⩽ n 1 \leqslant i < j \leqslant n 1 ⩽ i < j ⩽ n 和任一角参数 0 ⩽ θ < 2 n 0 \leqslant \theta < 2n 0 ⩽ θ < 2 n ,验证 U ( θ ; i , j ) U(\theta; i, j) U ( θ ; i , j ) 是 M n ( R ) M_{n}(\mathbf{R}) M n ( R ) 中的正交矩阵。矩阵 U ( θ ; i , j ) U(\theta; i, j) U ( θ ; i , j ) 只是在 i , j i, j i , j 坐标平面中作一个( θ \theta θ 角的)旋转。值得指出的是,左乘以 U ( θ ; i , j ) U(\theta; i, j) U ( θ ; i , j ) 仅对被乘矩阵的 i i i 行和 j j j 行有影响,而右乘以 U ( θ ; i , j ) U(\theta; i, j) U ( θ ; i , j ) 仅对 i i i 列和 j j j 列有影响,因此,经 U ( θ ; i , j ) U(\theta; i, j) U ( θ ; i , j ) 的两等价只使 i , j i, j i , j 行和 i , j i, j i , j 列有变化。经平面旋转的酉等价是计算特征值的 Jacobi 法和 Givens 法的基本特征。
2.2.4 例 Householder 变换。设 w ∈ C n w \in \mathbb{C}^n w ∈ C n 是非零向量,定义 U n ∈ M n U_n \in M_n U n ∈ M n 为 U n = I − t w u ∗ U_n = I - t w u^* U n = I − tw u ∗ ,其中 t = 2 ( w ∗ w ) t = 2(w^* w) t = 2 ( w ∗ w ) 。注意, w w ∗ ∈ M m w w^* \in M_m w w ∗ ∈ M m ,而 w ∗ w w^* w w ∗ w 是一个正纯量。如果 w w w 已正规化 ( w ∗ w = 1 ) (w^* w = 1) ( w ∗ w = 1 ) ,那么, t t t 就是 2,而 U n U_n U n 就是 I − 2 w w ∗ I - 2 w w^* I − 2 w w ∗ ,我们常常是在假定 w w w 已经正规化的前提下给出矩阵 U n U_n U n 。
练习 证明, U w U_{w} U w 在补子空间 w w w 上相当于一个单位变换,而在由 w w w 生成的一维子空间上相当于一个反射;即,如果 x ⊥ w x \perp w x ⊥ w ,则 U w x = x U_{w}x = x U w x = x ,而 U w W = − W U_{w}W = -W U w W = − W .
练习 证明, U w U_{w} U w 既是两矩阵,也是 Hermite 矩阵 ( U w = U u ) (U_{w} = U_{u}) ( U w = U u ) 。形如 U u U_{u} U u 的矩阵称为 Householder 变换。经 U w U_{w} U w 的酉等价有时也叫做 Householder 变换。这些变换在本书中要多次出现,其中包括计算特征值的 Householder 法(见习题 4)以及其他酉简化方法。值得指出的是,Householder 变换一般变更它们所作用的矩阵或向量的所有元素,但是,它们为许多应用提供
非常有效而精确的简化.
定理(2.2.2)给出了两个已知矩阵酉等价的一个必要而不充分的条件。我们能在此基础上再添加更多的恒等式,这些恒等式共同给出两个已知矩阵酉等价的必要充分条件。其中,下述简单概念起着关键的作用。设 s , t s, t s , t 是两个给定的非交换变元,称 s , t s, t s , t 的非负整数幂的任一有限形式乘积
W ( s , t ) = s m 1 t n 1 ⋅ s m 2 t n 2 … s m k t n k , m 1 , n 1 , … , m k , n k ⩾ 0 (2.2.5) W (s, t) = s ^ {m _ {1}} t ^ {n _ {1}} \cdot s ^ {m _ {2}} t ^ {n _ {2}} \dots s ^ {m _ {k}} t ^ {n _ {k}}, \quad m _ {1}, n _ {1}, \dots , m _ {k}, n _ {k} \geqslant 0 \tag {2.2.5} W ( s , t ) = s m 1 t n 1 ⋅ s m 2 t n 2 … s m k t n k , m 1 , n 1 , … , m k , n k ⩾ 0 ( 2.2.5 ) 为关于 s s s 和 t t t 的字。字 W ( s , t ) W(s, t) W ( s , t ) 的次数是非负整数 m 1 + n 1 + m 2 + n 2 + ⋯ + m k + n k m_{1} + n_{1} + m_{2} + n_{2} + \cdots + m_{k} + n_{k} m 1 + n 1 + m 2 + n 2 + ⋯ + m k + n k ,即字中的所有指数之和。如果已知 A ∈ M n A \in M_{n} A ∈ M n ,我们可以形式地定义 A A A 和 A ∗ A^{*} A ∗ 的字为
W ( A , A ∗ ) = A m 1 ( A ∗ ) n 1 A m 2 ( A ∗ ) n 2 … A m s ( A ∗ ) n s . W (A, A ^ {*}) = A ^ {m _ {1}} \left(A ^ {*}\right) ^ {n _ {1}} A ^ {m _ {2}} \left(A ^ {*}\right) ^ {n _ {2}} \dots A ^ {m _ {s}} \left(A ^ {*}\right) ^ {n _ {s}}. W ( A , A ∗ ) = A m 1 ( A ∗ ) n 1 A m 2 ( A ∗ ) n 2 … A m s ( A ∗ ) n s . 由于 A A A 与 A ′ A^{\prime} A ′ 的幂未必交换,试图重排乘积中的项来简化 W ( A , A ′ ) W(A, A^{\prime}) W ( A , A ′ ) 不一定可行。
如果 A A A 两等价于某个 B ∈ M n B \in M_{n} B ∈ M n ,那么,对某个两矩阵 U ∈ M n U \in M_{n} U ∈ M n , A − U B U ′ A - UBU' A − U B U ′ ,且不难算出
W ( A , A ∗ ) = ( U B U ∗ ) m 1 ( U B ∗ U ∗ ) n … ( U B U ∗ ) m 1 ( U B ∗ U ∗ ) n = U B m [ I ∗ U ( B ∗ ) n 1 U ∗ … [ I B m ] U ∗ [ I ( B ∗ ) n 1 U ∗ − U B m 1 ( B ∗ ) n 1 … B m k ( B ∗ ) n k U ∗ = U W ( B , B ∗ ) U ′ . \begin{array}{l} W (A, A ^ {*}) = (U B U ^ {*}) ^ {m _ {1}} (U B ^ {*} U ^ {*}) ^ {n} \dots (U B U ^ {*}) ^ {m _ {1}} (U B ^ {*} U ^ {*}) ^ {n} \\ = U B ^ {m} \left[ I ^ {*} U (B ^ {*}) ^ {n _ {1}} U ^ {*} \dots [ I B ^ {m} ] U ^ {*} [ I (B ^ {*}) ^ {n _ {1}} U ^ {*} \right. \\ - U B ^ {m _ {1}} \left(B ^ {*}\right) ^ {n _ {1}} \dots B ^ {m _ {k}} \left(B ^ {*}\right) ^ {n _ {k}} U ^ {*} \\ = U W (B, B ^ {*}) U ^ {\prime}. \\ \end{array} W ( A , A ∗ ) = ( U B U ∗ ) m 1 ( U B ∗ U ∗ ) n … ( U B U ∗ ) m 1 ( U B ∗ U ∗ ) n = U B m [ I ∗ U ( B ∗ ) n 1 U ∗ … [ I B m ] U ∗ [ I ( B ∗ ) n 1 U ∗ − U B m 1 ( B ∗ ) n 1 … B m k ( B ∗ ) n k U ∗ = U W ( B , B ∗ ) U ′ . 因而, tr W ( A , A ∗ ) → tr U W ( B , B ∗ ) U ∗ = tr W ( B , B ∗ ) \operatorname{tr} W(A, A^*) \rightarrow \operatorname{tr} UW(B, B^*)U^* = \operatorname{tr} W(B, B^*) tr W ( A , A ∗ ) → tr U W ( B , B ∗ ) U ∗ = tr W ( B , B ∗ ) 如果取字 W ( s , t ) = t s W(s, t) = ts W ( s , t ) = t s ,就得到定理(2.2.2)中的恒等式。
对所有可能的字 W ( s , t ) W(s, t) W ( s , t ) ,上述结果给出了两个矩阵是酉等价的无限多个必要条件。下面,我们不加证明地叙述 W ⋅ Spec c h W \cdot \operatorname{Spec} \mathbf{ch} W ⋅ Spec ch 的一个定理,这个定理确认这无限多个必要条件同时也是充分条件。
2.2.6 定理 两个已知矩阵 A , B ∈ M n A, B \in M_{n} A , B ∈ M n 西等价,当且仅当
tr W ( A , A ′ ) = tr W ( B , B ′ ) (2.2.7) \operatorname {t r} W (A, A ^ {\prime}) = \operatorname {t r} W (B, B ^ {\prime}) \tag {2.2.7} tr W ( A , A ′ ) = tr W ( B , B ′ ) ( 2.2.7 ) 对于两个非交换元的每个字 W ( s , t ) W(s, t) W ( s , t ) 都成立.
Specht定理只能用来证明两个已知矩阵不酉等价。然而,除非在一些特殊情形(见习题6),它在证明两个已知矩阵是酉等价时可能失效,因为必须验证无限多个条件。幸运的是,有一个定理对Specht定理作了改进,它属于C. Pearcy。这个定理说明,只要对有限多个字验证迹恒等式(2.2.7)就够了。
2.2.8 定理 两个已知矩阵 A , B ∈ M n A, B \in M_{n} A , B ∈ M n 两等价,当且仅当 tr W ( A , A ∗ ) = tr W ( B , B ∗ ) \operatorname{tr} W(A, A^{*}) = \operatorname{tr} W(B, B^{*}) tr W ( A , A ∗ ) = tr W ( B , B ∗ ) 对次数至多是 2 n 2 2n^{2} 2 n 2 的每个字 W ( s , t ) W(s, t) W ( s , t ) 都成立。
Pearcy定理中的有限限制是对Specht定理的一大改进,但是,如我们所知,这还是非常保守的。当 n = 2 n = 2 n = 2 时,只要对二个字 W ( s , t ) = s W(s,t) = s W ( s , t ) = s , s 2 s^2 s 2 和 t s ts t s 验证迹恒等式就够了。无需考虑次数至多是 2 ( 2 ) 2 = 8 2(2)^2 = 8 2 ( 2 ) 2 = 8 的所有字。当 n = 3 n = 3 n = 3 时,只要对9个字 W ( s , t ) = s W(s,t) = s W ( s , t ) = s , s 2 s^2 s 2 , t s ts t s , s 4 s^4 s 4 , t s 2 ts^2 t s 2 , t 2 s 2 t^2 s^2 t 2 s 2 , t s t s tsts t s t s , t s 2 t s ts^2 ts t s 2 t s 和 t s 2 t 2 s ts^2 t^2 s t s 2 t 2 s 验证迹恒等式而用不着考察次数至多是 2 ( 3 ) 2 = 18 2(3)^2 = 18 2 ( 3 ) 2 = 18 的所有字。
习题 设 A = ∣ a i j ∣ ∈ M n ( R ) A = \left|a_{ij}\right| \in M_n(\mathbf{R}) A = ∣ a ij ∣ ∈ M n ( R ) 是对称矩阵 ( A i = A ) (A^i = A) ( A i = A ) ,但非对角矩阵,并假定选下标 i ≠ j i \neq j i = j 使得 ∣ a i j ∣ \left|a_{ij}\right| ∣ a ij ∣ 越大越好。用 ( a i i − a j j ) 2 a i j − cot ( 2 θ ) (a_{ii} - a_{jj})^2 a_{ij} - \cot(2\theta) ( a ii − a jj ) 2 a ij − cot ( 2 θ ) 定义 θ \theta θ ,且设 U ( θ ; i , j ) U(\theta; i, j) U ( θ ; i , j ) 是如(2.2.3)中所得到的平面旋转。用(2.2.2)证明,如果 B − U ( θ ; i , j ) ∗ A U ( θ ; i , j ) = ( b i j ) B - U(\theta; i, j)^* AU(\theta; i, j) = (b_{ij}) B − U ( θ ; i , j ) ∗ A U ( θ ; i , j ) = ( b ij ) ,那么 ∑ i ≤ j ∣ b i j ∣ 2 < ∑ i ≤ j ∣ a i j ∣ 2 \sum_{i \leq j} |b_{ij}|^2 < \sum_{i \leq j} |a_{ij}|^2 ∑ i ≤ j ∣ b ij ∣ 2 < ∑ i ≤ j ∣ a ij ∣ 2 。说明累次应用这样的平面旋转(用上述相同的方式对 B B B 和它后面的矩阵作相应的选择)会缩小各非对角元的平方和而保持所有元的平方和不变;每做一步,所得到的矩阵就比前一步更接近于对角矩阵。这就是计算一个实对称矩阵的特征值的 Jacobi 法。这个方法产生一个实对角矩阵的矩阵序列。为什么极限矩阵的诸对角元必定是 A A A 的诸特征值?
关于实对称矩阵(或一般的实矩阵)特征值的Givens法也是利用平面旋转,但采用的方式有所不同。证明,一个对称矩阵 A = [ a i j ] ∈ M n ( R ) A = [a_{ij}] \in M_n(\mathbb{R}) A = [ a ij ] ∈ M n ( R ) 经若干平面旋转后正交等价于一个三对角(对称)矩阵,而一般的 A ∈ M n ( R ) A \in M_n(\mathbb{R}) A ∈ M n ( R ) 经若干平面旋转正交等价于一个(下)Hessenberg矩阵。关于三对角矩阵和Hessenberg矩阵可见(0.9.9)和(0.9.10)。提示:选一个平面旋转 U 1 , 3 U_{1,3} U 1 , 3 使得 U 1 , 3 A U 1 , 3 U_{1,3}AU_{1,3} U 1 , 3 A U 1 , 3 的1,3元为0。选另一个平面旋转使1,4元为0,继续做下去直到1, n n n 元。然后转到2,4元,接着做下去。注意,这样一步步做下去不会影响前面已经选定的0元;并且正交等价保持对称性不变。一个三对角矩阵的特征多项式是容易确定的,而其特征值可用求根的方法来确定。注意到经过有限多次平面旋转后Givens法得到一个三对角矩阵,但它不会显现特征值或特征向量,不过利用另外的计算一定能得到它们。Jacobi法一般不会经有限多次平面旋转后中止,但它的目标是产生一个对角矩阵,而且得到一个标准正交特征向量组。
证明,每个矩阵 A ∈ M n A \in M_n A ∈ M n 酉等价于一个有相同主对角元的矩阵。提示:(a)若 A ∈ M 2 A \in M_2 A ∈ M 2 ,考察 A − ( 1 / 2 ) ( tr A ) I A - (1/2)(\operatorname{tr} A)I A − ( 1/2 ) ( tr A ) I ,证明只需考虑 tr A = 0 \operatorname{tr} A = 0 tr A = 0 的情形就行了。若 x ∈ C 2 x \in \mathbb{C}^2 x ∈ C 2 是一个使 x ∗ A x = 0 x^* A x = 0 x ∗ A x = 0 的单位向量,设 U − [ x , y ] ∈ M 2 U - [x, y] \in M_2 U − [ x , y ] ∈ M 2 是一个酉矩阵,说明 U ∗ A U U^* A U U ∗ A U 的 1,1 元为零,并且利用迹条件证明其 2,2 元也为零。为了求这个向量 x x x ,设 w , z w, z w , z 是属于 A A A 的两个特征值 ± λ \pm \lambda ± λ 的特征向量。如果 λ = 0 \lambda = 0 λ = 0 ,取 x = w x = w x = w 。如果 λ ≠ 0 \lambda \neq 0 λ = 0 ,设 x ( θ ) = e i θ w + z x(\theta) = e^{i\theta} w + z x ( θ ) = e i θ w + z ;证明,对所有 θ ∈ R \theta \in \mathbb{R} θ ∈ R 有 x ( θ ) ≠ 0 x(\theta) \neq 0 x ( θ ) = 0 ,面对某个 θ ∈ R \theta \in \mathbb{R} θ ∈ R 有 x ( θ ) ∗ A x ( θ ) = 0 x(\theta)^* A x(\theta) = 0 x ( θ ) ∗ A x ( θ ) = 0 ;对这个 θ \theta θ ,设 x − x ( θ ) / [ x ( θ ) ′ x ( θ ) ] 1 2 x - x(\theta) / [x(\theta)' x(\theta)]^{\frac{1}{2}} x − x ( θ ) / [ x ( θ ) ′ x ( θ ) ] 2 1 。如果 A ∈ M 2 ( R ) A \in M_2(\mathbb{R}) A ∈ M 2 ( R ) ,容易构造一个(实)平面旋转 U = U ( θ ; 1 , 2 ) U = U(\theta; 1, 2) U = U ( θ ; 1 , 2 ) 使 U T A U U^T A U U T A U 的对角元相等,但这在复的情形是行不通的。定义 f ( A ) = max { ∣ a n − a j n ∣ : i , j = 1 , 2 , … , n } f(A) = \max \{|a_n - a_{jn}| : i, j = 1, 2, \dots, n\} f ( A ) = max { ∣ a n − a jn ∣ : i , j = 1 , 2 , … , n } ,并且设 A 2 = [ a n a n a n a n ] A_2 = \begin{bmatrix} a_n & a_n \\ a_n & a_n \end{bmatrix} A 2 = [ a n a n a n a n ] ,其中指标偶 i , j i, j i , j 适合 f ( A ) = ∣ a n − a j n ∣ f(A) = |a_n - a_{jn}| f ( A ) = ∣ a n − a jn ∣ 。设 U 2 ∈ M 2 U_2 \in M_2 U 2 ∈ M 2 是使 U 2 ∗ A 2 U 2 U_2^* A_2 U_2 U 2 ∗ A 2 U 2 有相同主对角元的酉矩阵。如同(2.2.3)中从 2 × 2 2 \times 2 2 × 2 平面旋转构造 U ( θ ; i , j ) U(\theta; i, j) U ( θ ; i , j ) ,用同样的方式从 U 2 U_2 U 2 构造 U ( i , j ) ∈ M n U(i, j) \in M_n U ( i , j ) ∈ M n ,并且证明,如果极大对角元之差不是多个可取差,则 f ( U ( i , j ) ∗ A U ( i , j ) ) < f ( A ) f(U(i, j)^* A U(i, j)) < f(A) f ( U ( i , j ) ∗ A U ( i , j )) < f ( A ) ;否则可以重复上述构造。可以断定,如果 f ( A ) ≠ 0 f(A) \neq 0 f ( A ) = 0 ,则有两矩阵 U ∈ M n U \in M_n U ∈ M n 使 f ( U ∗ A U ) < f ( A ) f(U^* A U) < f(A) f ( U ∗ A U ) < f ( A ) 。设 R ( A ) = { U ∗ A U ; U ∈ M n R(A) = \{U^* A U; U \in M_n R ( A ) = { U ∗ A U ; U ∈ M n 是酉矩阵},证明 R ( A ) R(A) R ( A ) 是紧集并注意 f f f 是 R ( A ) R(A) R ( A ) 上的连续函数。设 C ∈ R ( A ) C \in R(A) C ∈ R ( A ) 适合 f ( C ) = min { f ( B ) ; B ∈ R ( A ) } f(C) = \min \{f(B); B \in R(A)\} f ( C ) = min { f ( B ) ; B ∈ R ( A )} ,证明 f ( C ) f(C) f ( C ) 不成立,因而从 f ( C ) = 0 f(C) = 0 f ( C ) = 0 得出结论成立。
证明,用Householder变换可以把一个具有Euclid长度 r = ( x ′ x ) 1 / 2 r = (x^{\prime}x)^{1/2} r = ( x ′ x ) 1/2 的任一向量 x ∈ R x \in \mathbb{R} x ∈ R 变成长度为 r r r 的任一其他向量 y ∈ R n y \in \mathbb{R}^{n} y ∈ R n , y ≠ x y \neq x y = x 。提示:试用 U w U_{w} U w 证明,其中 w = x − y w = x - y w = x − y 。如果 x , y ∈ C n x, y \in \mathbb{C}^{n} x , y ∈ C n 你能得出什么结论?
76
计算 A ∈ M n ( R ) A \in M_{n}(\mathbf{R}) A ∈ M n ( R ) 的特征值的 Householder 法如同 Givens 法,先把 A A A 化简成(上)Hessenberg 矩阵(或在对称的情形化为三对角矩阵)。构造性地证明,其第 j j j 列中的第 ( j + 1 ) (j + 1) ( j + 1 ) 个元素以后均为 0 ( j = 1 , ⋯ , k ) 0 (j = 1, \cdots, k) 0 ( j = 1 , ⋯ , k ) 的形如
的矩阵,经一个用Householder变换所确定的实正交相似可以变成一个同形的矩阵。由此得出,任一个矩阵 A ∈ M n ( R ) A \in M_{n}(\mathbf{R}) A ∈ M n ( R ) 都可以经一系列 ( n − 2 (n - 2 ( n − 2 个)Householder相似化简成上Hessenberg矩阵,而一个对称矩阵 A ∈ M n ( R ) A \in M_{n}(\mathbf{R}) A ∈ M n ( R ) 可用同样的方式化简成三对角矩阵。提示:对于第 ( k + 1 ) (k + 1) ( k + 1 ) 列,选一Householder变换 U ∈ M n U \in M_{n} U ∈ M n 把出现在对角线下方的诸元素组成的 ( n − k ) (n - k) ( n − k ) 维向量变成 [ 1 , 0 , … , 0 ] T ∈ R n [1,0,\dots ,0]^T \in \mathbb{R}^n [ 1 , 0 , … , 0 ] T ∈ R n 的一个适当倍数。于是经由正交矩阵
[ I 0 0 U ] ∈ M n \left[ \begin{array}{c c} I & 0 \\ 0 & U \end{array} \right] \in M _ {n} [ I 0 0 U ] ∈ M n 确定的相似可变换整个矩阵,并且看到所想要的0子块出现了。
设 A ∈ M n A \in M_{n} A ∈ M n 和 B , C ∈ M n B, C \in M_{n} B , C ∈ M n 是给定的。用 Specht 定理(2.26)或 Pearcy 定理(2.2.8)证明 B B B 与 C C C 酉等价,当且仅当下列诸条件下的任一个成立:
(a) [ A 0 0 B ] \left[ \begin{array}{ll}A & 0\\ 0 & B \end{array} \right] [ A 0 0 B ] 和 [ A 0 0 C ] \left[ \begin{array}{ll}A & 0\\ 0 & C \end{array} \right] [ A 0 0 C ] 酉等价.
(b) [ B 0 B ⋱ 0 B ] \left[ \begin{array}{cccc}B & & & 0\\ & B & & \\ & & \ddots & \\ 0 & & & B \end{array} \right] B 0 B ⋱ 0 B 和 [ C 0 C ⋱ 0 C ] \left[ \begin{array}{cccc}C & & & 0\\ & C & & \\ & & \ddots & \\ 0 & & & C \end{array} \right] C 0 C ⋱ 0 C 酉等价,其中两个直和有相同的项数.
(A) [ A 0 B ⋱ 0 B ] \left[ \begin{array}{cccc}A & & & 0\\ & B & & \\ & & \ddots & \\ 0 & & & B \end{array} \right] A 0 B ⋱ 0 B 和 [ A 0 C ⋱ 0 C ] \left[ \begin{array}{cccc}A & & & 0\\ & C & & \\ & & \ddots & \\ 0 & & & C \end{array} \right] A 0 C ⋱ 0 C 酉等价,其中两个直和有相同的项数.
证明:诸某个次数 k k k 有 2 k − 1 2^{k-1} 2 k − 1 个不同的形如(2.2.5)的字 W ( s , t ) \mathbf{W}(s, t) W ( s , t ) ,因而得出至多有 4 n 2 4n^{2} 4 n 2 个次数至多为 2 n 2 2n^{2} 2 n 2 的不同的字。
试给出两个 2 × 2 2 \times 2 2 × 2 矩阵,这两个矩阵满足恒等式(2.2.2),但它们不酉等价。解释其原因。
进一步阅读与注释 关于定理(2.2.6)的原始证明可参看W. Specht, “Zur Theorie der Matrizen II,” Jahresbericht der Deutschen Mathematiker Vereinigung 50(1940), 19-23. 定理 (2.2.8) 的证明可见 C. Pearcy, “A Complete Set of Unitary Invariants for Operators Generating Finite W ∗ W^{*} W ∗ -Algebras of Type I,” Pacific J. Math. 12(1962), 1405-1416. 关于低阶矩阵两等价的讨论可见 C. Pearcy, “A Complete Set of Unitary Invariants for 3 × 3 3 \times 3 3 × 3 Complex Matrices,” Trans. Amer. Math. Soc. 104(1962), 425-429.