2.2_酉等价

2.2 酉等价

因为酉矩阵 UUU=U1U^{\star} = U^{-1} ,所以,如果 UU 是酉矩阵,那么由 AUAUA \to U^{*}AU 给出的 MM 上的变换是相似变换。这种特殊的相似形式称为酉相似或酉等价。

72

2.2.1 定义 设矩阵 A,BMnA, B \in M_n ,如果存在两矩阵 UMnU \in M_n ,使得 B=UAUB = U^* A U ,就称 BB 酉等价于 AA ,如果 UU 可以取实矩阵(因而是实正交矩阵),那么就称 BB (实)正交等价于 AA

练习 证明西等价是一个等价关系.

2.2.2 定理 如果 A=[aij]A = [a_{ij}]B=bijMnB = \lfloor b_{ij}\rfloor \in M_n 两等价,那么

i,j=1nbj2=i,j=1naj2.\sum_ {i, j = 1} ^ {n} \left| b _ {j} \right| ^ {2} = \sum_ {i, j = 1} ^ {n} a _ {j} \left| ^ {2} \right..

证明:作矩阵乘法后便可看出 i,jaij2=trAA\sum_{i,j}|a_{ij}|^2 = \operatorname{tr}A^*A 。因此只要验证 trBB=trAA\operatorname{tr}B^*B = \operatorname{tr}A^*A 就够了。如果 B=UAUB = U^{*}AU ,则因为迹是相似不变量,就有 trBB=trUAUUAU=trUAAU=trAA.\operatorname{tr}B^*B = \operatorname{tr}U^*A^*UU^*AU = \operatorname{tr}U^*A^*AU = \operatorname{tr}A^*A.

练习 定理(2.2.2)说明 trAA\operatorname{tr} A^{*} A 是酉相似不变量。不用 AAA^{*} A 还可以作出另一个证明,不过要利用上一节的结果:用一个酉矩阵乘一个向量不会改变其 Euclid 长度,要注意的是,从左做起的矩阵乘法是乘被乘矩阵的各列,而从右做起的矩阵乘法是乘被乘矩阵的各行。

练习 证明

[3120][1102]\left[ \begin{array}{c c} {3} & {1} \\ {- 2} & {0} \end{array} \right] \quad \text {和} \quad \left[ \begin{array}{c c} {1} & {1} \\ {0} & {2} \end{array} \right]

相似,但不西等价.

因为西等价蕴涵相似,但是反之不成立,所以,与相似等价关系相比,西等价关系把 MnM_{n} 划分成更细的等价类。跟相似一样,西等价对应一个基变换,不过它是一种特殊形式的基变换——它把一个标准正交基变成另一个标准正交基。基的标准正交变换不改变向量的各分量的绝对值的平方和,而这个量在基的一个非标准正交变换下是可以改变的。因为求共轭转置要比

计算逆容易得多,所以在计算上,西等价关系要比相似关系更简单。在出现舍入误差的情况下,它也能较好地保证精确性。因此,在数值计算中,它是可取的。关于这方面的细致理由就不在这里阐述了,但是,可以作一个直观的解释,那就是用一个酉矩阵做乘法有保持长度的性质。

下述两种特殊的(又很简单的)酉矩阵形式给出两种西等价变换,它们在特征值的计算中非常重要.

2.2.3 例:平面旋转 设

U(θ;i,j)=[101cosθ00sinθ0100001sinθ00cosθ101]iU (\theta ; i, j) = \left[ \begin{array}{c c c c c c c c c} 1 & & & & & & & \\ & \ddots & & & 0 & & & \\ & & 1 & & & & & \\ & & \dots & \cos \theta & 0 & \dots & 0 & - \sin \theta & \dots \\ & & & 0 & 1 & & & \\ & & 0 & \vdots & & \ddots & & & 0 \\ & & & 0 & 0 & & 1 & & \\ & \dots & \dots & \sin \theta & 0 & \dots & 0 & \cos \theta & \dots \\ & & & & & & & 1 & \\ & & & & & & & \ddots \\ & \vdots & & & 0 & & & 1 \end{array} \right] \quad i \text {行}

它相当于一个单位矩阵,只是它的 iiii 元和 jjjj 元代之以 cosθ\cos \theta ,而 iijj 元(相应地 jjii 元)用 sinθ\sin \theta (相应地 sinθ\sin \theta )来代替.

练习 对于任一对指标 1i<jn1 \leqslant i < j \leqslant n 和任一角参数 0θ<2n0 \leqslant \theta < 2n ,验证 U(θ;i,j)U(\theta; i, j)Mn(R)M_{n}(\mathbf{R}) 中的正交矩阵。矩阵 U(θ;i,j)U(\theta; i, j) 只是在 i,ji, j 坐标平面中作一个( θ\theta 角的)旋转。值得指出的是,左乘以 U(θ;i,j)U(\theta; i, j) 仅对被乘矩阵的 ii 行和 jj 行有影响,而右乘以 U(θ;i,j)U(\theta; i, j) 仅对 ii 列和 jj 列有影响,因此,经 U(θ;i,j)U(\theta; i, j) 的两等价只使 i,ji, j 行和 i,ji, j 列有变化。经平面旋转的酉等价是计算特征值的 Jacobi 法和 Givens 法的基本特征。

2.2.4 例 Householder 变换。设 wCnw \in \mathbb{C}^n 是非零向量,定义 UnMnU_n \in M_nUn=ItwuU_n = I - t w u^* ,其中 t=2(ww)t = 2(w^* w) 。注意, wwMmw w^* \in M_m ,而 www^* w 是一个正纯量。如果 ww 已正规化 (ww=1)(w^* w = 1) ,那么, tt 就是 2,而 UnU_n 就是 I2wwI - 2 w w^* ,我们常常是在假定 ww 已经正规化的前提下给出矩阵 UnU_n

练习 证明, UwU_{w} 在补子空间 ww 上相当于一个单位变换,而在由 ww 生成的一维子空间上相当于一个反射;即,如果 xwx \perp w ,则 Uwx=xU_{w}x = x ,而 UwW=WU_{w}W = -W .

练习 证明, UwU_{w} 既是两矩阵,也是 Hermite 矩阵 (Uw=Uu)(U_{w} = U_{u}) 。形如 UuU_{u} 的矩阵称为 Householder 变换。经 UwU_{w} 的酉等价有时也叫做 Householder 变换。这些变换在本书中要多次出现,其中包括计算特征值的 Householder 法(见习题 4)以及其他酉简化方法。值得指出的是,Householder 变换一般变更它们所作用的矩阵或向量的所有元素,但是,它们为许多应用提供

非常有效而精确的简化.

定理(2.2.2)给出了两个已知矩阵酉等价的一个必要而不充分的条件。我们能在此基础上再添加更多的恒等式,这些恒等式共同给出两个已知矩阵酉等价的必要充分条件。其中,下述简单概念起着关键的作用。设 s,ts, t 是两个给定的非交换变元,称 s,ts, t 的非负整数幂的任一有限形式乘积

W(s,t)=sm1tn1sm2tn2smktnk,m1,n1,,mk,nk0(2.2.5)W (s, t) = s ^ {m _ {1}} t ^ {n _ {1}} \cdot s ^ {m _ {2}} t ^ {n _ {2}} \dots s ^ {m _ {k}} t ^ {n _ {k}}, \quad m _ {1}, n _ {1}, \dots , m _ {k}, n _ {k} \geqslant 0 \tag {2.2.5}

为关于 sstt 的字。字 W(s,t)W(s, t) 的次数是非负整数 m1+n1+m2+n2++mk+nkm_{1} + n_{1} + m_{2} + n_{2} + \cdots + m_{k} + n_{k} ,即字中的所有指数之和。如果已知 AMnA \in M_{n} ,我们可以形式地定义 AAAA^{*} 的字为

W(A,A)=Am1(A)n1Am2(A)n2Ams(A)ns.W (A, A ^ {*}) = A ^ {m _ {1}} \left(A ^ {*}\right) ^ {n _ {1}} A ^ {m _ {2}} \left(A ^ {*}\right) ^ {n _ {2}} \dots A ^ {m _ {s}} \left(A ^ {*}\right) ^ {n _ {s}}.

由于 AAAA^{\prime} 的幂未必交换,试图重排乘积中的项来简化 W(A,A)W(A, A^{\prime}) 不一定可行。

如果 AA 两等价于某个 BMnB \in M_{n} ,那么,对某个两矩阵 UMnU \in M_{n}AUBUA - UBU' ,且不难算出

W(A,A)=(UBU)m1(UBU)n(UBU)m1(UBU)n=UBm[IU(B)n1U[IBm]U[I(B)n1UUBm1(B)n1Bmk(B)nkU=UW(B,B)U.\begin{array}{l} W (A, A ^ {*}) = (U B U ^ {*}) ^ {m _ {1}} (U B ^ {*} U ^ {*}) ^ {n} \dots (U B U ^ {*}) ^ {m _ {1}} (U B ^ {*} U ^ {*}) ^ {n} \\ = U B ^ {m} \left[ I ^ {*} U (B ^ {*}) ^ {n _ {1}} U ^ {*} \dots [ I B ^ {m} ] U ^ {*} [ I (B ^ {*}) ^ {n _ {1}} U ^ {*} \right. \\ - U B ^ {m _ {1}} \left(B ^ {*}\right) ^ {n _ {1}} \dots B ^ {m _ {k}} \left(B ^ {*}\right) ^ {n _ {k}} U ^ {*} \\ = U W (B, B ^ {*}) U ^ {\prime}. \\ \end{array}

因而, trW(A,A)trUW(B,B)U=trW(B,B)\operatorname{tr} W(A, A^*) \rightarrow \operatorname{tr} UW(B, B^*)U^* = \operatorname{tr} W(B, B^*) 如果取字 W(s,t)=tsW(s, t) = ts ,就得到定理(2.2.2)中的恒等式。

对所有可能的字 W(s,t)W(s, t) ,上述结果给出了两个矩阵是酉等价的无限多个必要条件。下面,我们不加证明地叙述 WSpecchW \cdot \operatorname{Spec} \mathbf{ch} 的一个定理,这个定理确认这无限多个必要条件同时也是充分条件。

2.2.6 定理 两个已知矩阵 A,BMnA, B \in M_{n} 西等价,当且仅当

trW(A,A)=trW(B,B)(2.2.7)\operatorname {t r} W (A, A ^ {\prime}) = \operatorname {t r} W (B, B ^ {\prime}) \tag {2.2.7}

对于两个非交换元的每个字 W(s,t)W(s, t) 都成立.

Specht定理只能用来证明两个已知矩阵不酉等价。然而,除非在一些特殊情形(见习题6),它在证明两个已知矩阵是酉等价时可能失效,因为必须验证无限多个条件。幸运的是,有一个定理对Specht定理作了改进,它属于C. Pearcy。这个定理说明,只要对有限多个字验证迹恒等式(2.2.7)就够了。

2.2.8 定理 两个已知矩阵 A,BMnA, B \in M_{n} 两等价,当且仅当 trW(A,A)=trW(B,B)\operatorname{tr} W(A, A^{*}) = \operatorname{tr} W(B, B^{*}) 对次数至多是 2n22n^{2} 的每个字 W(s,t)W(s, t) 都成立。

Pearcy定理中的有限限制是对Specht定理的一大改进,但是,如我们所知,这还是非常保守的。当 n=2n = 2 时,只要对二个字 W(s,t)=sW(s,t) = ss2s^2tsts 验证迹恒等式就够了。无需考虑次数至多是 2(2)2=82(2)^2 = 8 的所有字。当 n=3n = 3 时,只要对9个字 W(s,t)=sW(s,t) = ss2s^2tstss4s^4ts2ts^2t2s2t^2 s^2tststststs2tsts^2 tsts2t2sts^2 t^2 s 验证迹恒等式而用不着考察次数至多是 2(3)2=182(3)^2 = 18 的所有字。

习题

  1. A=aijMn(R)A = \left|a_{ij}\right| \in M_n(\mathbf{R}) 是对称矩阵 (Ai=A)(A^i = A) ,但非对角矩阵,并假定选下标 iji \neq j 使得 aij\left|a_{ij}\right| 越大越好。用 (aiiajj)2aijcot(2θ)(a_{ii} - a_{jj})^2 a_{ij} - \cot(2\theta) 定义 θ\theta ,且设 U(θ;i,j)U(\theta; i, j) 是如(2.2.3)中所得到的平面旋转。用(2.2.2)证明,如果 BU(θ;i,j)AU(θ;i,j)=(bij)B - U(\theta; i, j)^* AU(\theta; i, j) = (b_{ij}) ,那么 ijbij2<ijaij2\sum_{i \leq j} |b_{ij}|^2 < \sum_{i \leq j} |a_{ij}|^2 。说明累次应用这样的平面旋转(用上述相同的方式对 BB 和它后面的矩阵作相应的选择)会缩小各非对角元的平方和而保持所有元的平方和不变;每做一步,所得到的矩阵就比前一步更接近于对角矩阵。这就是计算一个实对称矩阵的特征值的 Jacobi 法。这个方法产生一个实对角矩阵的矩阵序列。为什么极限矩阵的诸对角元必定是 AA 的诸特征值?

  2. 关于实对称矩阵(或一般的实矩阵)特征值的Givens法也是利用平面旋转,但采用的方式有所不同。证明,一个对称矩阵 A=[aij]Mn(R)A = [a_{ij}] \in M_n(\mathbb{R}) 经若干平面旋转后正交等价于一个三对角(对称)矩阵,而一般的 AMn(R)A \in M_n(\mathbb{R}) 经若干平面旋转正交等价于一个(下)Hessenberg矩阵。关于三对角矩阵和Hessenberg矩阵可见(0.9.9)和(0.9.10)。提示:选一个平面旋转 U1,3U_{1,3} 使得 U1,3AU1,3U_{1,3}AU_{1,3} 的1,3元为0。选另一个平面旋转使1,4元为0,继续做下去直到1, nn 元。然后转到2,4元,接着做下去。注意,这样一步步做下去不会影响前面已经选定的0元;并且正交等价保持对称性不变。一个三对角矩阵的特征多项式是容易确定的,而其特征值可用求根的方法来确定。注意到经过有限多次平面旋转后Givens法得到一个三对角矩阵,但它不会显现特征值或特征向量,不过利用另外的计算一定能得到它们。Jacobi法一般不会经有限多次平面旋转后中止,但它的目标是产生一个对角矩阵,而且得到一个标准正交特征向量组。

  3. 证明,每个矩阵 AMnA \in M_n 酉等价于一个有相同主对角元的矩阵。提示:(a)若 AM2A \in M_2 ,考察 A(1/2)(trA)IA - (1/2)(\operatorname{tr} A)I ,证明只需考虑 trA=0\operatorname{tr} A = 0 的情形就行了。若 xC2x \in \mathbb{C}^2 是一个使 xAx=0x^* A x = 0 的单位向量,设 U[x,y]M2U - [x, y] \in M_2 是一个酉矩阵,说明 UAUU^* A U 的 1,1 元为零,并且利用迹条件证明其 2,2 元也为零。为了求这个向量 xx ,设 w,zw, z 是属于 AA 的两个特征值 ±λ\pm \lambda 的特征向量。如果 λ=0\lambda = 0 ,取 x=wx = w 。如果 λ0\lambda \neq 0 ,设 x(θ)=eiθw+zx(\theta) = e^{i\theta} w + z ;证明,对所有 θR\theta \in \mathbb{R}x(θ)0x(\theta) \neq 0 ,面对某个 θR\theta \in \mathbb{R}x(θ)Ax(θ)=0x(\theta)^* A x(\theta) = 0 ;对这个 θ\theta ,设 xx(θ)/[x(θ)x(θ)]12x - x(\theta) / [x(\theta)' x(\theta)]^{\frac{1}{2}} 。如果 AM2(R)A \in M_2(\mathbb{R}) ,容易构造一个(实)平面旋转 U=U(θ;1,2)U = U(\theta; 1, 2) 使 UTAUU^T A U 的对角元相等,但这在复的情形是行不通的。定义 f(A)=max{anajn:i,j=1,2,,n}f(A) = \max \{|a_n - a_{jn}| : i, j = 1, 2, \dots, n\} ,并且设 A2=[anananan]A_2 = \begin{bmatrix} a_n & a_n \\ a_n & a_n \end{bmatrix} ,其中指标偶 i,ji, j 适合 f(A)=anajnf(A) = |a_n - a_{jn}| 。设 U2M2U_2 \in M_2 是使 U2A2U2U_2^* A_2 U_2 有相同主对角元的酉矩阵。如同(2.2.3)中从 2×22 \times 2 平面旋转构造 U(θ;i,j)U(\theta; i, j) ,用同样的方式从 U2U_2 构造 U(i,j)MnU(i, j) \in M_n ,并且证明,如果极大对角元之差不是多个可取差,则 f(U(i,j)AU(i,j))<f(A)f(U(i, j)^* A U(i, j)) < f(A) ;否则可以重复上述构造。可以断定,如果 f(A)0f(A) \neq 0 ,则有两矩阵 UMnU \in M_n 使 f(UAU)<f(A)f(U^* A U) < f(A) 。设 R(A)={UAU;UMnR(A) = \{U^* A U; U \in M_n 是酉矩阵},证明 R(A)R(A) 是紧集并注意 ffR(A)R(A) 上的连续函数。设 CR(A)C \in R(A) 适合 f(C)=min{f(B);BR(A)}f(C) = \min \{f(B); B \in R(A)\} ,证明 f(C)f(C) 不成立,因而从 f(C)=0f(C) = 0 得出结论成立。

  4. 证明,用Householder变换可以把一个具有Euclid长度 r=(xx)1/2r = (x^{\prime}x)^{1/2} 的任一向量 xRx \in \mathbb{R} 变成长度为 rr 的任一其他向量 yRny \in \mathbb{R}^{n}yxy \neq x 。提示:试用 UwU_{w} 证明,其中 w=xyw = x - y 。如果 x,yCnx, y \in \mathbb{C}^{n} 你能得出什么结论?

76

  1. 计算 AMn(R)A \in M_{n}(\mathbf{R}) 的特征值的 Householder 法如同 Givens 法,先把 AA 化简成(上)Hessenberg 矩阵(或在对称的情形化为三对角矩阵)。构造性地证明,其第 jj 列中的第 (j+1)(j + 1) 个元素以后均为 0(j=1,,k)0 (j = 1, \cdots, k) 的形如

的矩阵,经一个用Householder变换所确定的实正交相似可以变成一个同形的矩阵。由此得出,任一个矩阵 AMn(R)A \in M_{n}(\mathbf{R}) 都可以经一系列 (n2(n - 2 个)Householder相似化简成上Hessenberg矩阵,而一个对称矩阵 AMn(R)A \in M_{n}(\mathbf{R}) 可用同样的方式化简成三对角矩阵。提示:对于第 (k+1)(k + 1) 列,选一Householder变换 UMnU \in M_{n} 把出现在对角线下方的诸元素组成的 (nk)(n - k) 维向量变成 [1,0,,0]TRn[1,0,\dots ,0]^T \in \mathbb{R}^n 的一个适当倍数。于是经由正交矩阵

[I00U]Mn\left[ \begin{array}{c c} I & 0 \\ 0 & U \end{array} \right] \in M _ {n}

确定的相似可变换整个矩阵,并且看到所想要的0子块出现了。

  1. AMnA \in M_{n}B,CMnB, C \in M_{n} 是给定的。用 Specht 定理(2.26)或 Pearcy 定理(2.2.8)证明 BBCC 酉等价,当且仅当下列诸条件下的任一个成立:

(a) [A00B]\left[ \begin{array}{ll}A & 0\\ 0 & B \end{array} \right][A00C]\left[ \begin{array}{ll}A & 0\\ 0 & C \end{array} \right] 酉等价.

(b) [B0B0B]\left[ \begin{array}{cccc}B & & & 0\\ & B & & \\ & & \ddots & \\ 0 & & & B \end{array} \right][C0C0C]\left[ \begin{array}{cccc}C & & & 0\\ & C & & \\ & & \ddots & \\ 0 & & & C \end{array} \right] 酉等价,其中两个直和有相同的项数.

(A) [A0B0B]\left[ \begin{array}{cccc}A & & & 0\\ & B & & \\ & & \ddots & \\ 0 & & & B \end{array} \right][A0C0C]\left[ \begin{array}{cccc}A & & & 0\\ & C & & \\ & & \ddots & \\ 0 & & & C \end{array} \right] 酉等价,其中两个直和有相同的项数.

  1. 证明:诸某个次数 kk2k12^{k-1} 个不同的形如(2.2.5)的字 W(s,t)\mathbf{W}(s, t) ,因而得出至多有 4n24n^{2} 个次数至多为 2n22n^{2} 的不同的字。

  2. 试给出两个 2×22 \times 2 矩阵,这两个矩阵满足恒等式(2.2.2),但它们不酉等价。解释其原因。

进一步阅读与注释 关于定理(2.2.6)的原始证明可参看W. Specht, “Zur Theorie der Matrizen II,” Jahresbericht der Deutschen Mathematiker Vereinigung 50(1940), 19-23. 定理 (2.2.8) 的证明可见 C. Pearcy, “A Complete Set of Unitary Invariants for Operators Generating Finite WW^{*} -Algebras of Type I,” Pacific J. Math. 12(1962), 1405-1416. 关于低阶矩阵两等价的讨论可见 C. Pearcy, “A Complete Set of Unitary Invariants for 3×33 \times 3 Complex Matrices,” Trans. Amer. Math. Soc. 104(1962), 425-429.