2.1_酉矩阵

2.1 酉矩阵

2.1.1 定义 我们知道,向量 x1,,xkCnx_{1}, \cdots, x_{k} \in \mathbb{C}^{n} 构成一个正交组,是指对所有的向量偶有, xixj=0,1i<j<kx_{i}^{*} x_{j} = 0, 1 \leqslant i < j < k 。此外,如果诸向量还是正规化的, xixj=1,i=1,,kx_{i}^{*} x_{j} = 1, i = 1, \cdots, k ,那么该向量组称为标准正交组。

练习 如果 {y1,,yk}\{y_{1}, \cdots, y_{k}\} 是由非零向量组成的正交组,证明由 xi=(yiyi)1/2yi,i=1,,kx_{i} = (y_{i}^{*}y_{i})^{1/2}y_{i}, i = 1, \cdots, k 定义的向量组 {x1,,xk}\{x_{1}, \cdots, x_{k}\} 是一个标准正交组。

2.1.2 定理 标准正交向量组线性无关

证明:假定: {x1,,xk}\{x_{1},\dots ,x_{k}\} 是标准正交组,且 0α1x1++αkxk0 - \alpha_{1}x_{1} + \dots +\alpha_{k}x_{k} ,于是,因为诸向量 xix_{i} 是正交的,所以 000=i,jαiαjxixji=1kai2xixi0 - 0^{*}0 = \sum_{i,j}^{-}\alpha_{i}\alpha_{j}x_{i}^{*}x_{j} - \sum_{i = 1}^{k}|a_{i}|^{2}x_{i}^{*}x_{i} ;又诸向量 xix_{i} 是正规化的,所有 i=1kai2xi2xii=1kai20.\sum_{i = 1}^{k}\mid a_i\mid^2 x_i^2 x_i - \sum_{i = 1}^{k}\mid a_i\mid^2 -0. 因此,所有 αi=0\alpha_{i} = 0 ,故 {x1,,xk}\{x_1,\dots ,x_k\} 是线性无关组.

练习 证明非零向量组成的正交组线性无关.

练习 证明,如果 x1,,xkCnx_{1}, \cdots, x_{k} \in \mathbb{C}^{n} 是正交组,那么,或者 knk \leqslant n ,或者诸向量 xix_{i} 中至少有 knk - n 个等于零.

当然,一个无关组未必是正交组,不过,可以把Gram-Schmidt标准正交化过程(0.64)应用于该无关组,从而得到一个标准正交组,它也生成原向量组。

练习 证明任意 kk 维实的或复的向量空间有一个标准正交基(一个由标准正交组组成的

基).

2.1.3 定义 设矩阵 UMnU \in M_{n} ,若 UU=IU^{*}U = I ,就称 UU 为酉矩阵。若还有 UMn(R)U \in M_{n}(\mathbb{R}) ,就称 UU 是实正交矩阵。

MnM_{n} 中的酉矩阵构成一个值得注意的重要集合。在(2.1.4)中列出了关于 UU 是酉矩阵的几个基本等价条件。

练习 若 AMnA \in M_{n} 是非奇异矩阵,且 BMnB \in M_{n} 使 BA=IBA = I ,证明,(a) BB 是唯一的,(b) AB=IAB = I 。自然,记 B=A1B = A^{-1} ,提示:非奇异性推出,对任意给定的 yCny \in \mathbb{C}^{n} ,方程 Ax=yAx = yxTAyTx^{T}A - y^{T} 有唯一解。(逐列)证明 ABR=IAB_{R} = I 和(逐行)证明 BLA=IB_{L}A = I 有唯一解 BLB_{L}BRMnB_{R} \in M_{n} ,于是,用两种方式计算 BLABRB_{L}AB_{R} 便可证明 BL=BRB_{L} = B_{R}

2.1.4 定理 如果 UMnU \in M_{n} ,那么下列条件等价:

(a) UU 是酉矩阵;
(b) UU 是非奇异矩阵,且 U1=U1U^{-1} = U^{-1}
(c) UU=IUU^{*} = I
(d) UU^{*} 是酉矩阵;
(e) UU 的各列组成一个标准正交组;
(f) UU 的各行组成一个标准正交组;
(g)如果 xCnx\in \mathbf{C}^ny=Uxy = Ux ,那么, yy 的Euclid长度与 xx 的相同:即 yy=xx.y^{*}y = x^{*}x.

证明:条件(a)蕴涵条件(b),这是因为, UU^{\star} 是唯一的(只要它存在),且 UU 左乘以它就得I;酉矩阵的定义保证 UU^{\star} 就是这样的矩阵。因为 BA=IBA = I ,当且仅当 AB=IAB = I (对于 A\pmb{A}BMnB\in M_{n} ),所以(b)蕴涵(c).因为 (U)=U(U^{*})^{*} = U ,(c)推出 UU^{\star} 适合酉矩阵所必需的条件;即(c)蕴涵(d).由于上述每个推理都可类似地反推回去,所以(a)~(d)是等价的.

根据矩阵乘法的技巧,且设 u(i)u^{(i)} 表示 UU 的第 ii 列, i=1,,ni = 1, \dots, n 。条件 UU=IU^{\star} U = I 的意思是说

u(i)u(j)={0,如 果ji,1,如 果j=i.u ^ {(i) *} u ^ {(j)} = \left\{ \begin{array}{l l} 0, \text {如 果} j \neq i, \\ 1, \text {如 果} j = i. \end{array} \right.

因此, UU=IU^{*}U = I 的另一种解释是, UU 的各列是标准正交组,因而(a)与(e)等价.同理(d)与(f)等价.

如果(a)成立,且 y=Uxy = Ux ,则 yy=xUUx=xIx=xxy^{\star}y^{\star} = x^{*}U^{*}Ux = x^{*}Ix = x^{*}x ,因而(a)蕴涵(g),另一方面,为了验证逆命题成立,需要作稍微复杂的计算。不过,本书后面要给出的方法将使这种计算更为直接。首先考虑 n=2n = 2 的情形,假定(g)成立,并且设 x=[10]x = \left[ \begin{array}{l}1\\ 0 \end{array} \right] ,我们得知, 1=xx=yy=xUUx=UU1 = x^{\prime}x = y^{*}y = x^{\prime}U^{*}Ux = U^{*}U 的1,1元。类似地,设 x=[01]x = \left[ \begin{array}{l}0\\ 1 \end{array} \right] ,得出 UUU^{*}U 的2,2元也是1。因而 UUU^{*}U 必须有形状

[1aa1],\left[ \begin{array}{c c} 1 & a \\ \vdots & \vdots \\ a & 1 \end{array} \right],

其中, aaUU 的第1列与第2列的内积,而 a˙\dot{a} 是第2列与第1列的内积,在 (g)(g) 中设 x=[11]x = \begin{bmatrix} 1 \\ 1 \end{bmatrix} ,然后再作计算,因而得知, 2=xx=yy=xUUx2+(a+aˉ)2 = x^{*}x = y^{*}y = x^{*}U^{*}Ux - 2 + (a + \bar{a}) 。设 x=[1i]x = \begin{bmatrix} 1 \\ i \end{bmatrix} ,得知 2=2+i(aaˉ)2 = 2 + i(a - \bar{a}) 。因此, a+aˉ=2Rea=0a + \bar{a} = 2\operatorname{Re}a = 0 ,且 aaˉ=2iIma=0a - \bar{a} = 2i\operatorname{Im}a = 0 ,从而 a=0a = 0 。这就是说,如果对所有 xC2x \in \mathbf{C}^2xUUx=xxx^{*}U^{*}Ux = x^{*}x ,那么 UU=1U^{*}U = 1 ;即 UU 是酉矩阵(如果 UM2U \in M_2 )。现在考虑 n>2n > 2 的情形,且设 A=UUA = U^{*}U 。假定 xCnx \in \mathbb{C}^n 是这样一个向量。除了第 ii 个和第 jj 个分量以外, iji \leqslant j ,它的所有分量都是0。于是

xAx=[xˉi,xˉj]A({i,j})[xixj].x ^ {*} A x = \left[ \bar {x} _ {i}, \bar {x} _ {j} \right] A (\{i, j \}) \left[ \begin{array}{l} x _ {i} \\ x _ {j} \end{array} \right].

[见(0.7.1)关于子矩阵的记号],因此,刚才证明了 (g)(g) 蕴涵 A{(i,j)}=IM2A\{(i,j)\} = I\in M_2 ,因为 iijj 的任意性,得知 AA 的每个 2×22\times 2 主子矩阵都是 2×22\times 2 单位矩阵.正是这个 AAA=IMnA = I\in M_{n} ,又因为 n=1n = 1 的情形是显然的,因此得出(g)蕴涵(a),证毕. □

2.1.5 定义 一个线性变换 T:CnCmT: \mathbf{C}^n \to \mathbf{C}^m 称为 Euclid 等距变换,是指对所有 xCnx \in \mathbf{C}^n ,有 xx=(Tx)(Tx)x \cdot x = (Tx) \cdot (Tx) 。定理(2.1.4)是说,一个复方阵 UMnU \in M_n 是一个(经由 U:xUxU: x \to Ux 的)Euclid 等距变换当且仅当 UU 是酉矩阵。关于其他形式的等距变换见 5.2 节。

练习设

T(θ)=[cosθsinθsinθcosθ],T (\theta) = \left[ \begin{array}{c c} \cos \theta & \sin \theta \\ - \sin \theta & \cos \theta \end{array} \right],

其中 θ\theta 是一个实参数. (a) 如果 UM2(R)U \in M_2(\mathbf{R}) , 证明, UU 是实正交矩阵, 当且仅当 U=T(θ)U = T(\theta)

U=[1001]T(θ)U = \left[ \begin{array}{c c} 1 & 0 \\ 0 & - 1 \end{array} \right] T (\theta)

对某个 θR\theta \in \mathbb{R} 成立,(b)如果 UM2(R)U\in M_2(\mathbf{R}) ,证明, UU 是实正交矩阵,当且仅当 U=T(θ)U = T(\theta)

U=[0110]T(θ)U = \left[ \begin{array}{l l} 0 & 1 \\ 1 & 0 \end{array} \right] T (\theta)

对某个 θR\theta \in \mathbb{R} 成立,我们用一个参数 θ\theta 给出了 2×22 \times 2 实正交矩阵的两种不同的表示形式,试从几何上解释它们.

2.1.6 论断 如果 U,VMnU, V \in M_{n} 是酉(相应地,实正交)矩阵,那么,乘积 UVUV 也是酉(相应地,实正交)矩阵。

练习 利用(2.1.4)的(b)证明(2.1.6).

练习 如果 {x1,x2,,xk}Cn\{x_{1}, x_{2}, \cdots, x_{k}\} \subseteq \mathbb{C}^{n} 是标准正交组,且 UMnU \in M_{n} 是酉矩阵,证明 {Ux1,,Uxk}\{Ux_{1}, \cdots, Ux_{k}\} 是标准正交组。

2.1.7 论断 MnM_{n} 中的酉(相应地,实正交)矩阵的集合构成一个群。一般称这个群为 n×nn \times n 酉(相应地,正交)群。它是 GL(n,C)GL(n, \mathbf{C}) 的一个子群[见(0.5)节]。

练习 我们知道,一个群是这样一个集合,它在一个结合的二元运算(“乘法”)下是封闭的,且使得关于这个运算的单位元和逆仍在该集合中验。证(2.1.7)。提示:用(2.1.6)验证封

闭性:矩阵乘法是结合的; IMnI \in M_{n} 是酉矩阵;且 U1U1U^{-1} - U^{-1} 也是酉矩阵.

MijM_{ij} 中的酉矩阵的集合(群)有另外一些很重要的性质。一个矩阵序列的“收敛性”概念和“极限”的概念将在第5章明确地给出,不过,这里可以从每个 iijj 元的“收敛性”和极限的观点来理解这些概念。定义恒等式 UU=IU \cdot U = I 意味着 UU 的每个列有 Euclid 长度 1,因而 U=[Uij]U = [U_{ij}] 没有一个元 UijU_{ij} 的绝对值比 1 大。如果把酉矩阵的集合看作 Cn\mathbf{C}^{n} 的一个子集,这说明它是一个有界子集。如果 Uk=[uij(k)]U_{k} = [u_{ij}^{(k)}] 是一个酉矩阵序列, k=1,2,k = 1, 2, \cdots ,使得所有 iij=1,2,,nj = 1, 2, \cdots, nlimkuij(k)=uij(n)\lim_{k \to \infty} u_{ij}^{(k)} = u_{ij}^{(n)} 存在,那么由恒等式 UiUk=IU_{i}^{*} U_{k} = Ik=1,2,k = 1, 2, \cdots 。我们看到 limkUkUk=UnU0=I\lim_{k \to \infty} U_{k}^{*} U_{k} = U_{n}^{*} U_{0} = I ,其中 U0=[uij(0)]U_{0} = [u_{ij}^{(0)}] ,因此,极限矩阵 U0U_{0} 也是酉矩阵。这就是说,酉矩阵的集合是 Cn\mathbf{C}^{n} 的一个闭子集。

由于有限维Euclid空间的一个有界闭子集是紧集(见附录E),由此可知, MnM_{n} 中的酉矩阵集合(群)是紧的.眼下,这个结论的最重要的推论是下述关于酉矩阵的选择原理.

2.1.8 引理 设 U1,U2,U_{1}, U_{2}, \cdotsMnM_{n} 中的已知的酉矩阵序列,则存在一个子序列 Uk1,Uk2,U_{k_{1}}, U_{k_{2}}, \cdots 使得当 ii \rightarrow \infty 时, UiU_{i} 的每个元(作为复数列)收敛于一个酉矩阵 UiU_{i} 的对应元。

证明:这里只要求我们,总可以从一个紧集的任一无限序列中选出一个收敛子序列。我们已经知道,如果一个两矩阵序列收敛于某个矩阵,那么其极限矩阵一定是两矩阵。

由引理所确定的酉极限不一定是唯一的;它可能与子序列的选择有关。

练习 考虑酉矩阵序列

Uk=[0110],k=1,2,.U _ {k} = \left[ \begin{array}{l l} 0 & 1 \\ 1 & 0 \end{array} \right], \quad k = 1, 2, \dots .

证明它可以有两个子序列极限.

练习 选择原理(2.1.8)也适应于正交群;即,一个实正交矩阵序列有一个收敛于实正交矩阵的子序列。在实的情形,试通过复述同样的推理验证这个结论。

西群的紧性在本书的其他地方要用到它.

一个酉矩阵有 U1U^{-1} 等于 UU^{*} 的性质。一种推广酉矩阵的概念的方式是要求 U1U^{-1} 相似于 UU^{*} ,容易看出,对所有非奇异矩阵 AMnA \in M_{n} ,这些矩阵的集合可以刻划为映射 AA1AA \rightarrow A^{-1}A^{*} 的值域。

2.1.9 定理 设 AMnA \in M_{n} 是非奇异矩阵,那么, A1A^{-1} 相似于 AA^{*} ,当且仅当存在非奇异矩阵 BMnB \in M_{n} ,使得 AB1BA - B^{-1}B^{*}

证明:对于某个非奇异矩阵 BMnB \in M_n ,如果有 A=B1BA = B^{-1}B^* ,那么, A1(B)1BA^{-1} - (B^*)^1 B ,并且 BA1(B)1=B(B)1(B1B)=AB^* A^{-1}(B^*)^{-1} = B(B^*)^{-1} - (B^{-1}B^*)^* = A^* ,这样, A1A^{-1} 可经相似矩阵 BB^* 相似于 AA^* ,反过来,如果 AA^* 相似于 AA^* ,那么,存在非奇异矩阵 SMnS \in M_n ,使得 SA1S1=ASA^{-1}S^{-1} = A^* ,对 θR\theta \in R ,令 Sθ=eiθSS_\theta = e^{i\theta} S ,且注意到 SθA1Sθ1=eiθSA1(eiθS1)=SA1S1=AS_\theta A^{-1}S_\theta^{-1} = e^{i\theta} SA^{-1}(e^{-i\theta} S^{-1}) = SA^{-1}S^{-1} = A^* ,另一方面, Sθ=ASAS_\theta = A^* S_A ,且 Sθ=ASθAS_\theta = A^* S_\theta^* A 。相加这两个恒等式便得到 Hθ=AHθAH_\theta = A^* H_\theta A ,其中, Hθ=Sθ+SθH_\theta = S_\theta + S_\theta^* 是 Hermite 矩阵。如果 HθH_\theta 是奇异矩阵,那么,存在某个非零 xCnx \in \mathbf{C}^n ,使得 0=Hθx=Snx+Sθx0 = H_\theta x = S_n x + S_\theta^* x ,因而, x=Sθ1Sθx=e7θS1Sx-x = S_\theta^{-1} S_\theta x = e^{-7\theta} S^{-1} S_x ,且 S1Sx=e2iθxS^{-1} S_x = -e^{2i\theta} x 。选取值 θ=θ0[0,2π]\theta = \theta_0 \in [0, 2\pi] ,使 e2iθ0-e^{2i\theta_0} 不是 S1SS^{-1} S^* 的特征值;所得到的 Hermite 矩阵 H=Hθ0H = H_{\theta_0} 是非奇异矩阵,且有性质 H=AHAH = A^* HA

现在,选取任一复数 α\alpha ,使 σ=1|\sigma| = 1 ,且 α\alpha 不是 AA^{*} 的特征值。令 Bβ(αIA)HB \equiv \beta (\alpha I - A^{*})H ,其中

复参数 β0\beta \neq 0 是有待选定的,不难看出, BB 是非奇异矩阵。为了使 AB1BA \cdot B^{-1} B'BA=BBA = B^* ,经计算, BH(βˉαIβA)B^* - H(\bar{\beta} \alpha I - \beta A) ,而 BA=β(αIA)HA=β(αHAAHA)=β(αHAH)=H(αβAβI)BA = \beta (\alpha I - A^*) HA = \beta (\alpha HA - A^* HA) = \beta (\alpha HA - H) = H(\alpha \beta A - \beta I) 。如果能选定一个非零 β\beta 使 β=βˉα\beta = -\bar{\beta} \alpha ,就完成了证明,而当 α=eiθ\alpha = e^{i\theta} 时,只要取 β=eiπ\beta = e^{i\pi} 就行了。

习题

  1. 如果 UMnU \in M_{n} 是酉矩阵,证明 detU=1\left|\det U\right| = 1

  2. 如果 λσ(U)\lambda \in \sigma(U) ,而 UMnU \in M_{n} 是酉矩阵,证明 λ=1|\lambda| = 1 。提示:利用等矩性质(2.1.4g).

  3. 给定实参数 θ1,θ2,,θn\theta_{1}, \theta_{2}, \dots, \theta_{n} ,证明

Udiag(en,en,,en)U - \operatorname {d i a g} \left(e ^ {\prime \prime_ {n}}, e ^ {\prime \prime_ {n}}, \dots , e ^ {\prime \prime_ {n}}\right)

是酉矩阵.

  1. 说明实对角正交矩阵的特征.

  2. 证明 MnM_{n} 中的置换矩阵(0.9.5)是正交矩阵,并证明置换矩阵构成实正交矩阵群的一个子群(这个子集本身是一个群)。在 MnM_{n} 中有多少不同的置换矩阵?

  3. 你能给出 3×33 \times 3 正交群的一种参数表示形式吗?想一想本节中给出的 2×22 \times 2 正交群的两种表示形式。

  4. 对定理(2.1.1)中条件(g)蕴涵条件(a)的下述另一个证明作详细的论述。证明(g)表示对所有 xCnx \in \mathbb{C}^nx(UUI)x=0x^* (U^* U - I)x = 0 。设 HUUIH \equiv U^* U - I 并且注意到 HHH - H' ,考虑 0=(x+eiθy)H(x+eiθy)0 = (x + e^{i\theta}y)^{*}H(x + e^{i\theta}y) ,对所有 x,yCnx, y \in \mathbb{C}^n 和所有 θR\theta \in \mathbb{R} ,展开这个等式并证明对所有 x,yCnx, y \in \mathbb{C}^nxHy0x^* Hy - 0 ,系统地选取 xxyy 可得出 H=0H = 0

  5. 适合 AATIAA^T I 的矩阵 AMnA \in M_n 称为正交矩阵。一个实正交矩阵是酉矩阵,但一个非实正交矩阵不一定是酉矩阵。(a)设

K[0110]M2(R).K - \left[ \begin{array}{c c} 0 & 1 \\ - 1 & 0 \end{array} \right] \in M _ {2} (\mathbf {R}).

证明,对所有 tRt \in \mathbb{R}A(t)(cosht)I+(isinht)KMtA(t) - (\cosh t)I + (i\sinh t)K \in M_t 是正交矩阵,但只有 t=0t = 0A(t)A(t) 才是酉矩阵。其中,双曲函数定义为 cosht(et+et)2\cosh t - (e^t + e^{-t}) \cdot 2sinht=(etet)2\sinh t = (e^t - e^{-t}) \cdot 2 。(b)证明,与酉矩阵不同的是,复正交矩阵的集合不是有界集,因而它不是紧集。(c)证明,跟酉矩阵一样,一个给定阶数的所有复正交矩阵的集合构成一个群。尽管如此,通常的做法是,正交群这一术语专指一个由给定阶数的所有实正交矩阵组成的较小的(紧)群。(d)若 AMnA \in M_n 是正交矩阵,证明, detA=1|\det A| = -1 ,但可能有特征值 λ\lambda 适合 λ1|\lambda| \neq 1 。提示:考虑(a)中的 A(t)A(t) ,证明 λ(t)|\lambda(t)| 可以任意大。(e)若 AMnA \in M_n 是正交矩阵,证明 AAAA^* 都是正交矩阵且 AA 是非奇异的。A 的诸行或诸列构成正交组吗?(f)说明对角正交矩阵的特征。与习题4比较,为避免混淆,有的作者称不一定是实矩阵的正交矩阵为复正交矩阵,但是在文献中一般不明确这种区别;术语正交矩阵有时是指我们所称的实正交矩阵。

  1. 如果 UMnU \in M_{n} 是酉矩阵,证明 U,UT\overline{U}, U^{\mathrm{T}}UU^{\star} 都是酉矩阵。

  2. 如果 UMnU \in M_{n} 是酉矩阵,证明, x,yCnx, y \in \mathbf{C}^{n} 正交,当且仅当 UxUxUyUy 正交。

  3. 称非奇异矩阵 AMnA \in M_{n} 是斜正交矩阵,是指 Λ1=AT\Lambda^{-1} = -A^T 。证明, AA 是斜正交矩阵,当

且仅当 ±iA\pm iA 是正交矩阵,更一般地,如果 θR\theta \in \mathbb{R} ,证明, AI=eiθATA^{\mathrm{I}} = e^{i\theta}A^{\mathrm{T}} ,当且仅当 eiθAe^{i\theta A} 是正交矩阵。当 θ=π\theta = \pi 时,它是什么?如果 θ=0\theta = 0 呢?

  1. 证明,如果 AMτA \in M_{\tau} 相似于一个酉矩阵,那么 A1A^{-1} 相似于 AA^{*}

  2. 考虑矩阵 A=diag(2,12)M5A = \operatorname{diag}\left(2, \frac{1}{2}\right) \in M_5 。证明相似于酉矩阵的所有矩阵的集合是其逆 AA^{\prime} 相似于 AA^{\prime} 的所有矩阵 AA 的集合的一个真子集。

  3. 证明 MnM_{n} 中的酉矩阵群与 MnM_{n} 中的复正交矩阵群之交是 MnM_{n} 的实正交群。提示:考虑 U=A+iBU = A + iB ,其中 U,A,BMnU, A, B \in M_{n} ,且 A,BA, B 是实矩阵。如果 UU 既是酉矩阵,又是复正交矩阵,证明 BTB=0B^{T}B = 0 ,从而,对每个标准基向量 eiRne_{i} \in \mathbb{R}^{n}(Bei)t(Bei)=0(Be_{i})^{t}(Be_{i}) = 0 ,因此 BB 的每个列都是 0。

进一步阅读 想了解关于适合定理(2.1.9)的条件的推广的酉矩阵的更多信息,可参看C.R.DePrima and C.R.Johnson, “The Range of A1AA^{-1}A^{*} in GL (n,C)(n,\mathbf{C}) ," Linear Algebra Appl. 9(1974), 209-222.