2.3_Schur酉三角化定理

2.3 Schur 酉三角化定理

初等矩阵理论最有用的基本事实或许是任一矩阵 AMnA \in M_{n} 西等价于一个上三角矩阵 TT [也西等价于一下三角矩阵]. TT 的诸对角元自然是 AA 的特征值. 尽管这种形式不唯一, 但是它是在西等价下所能得到的最简形式.

2.3.1 定理(Schur)已知 AMnA \in M_{n} 有特征值 λ1,,λn\lambda_{1}, \ldots, \lambda_{n} ,它们按任意规定的次序排列,那么存在一个酉矩阵 UMnU \in M_{n} ,使得

UAU=T=[ty]U ^ {*} A U = T = \left[ t _ {y} \right]

是具有对角元 tn=λit_{n} = \lambda_{i}i=1i = 1 ,…, nn 的上三角矩阵,即每个方阵 AA 两等价于其对角元依次是 AA 的特征值的三角矩阵.此外,如果 AMn(R)A\in M_n(\mathbf{R}) ,且 AA 的所有特征值都是实数,那么,可选择 UU 为实正交矩阵.

证明:证明本身就是实施一系列相同形式的化简算法并得到化简结果。设 x(1)x^{(1)}AA 的相应于征特值 λ1\lambda_{1} 的正规化特征向量,非零向量 x(1)x^{(1)} 可以扩充为 Cn\mathbf{C}^n 的一个基

x(1),y(2),y(3),,y(n).x ^ {(1)}, y ^ {(2)}, y ^ {(3)}, \dots , y ^ {(n)}.

应用Gram-Schmidt标准正交化过程(0.6.4)于这个基,便得到 Cn\mathbf{C}^n 的一个标准正交基

x(1),z(2),,z(m).x ^ {(1)}, z ^ {(2)}, \dots , z ^ {(m)}.

从左至右把这些标准正交向量排成两矩阵 U1U_{1} 的诸列,因为 AU1AU_{1} 的第1列是 λ1x(f)\lambda_{1}x^{(f)} ,计算表明: U1(AU1)U_{1}^{*}(AU_{1}) 有形式

UiAUi=[λ10A1]U _ {i} ^ {*} A U _ {i} = \left[ \begin{array}{l l} \lambda_ {1} & * \\ \dots & \dots \\ 0 & A _ {1} \end{array} \right]

矩阵 λ1Mn1\lambda_{1} \in M_{n-1} 有特征值 λ2,,λn\lambda_{2}, \ldots, \lambda_{n} . 设 x(n)Cn1x^{(n)} \in \mathbb{C}^{n-1}A1A_{1} 的相应于 λ2\lambda_{2} 的正规化特征向量,然后完全重复上述步骤,确定一个酉矩阵 U2Mn1U_{2} \in M_{n-1} ,使得

U2A1U2=[λ20A2],U _ {2} ^ {*} A _ {1} U _ {2} = \left[ \begin{array}{c c c} \lambda_ {2} & * \\ 0 & A _ {2} \end{array} \right],

并设

V2=[100U2].V _ {2} = \left[ \begin{array}{l l} 1 & 0 \\ 0 & U _ {2} \end{array} \right].

于是,矩阵 V2V_{2}U1V2U_{1}V_{2} 是酉矩阵,因而 V2U1AU1V2V_{2}^{*}U_{1}^{*}AU_{1}V_{2} 有形式

V2U1AU1V2==[λ10λ200A2].V _ {2} ^ {*} U _ {1} ^ {*} A U _ {1} V _ {2} = = \left[ \begin{array}{c c c} \lambda_ {1} & * & \\ 0 & \lambda_ {2} & * \\ 0 & \dots & \\ 0 & A _ {2} \end{array} \right].

79

继续作这种化简便到酉矩阵 UiMn1+1U_{i} \in M_{n-1+1}i=1,,n1i=1, \cdots, n-1 和酉矩阵 ViMnV_{i} \in M_{n}i=2,,n1i=2, \cdots, n-1 。矩阵

U=U1V2V3Vn1U = U _ {1} V _ {2} V _ {3} \dots V _ {n - 1}

是酉矩阵,而 UAUU^{\prime}AU 给出了所要求的形式

如果 AMn(R)A \in M_{n}(\mathbf{R}) 的所有特征值恰好是实数,那么,相应的特征向量可以选实向量,且上述所有步骤可以用实的算术运算来完成,这就是证明了后一个论断。

附注 仿照(2.3.1)的证明便可看出,在定理的叙述中,可用“下三角”代替“上三角”,

当然它对应于一个不同的酉等价 UU

[80] 2.3.2 例 不论是酉矩阵 UU ,还是定理(2.3.1)中的三角矩阵 TT ,都不是唯一的。不仅 TT 的对角元( AA 的特征值)可以依任何顺序出现,而且酉等价的上三角矩阵在其对角线上方可以呈现完全不同的形式。例如,

T1=[114022003]T2=[2132012003]T _ {1} = \left[ \begin{array}{l l l} 1 & 1 & 4 \\ 0 & 2 & 2 \\ 0 & 0 & 3 \end{array} \right] \text {和} T _ {2} = \left[ \begin{array}{l l l} 2 & - 1 & 3 \sqrt {2} \\ 0 & 1 & \sqrt {2} \\ 0 & 0 & 3 \end{array} \right]

是经

U=12[101002]U = \frac {1}{\sqrt {2}} \left[ \begin{array}{c c c} 1 & & 0 \\ 1 & & 0 \\ 0 & & \sqrt {2} \end{array} \right]

的酉等价。一般说来,许多不同的上一角矩阵可以在同一个酉等价类之中。

附注 应指出的是,证明(2.3.1)的技巧不过是如1.4节中习题8所概述的顺序压缩技巧。

练习 如果 A={aij}A = \{a_{ij}\}B={bij}M2B = \{b_{ij}\} \in M_2 相似,且 i,jaij2=i,jbij2\sum_{i,j}|a_{ij}|^2 = \sum_{i,j}|b_{ij}|^2 ,证明 AABB 酉等价.用例子说明这在高维情形不成立.提示:注意到,如果 AABB 酉等价,那么 AAA - A^{*}B+BB + B^{*} 也酉等价.考虑

A=[130024003]B=[100025003].A = \left[ \begin{array}{l l l} 1 & 3 & 0 \\ 0 & 2 & 4 \\ 0 & 0 & 3 \end{array} \right] \text {和} B = \left[ \begin{array}{l l l} 1 & 0 & 0 ^ {-} \\ 0 & 2 & 5 \\ 0 & 0 & 3 \end{array} \right].

(2.3.1)的有用推论是,矩阵交换族可以同时上三角化

2.3.3 定理 设 FMn\mathcal{F} \subseteq M_n 是交换族,那么存在一个酉矩阵 UMU \in M ,使得对每个 AFA \in \mathcal{F}UAUU^* A U 是上三角的。

证明:同到(2.3.1)的证明,在原证明的每一步运用(1.3.17),在每一步都可选定一个特征向量(和酉矩阵),且对每个 ΛF\Lambda \in \mathcal{F} 都可以选定这同一个特征向量(和酉矩阵)。又西等价保持交换性,且分块矩阵乘法计算表明,如果形如

[A11A120A22][B11B120B22]\left[ \begin{array}{c c} {A _ {1 1}} & {A _ {1 2}} \\ {0} & {A _ {2 2}} \end{array} \right] \text {和} \left[ \begin{array}{c c} {B _ {1 1}} & {B _ {1 2}} \\ {0} & {B _ {2 2}} \end{array} \right]

81

两个矩阵可交换,那么 A22A_{22}B22B_{22} 也可交换。因此,在证明(2.3.1)的化简过程中的每一步,每个 AiA_{i} 都继承了交换族性质。我们得出,对交换族的所有成员,可用相同的方式选择(2.3.1)的 UU 中的所有组成部分,这就证明了(2.3.3)。值得指出的是,这里并没有断言,对各个族的成员的特征值,可以选取任一特定的次序。它取定的只是应用(1.3.17)时所得到的那个次序。□

下面的定理包括了(2.3.1)的严格的实形式,

2.3.4 定理 如果 AMn(R)A \in M_{n}(\mathbf{R}) ,那么有实正交矩阵 QMn(R)Q \in M_{n}(\mathbf{R}) ,使得

QIAQ=[A1A20Ak]Mn(R),1kn,(2.3.5)Q ^ {I} A Q = \left[ \begin{array}{c c c c} A _ {1} & & & * \\ & A _ {2} & & \\ & & \ddots & \\ 0 & & & A _ {k} \end{array} \right] \in M _ {n} (\mathbf {R}), \quad 1 \leqslant k \leqslant n, \tag {2.3.5}

其中每个 AiA_{i} 或是 1×11 \times 1 实矩阵或是具有一对非实的复共轭特征值的 2×22 \times 2 实矩阵。对角子块 AiA_{i} 可以按任意的次序排列。

一般说来,不能指望通过一个实相似(更不用说实正交相似了)把一个实矩阵化成上三角形式,因为可能的话,对角元将是特征值,而特征值可以不是实数。形式(2.3.5)是通过实正交相似所能得到的与三角形式最接近的形式。如果 AA 有任何非实特征值,形式(2.3.5)就不会是上三角矩阵,但它总是呈上Hessenberg形状。

练习 试修改(2.3.1)的论证以证明(2.3.4),提示:如果 λ\lambda 是实矩阵 AA 的实特征值,那么有一个相应的实特征向量,可以用它来压缩 AA ,使呈(2.3.1)中的形状。如果 λ=α+iβ\lambda = \alpha + i\betaAA 的非实特征值,且 Axλx,x=u+iv0,u,vRnAx - \lambda x, x = u + iv \neq 0, u, v \in \mathbb{R}^n ,证明 Auαuβv,Av=αv+βuAu - \alpha u - \beta v, Av = \alpha v + \beta uAx=λxAx = \lambda x ,再证明 {x,x}\{x, \overline{x}\} 是无关组。证明 {u,v}\{u, v\} 是无关组,然后对它应用Gram-Schmidt过程得到实的标准正交组 {ω,z}\{\omega, z\} 。设 Q1Q_1 是前两列为 wwzz 的实正交矩阵,证明

Q1TAQ1=[A~],Q _ {1} ^ {T} A Q _ {1} = \left[ \begin{array}{c c c c} * & * & \vdots & \\ * & * & & * \\ \dots \dots \dots \dots & & \tilde {A} \end{array} \right],

这时,一次可使 AA 压缩两列。应该指出,在(2.3.5)中,相应于每个实特征值和每对复共轭特征值的子块 AiA_{i} 可以按任意规定的顺序排列。

(2.3.3)也有一个在实的情形下的变形,

2.3.6 定理 设 FMn(R)\mathcal{F} \subseteq M_n(\mathbf{R}) 是交换族, 则存在实正交矩阵 QMn(R)Q \in M_n(\mathbf{R}) , 使得对每个 ΛF\Lambda \in \mathcal{F} , QTAQQ^T A Q 为(2.3.5)的形式.

练习 试修改(2.3.3)的论证以证明(2.3.6). 提示: 首先, 用所有实的公共特征向量压缩 ν\pmb{\nu} 的所有成员. 然后考察非实公共特征向量, 且如(2.3.4)的证明所做的那样一次压缩两列. 要注意的是, 经一个公共的实正交相似之后, F\mathcal{F} 的不同成员可以有不同的 2×22 \times 2 对角子块, 但是, 如果一个成员在某个位置有一个 2×22 \times 2 子块, 而另一个成员却没有, 那么后者必须在相应位置有一对相同的 1×11 \times 1 子块.

习题

  1. xCnx \in \mathbf{C}^{n} 是给定的单位向量 (xx=1)(x^{*}x = 1) ,且记 x[x1,y1]2x - [x_{1}, y^{1}]^{2} ,其中 x1Cx_{1} \in \mathbf{C} ,而 yCn1y \in \mathbf{C}^{n-1} .

83

选取 θR\theta \in \mathbb{R} 使 eiθx10e^{i\theta}x_{1} \geqslant 0 ,然后定义 z=eiθx=[z1,ζT]z = e^{i\theta}x = [z_1, \zeta^T] ,其中 z1Rz_{1} \in \mathbb{R} 是非负实数,而 ζCn1\zeta \in \mathbf{C}^{n-1} 。证明矩阵

V=[z1ζζI+11+z1ζ]V = \left[ \begin{array}{c c} z _ {1} & \zeta^ {*} \\ \hline \zeta & - I + \frac {1}{1 + z _ {1}} \zeta^ {*} \end{array} \right]

是酉矩阵。提示:计算 VV=V2V^{*}V = V^{2} 。得出矩阵 U=eiθV=[xu2un]U = e^{-i\theta}V = [xu_{2}\dots u_{n}] 是其第一列为已知向量 x\pmb{x} 的酉矩阵。这为Schur定理(2.3.1)的证明中的逐个压缩步骤,提供了一个求所需酉矩阵的构造性方法。

  1. 如果 xRnx \in \mathbb{R}^n 是给定的单位向量,说明如何改进习题1中所描述的构造法,以便得到第一列是 xx 的实正交矩阵 QMn(R)Q \in M_{n}(\mathbb{R}) 。证明你的构造方法是可行的。

  2. AMn(R)A \in M_{n}(\mathbf{R}) . 解释 AA 的非实特征值(如果有的话)必须成共轭对出现

  3. 考虑族

F={[0101],[1101]},\mathcal {F} = \left\{\left[ \begin{array}{l l} 0 & - 1 \\ 0 & - 1 \end{array} \right], \left[ \begin{array}{l l} 1 & 1 \\ 0 & - 1 \end{array} \right] \right\},

试说明定理(2.3.3)中的交换性假设虽然是 F\mathcal{F} 可同时酉上三角化的充分条件,但它不是必要条件。

  1. F={A1,,Ak}Mn\mathcal{F} = \{A_1, \dots, A_k\} \subset M_n 是给定的族,且设

G={AiAj:i,j=1,2,,k}\mathcal {G} = \left\{A _ {i} A _ {j}: i, j = 1, 2, \dots , k \right\}

F\mathcal{F} 中矩阵的所有两两乘积组成的族。事实上,如果 G\mathcal{G} 是交换族,那么, F\mathcal{F} 可以同时酉上三角化的充分必要条件是每个换位子 AiAjAjAiA_{i}A_{j} - A_{j}A_{i} 的每个特征值都是零。证明关于 G\mathcal{G} 的交换性假设是比 F\mathcal{F} 的交换性假设要弱的假设。同时证明,习题4中的族 F\mathcal{F} 有一个相应的交换族 G\mathcal{G} ,它还满足零特征值条件。

  1. A,BMnA, B \in M_{n} 已知,且假设 AABB 同时相似于上三角矩阵;即对某个非奇异矩阵 SMn,S1ASS \in M_{n}, S^{-1}ASS1BSS^{-1}BS 都是上三角矩阵。证明 ABBAAB - BA 的每个特征值必定是零。提示:如果 Δ1,Δ2Mn\Delta_{1}, \Delta_{2} \in M_{n} 都是上三角矩阵 Δ1Δ2Δ2Δ1\Delta_{1}\Delta_{2} - \Delta_{2}\Delta_{1} 的主对角线是什么?

  2. 虽然每个方阵可经酉相似化成上三角形式,但这对复正交相似不成立。如果某个 AMnA \in M_n 可以写成 A=QΔQTA = Q\Delta Q^T ,其中, QMnQ \in M_n 是复正交矩阵,而 ΔMn\Delta \in M_n 是上三角矩阵,证明 AA 至少有一个特征向量 xCnx \in \mathbb{C}^n 使 xTx0x^T x \neq 0 。考察 A=[1ii1]A = \begin{bmatrix} 1 & i \\ i & -1 \end{bmatrix} ,试说明不是每个 AMnA \in M_n 可以经一个复正交相似上三角化。

  3. QMnQ \in M_{n} 是给定的复正交矩阵,且假定 xCnx \in \mathbb{C}^{n}QQ 的相应于特征值 λ±1\lambda \neq \pm 1 的特征向量。证明 xTx=0x^T x = 0 。提示:在恒等式 Qx=λxQx = \lambda x 的两边各乘以自己的转置。关于两个特征值都不同于 ±1\pm 12×22 \times 2 复正交矩阵族的例子,可参看(2.1)节的习题8(a)。证明,这些矩阵中没有任何矩阵可经正交相似化为上三角矩阵。

进一步阅读 关于习题5所确立的定理(2.3.3)的较强形式,其证明可参看Y.P.Hong and R.A.Horn, “On Simultaneous Reduction of Families of Matrices to Triangular or Diagonal Form by Unitary Congruences,” Linear and Multilinear Algebra 17(1985), 271-288.