30._矩阵的五种分解概述

矩阵的五种分解

为了处理矩阵,人们把矩阵进行了分解,主要包括五种分解: (1) A=CR (2) A=LU (3) A=QR (4) A=QΛQTQ \Lambda Q^T (5) A=UVTU \sum V^T 图片

A=CRA=CR

A=CR\boldsymbol{A}=\boldsymbol{C} \boldsymbol{R} 所有一般的长矩阵 AA 都有相同的行秩和列秩.这个分解是理解这一定理最直观的方法.CCAA 的线性无关列组成,RRAA 的行阶梯形矩阵(消除了零行).A=CRA=C RAA 化简为 rr 的线性无关列 CC 和线性无关行 RR的乘积.

A=CR[123235]=[1223][101011]\begin{aligned} A & =C R \\ {\left[\begin{array}{lll} 1 & 2 & 3 \\ 2 & 3 & 5 \end{array}\right] } & =\left[\begin{array}{ll} 1 & 2 \\ 2 & 3 \end{array}\right]\left[\begin{array}{lll} 1 & 0 & 1 \\ 0 & 1 & 1 \end{array}\right] \end{aligned}

推导过程:从左往右看 AA 的列。保留其中线性无关的列,去掉可以由前者线性表出的列。则第1、2列被保留,而第三列因为可以由前两列之和表示而被去掉。而要通过线性无关的 121 、 2 两列重新构造出 AA ,需要右乘一个行阶梯矩阵 RR

图片

现在你会发现行的秩为 2 ,因为 CC 中只有 2 个线性无关列.而 AA 中所有的列都可以由 CC 中的 2 列线性表出.

图片

A=LUA=L U

用高斯消除法求解 Ax=bA \boldsymbol{x}=\boldsymbol{b} 也被称为 LUL U 分解。通常,是 AA 左乘一个初等行变换矩阵 (E)(E) 来得到一个上三角矩阵 UU

EA=UA=E1U let L=E1,A=LU\begin{aligned} E A & =U \\ A & =E^{-1} U \\ \text { let } L=E^{-1}, \quad A & =L U \end{aligned}

现在,求解 Ax=bA \boldsymbol{x}=\boldsymbol{b} 有2步:(1)求解 Lc=bL \boldsymbol{c}=\boldsymbol{b} ,(2)代回 Ux=cU \boldsymbol{x}=\boldsymbol{c}

在这里,我们直接通过 AA 计算 LLUU

图片

要计算 LLUU ,首先分离出由 AA 的第一行和第一列组成的外积.余下的部分为 A2A_2 .递归执行此操作,将 AA 分解为秩1矩阵之和.

图片

LL 乘以 UU 来重新构造 AA 则相对简单。

A=QRA=Q R

A=QRA=Q R 是在保持 C(A)=C(Q)\boldsymbol{C}(A)=\boldsymbol{C}(Q) 的条件下,将 AA 转化为正交矩阵 QQ . 在格拉姆-施密特正交化中,首先,单位化的 a1\boldsymbol{a}_1 被用作 q1\boldsymbol{q}_1 ,然后求出 a2\boldsymbol{a}_2q1\boldsymbol{q}_1 正交所得到的 q2\boldsymbol{q}_2 ,以此类推.

q1=a1/a1q2=a2(q1Ta2)q1,q2=q2/q2q3=a3(q1Ta3)q1(q2Ta3)q2,q3=q3/q3\begin{aligned} & \boldsymbol{q}_1=\boldsymbol{a}_1 /\left\|\boldsymbol{a}_1\right\| \\ & \boldsymbol{q}_2=\boldsymbol{a}_2-\left(\boldsymbol{q}_1^{\mathrm{T}} \boldsymbol{a}_2\right) \boldsymbol{q}_1, \quad \boldsymbol{q}_2=\boldsymbol{q}_2 /\left\|\boldsymbol{q}_2\right\| \\ & \boldsymbol{q}_3=\boldsymbol{a}_3-\left(\boldsymbol{q}_1^{\mathrm{T}} \boldsymbol{a}_3\right) \boldsymbol{q}_1-\left(\boldsymbol{q}_2^{\mathrm{T}} \boldsymbol{a}_3\right) \boldsymbol{q}_2, \quad \boldsymbol{q}_3=\boldsymbol{q}_3 /\left\|\boldsymbol{q}_3\right\| \end{aligned}

或者你也可以写作 rij=qiTajr_{i j}=\boldsymbol{q}_i^{\mathrm{T}} \boldsymbol{a}_j

a1=r11q1a2=r12q1+r22q2a3=r13q1+r23q2+r33q3\begin{aligned} & \boldsymbol{a}_1=r_{11} \boldsymbol{q}_1 \\ & \boldsymbol{a}_2=r_{12} \boldsymbol{q}_1+r_{22} \boldsymbol{q}_2 \\ & \boldsymbol{a}_3=r_{13} \boldsymbol{q}_1+r_{23} \boldsymbol{q}_2+r_{33} \boldsymbol{q}_3 \end{aligned}

原本的 AA 就可以表示为 QRQ R :正交矩阵乘以上三角矩阵.

图片

AA 的列向量就可以转化为一个正交集合:QQ 的列向量.AA 的每一个列向量都可以用 QQ 和上三角矩阵 RR 重新构造出. 图释可以回头看 P1.

S=QΛQT S=Q \Lambda Q^{\mathrm{T}}

所有对称矩阵 SS 都必须有实特征值和正交特征向量.特征值是 Λ\Lambda 的对角元素,特征向量在 QQ 中.

图片

一个对称矩阵 SS 通过一个正交矩阵 QQ 和它的转置矩阵,对角化为 Λ\Lambda 。然后被分解为一阶投影矩阵 P=qqTP=q q^{\mathrm{T}}的组合.这就是谱定理.

S=ST=λ1P1+λ2P2+λ3P3QQT=P1+P2+P3=IP1P2=P2P3=P3P1=OP12=P1=P1T,P22=P2=P2T,P32=P3=P3T\begin{gathered} S=S^{\mathrm{T}}=\lambda_1 P_1+\lambda_2 P_2+\lambda_3 P_3 \\ Q Q^{\mathrm{T}}=P_1+P_2+P_3=I \\ P_1 P_2=P_2 P_3=P_3 P_1=O \\ P_1^2=P_1=P_1^{\mathrm{T}}, \quad P_2^2=P_2=P_2^{\mathrm{T}}, \quad P_3^2=P_3=P_3^{\mathrm{T}} \end{gathered}

A=UΣVT A=U \Sigma V^{\mathrm{T}}

包括长方阵在内的所有矩阵都具有奇异值分解(SVD).A=UΣVTA=U \Sigma V^{\mathrm{T}} 中,有 AA 的奇异向量 UUVV 。奇异值则排列在 Σ\Sigma 的对角线上.下图就是"简化版"的 SVD. 图片 你可以发现,VVRn\mathbb{R}^nATAA^{\mathrm{T}} A 的特征向量)的标准正交基,而 UURm\mathbb{R}^mAATA A^{\mathrm{T}} 的特征向量)的标准正交基.它们共同将 AA 对角化为 Σ\Sigma .这也可以表示为秩 1 矩阵的线性组合.

图片

注意:

UUT=ImVVT=In\begin{aligned} U U^{\mathrm{T}} & =I_m \\ V V^{\mathrm{T}} & =I_n \end{aligned}