0.7_分块矩阵

0.7 分块矩阵

类似于集合的划分,一个矩阵的分块是把该矩阵完全地分成一些互不相交的子矩阵。使得原矩阵的每一个元落到日只落到一个分块子矩阵中。为识别一些有用的结构,矩阵分块往往是一个方便的方法。

0.7.1子矩阵设 ΛMm,n(F)\Lambda \in M_{m,n}(\mathbf{F}) ,对于指标集 α{1,,m}\alpha \subseteq \{1,\dots ,m\}β{1,,n}\beta \subseteq \{1,\dots ,n\} ,把 AA 中位于标号 α\alpha 的诸行和标号为 β\beta 的诸列的(子)矩阵记作 A(α,β)A(\alpha ,\beta) 例如

[123456789]({1,3},{1,2,3})=[123789].\left[ \begin{array}{l l l} 1 & 2 & 3 \\ 4 & 5 & 6 \\ 7 & 8 & 9 \end{array} \right] (\{1, 3 \}, \{1, 2, 3 \}) = \left[ \begin{array}{l l l} 1 & 2 & 3 \\ 7 & 8 & 9 \end{array} \right].

如果 m=nm = nβ=α\beta = \alpha ,了矩阵 A(α,α)A(\alpha, \alpha) 称为 Λ\Lambda 的主子矩阵,简记为 A(α)A(\alpha) 。说明一个子矩阵或一个主子矩阵是经划去那些行或列得来的,常常要比说它们包括那些行或列要方便些。这可以通

16

过补充指标集来完成。例如, A(α,β)A(\alpha', \beta') 是划去标号为 α\alpha 的诸行与标号为 β\beta 的诸列后的结果。

矩阵 AA 的子方阵的行列式称为 AA 的一个子式。如果子矩阵是一个主子矩阵,那么其子式称为主子式。那些出现在 Laplace 展开式 (0.3.1) 中的带正负号的子式 [(1)i1detAij][( -1)^{i-1} \det A_{ij}] 称为 AA 的代数余子式。约定,空主子式是 1,即 detA(ϕ)=1\det A(\phi) = 1

0.7.2 分块与乘法 如果 α1,,αs\alpha_{1}, \cdots, \alpha_{s} 组成 {1,,m}\{1, \cdots, m\} 的一个划分,而 β1,,βs\beta_{1}, \cdots, \beta_{s} 组成 {1,,n}\{1, \cdots, n\} 的一个划分,那么诸矩阵 A(αi,βj)A(\alpha_{i}, \beta_{j})1it1 \leqslant i \leqslant t1js1 \leqslant j \leqslant s ,构成 AMm,n(F)A \in M_{m,n}(\mathbf{F}) 的一个分块。如果 AMm,n(F)A \in M_{m,n}(\mathbf{F})BMn,p(F)B \in M_{n,p}(\mathbf{F}) 已经分块,且使 {1,,n}\{1, \cdots, n\} 的两个划分重合,那么就说这两个矩阵分块是共形的。这时,

17

[AB](αi,γj)=ksA(αi,βk)B(βk,γj),[ A B ] (\alpha_ {i}, \gamma_ {j}) = \sum_ {k} ^ {s} A (\alpha_ {i}, \beta_ {k}) B (\beta_ {k}, \gamma_ {j}),

其中 A(αt,βk)A(\alpha_{t},\beta_{k})B(βk,γj)B(\beta_{k},\gamma_{j})AABB 的共形分块.等式左边是,乘积 ABAB 的一个子矩阵(按通常方式计算),而右边的每一个被加项是一个标准的矩阵乘积.因此,共形的分块矩阵的乘法与通常的矩阵乘法相仿.当各被加项有相同的分块时,分块矩阵的加法也是有意义的.

0.7.3 分块矩阵的逆 求出非奇异分块矩阵 AA 的逆的相应子块,即用相应的分块形式给出分块矩阵的逆,有时很有用。可以采用各种不同的,但彼此等价的方式来求分块矩阵的逆——假定 AMn(F)A \in M_{n}(\mathbf{F}) 的某些子矩阵及 A1A^{-1} 也是非奇异的。为简单起见,设 AA 是如下的分块

A=[A11A12A21A22],A = \left[ \begin{array}{l l} A _ {1 1} & A _ {1 2} \\ A _ {2 1} & A _ {2 2} \end{array} \right],

其中, AnMn1(F)A_{n}\in M_{n_{1}}(\mathbf{F})i=1i = 1 ,2日 n1+n2=nn_1 + n_2 = n ,关于 A1A^{-1} 的相应分块形式有一个有用的表示式

[[A11A12A221A21]1A111A12[A21A111A12A22]1[A21A111A12A22]1A21A111[A22A21A111A12]1],\left[ \begin{array}{l l} {\left[ A _ {1 1} - A _ {1 2} A _ {2 2} ^ {- 1} A _ {2 1} \right] ^ {- 1}} & {A _ {1 1} ^ {- 1} A _ {1 2} \left[ A _ {2 1} A _ {1 1} ^ {- 1} A _ {1 2} - A _ {2 2} \right] ^ {- 1}} \\ {\left[ A _ {2 1} A _ {1 1} ^ {- 1} A _ {1 2} - A _ {2 2} \right] ^ {- 1} A _ {2 1} A _ {1 1} ^ {- 1}} & {\left[ A _ {2 2} - A _ {2 1} A _ {1 1} ^ {- 1} A _ {1 2} \right] ^ {- 1}} \end{array} \right],

其中,假定所有有关的逆存在。或者,用一般的指标集记号,可以记

A1(α)=[A(α)A(α,α)A(α)1A(α,α)]1,A ^ {- 1} (\alpha) = \left[ A (\alpha) - A \left(\alpha , \alpha^ {\prime}\right) A \left(\alpha^ {\prime}\right) ^ {1} A \left(\alpha^ {\prime}, \alpha\right) \right] ^ {- 1},

以及

A(α,α)=A(α)1A(α,α)[A(α,α)A(α)1A(α,α)A(α)]1,A ^ {\prime} (\alpha , \alpha^ {\prime}) = A (\alpha) ^ {- 1} A (\alpha , \alpha^ {\prime}) \left[ A \left(\alpha^ {\prime}, \alpha\right) A (\alpha) ^ {- 1} A \left(\alpha , \alpha^ {\prime}\right) - A \left(\alpha^ {\prime}\right) \right] ^ {- 1},

仍假定有关的逆存在。还可以写出其余的表示式。注意, A1(α)A^{-1}(\alpha)A1A^{-1} 的子矩阵,而 A(α)1A(\alpha)^{-1}AA 的一个子矩阵的逆,并且这两个矩阵一般不相同。

0.7.4 小秩修正矩阵的逆 如果已知某个矩阵的逆,了解该矩阵再加上一个“小”秩矩阵时,其逆如何变化,这同样是一个有意义的问题。有这样的简便公式,只要修正矩阵的形式足够简单,就可以使新逆的计算比从头开始计算要简便。设非奇异矩阵 AMn(F)A \in M_{n}(\mathbf{F}) 的逆 A1A^{-1} 已知,考虑

B=A+XRY,B = A + X R Y,

其中, XXn×rn\times r 矩阵,而 RRr×rr\times r 非奇异矩阵.如果 BB 是非奇异的,那么

B1=A1A1X(R1+YA1X)1YA1.B ^ {1} = A ^ {- 1} \cdot A ^ {1} X (R ^ {- 1} + Y A ^ {1} X) ^ {- 1} Y A ^ {- 1}.

如果 rrnn 小得多,那么求 RRR1+YA1XR^{-1} + YA^{-1}X 的逆可能要比求 BB 的逆更为容易,并且,如果

AA 是容易求逆的,且有使乘法简化的形式,那么,采用这个公式可能要胜过直接求 BB 的逆。例如,如果修正矩阵有秩 1, XXn×1n \times 1 的, YY1×n1 \times n 的,且 R=[1]R = [1] ,上述公式就变成

B1=A111+YA1XA1XYA1,B ^ {- 1} = A ^ {- 1} - \frac {1}{1 + Y A ^ {- 1} X} A ^ {- 1} X Y A ^ {- 1},

(注意,此时 XY=BAXY = B - A ).特别地,如果

B=I+xy1B = I + x y ^ {1}

对于 x,yFn,lMn(F)x, y \in \mathbf{F}^n, l \in M_n(\mathbf{F}) 成立,那么,只要 yix1y^i x \neq -1 ,就有

B=I11+ylxxyl.B ^ {\prime} = I - \frac {1}{1 + y ^ {l} x} x y ^ {l}.

0.8 行列式(续)

关于行列式的一些补充材料和恒等式对于某些论题的阐述很有用。其中大部分内容在基础线性代数中不易找到。

0.8.1 复合矩阵 设矩阵 ΛMm,n(F)\Lambda \in M_{m,n}(\mathbf{F}) ,其某个阶数的所有子式组成的阵列称为 Λ\Lambda 的复合矩阵。特别地,它的 α,β\alpha, \beta 元为 detA(α,β)\det A(\alpha, \beta)(mk)×(nk)\binom{m}{k} \times \binom{n}{k} 矩阵叫做 AA 的第 kk 次复合矩阵,记作 Ck(A)C_k(A) 。这里, α{1,,m}\alpha \subseteq \{1, \cdots, m\}β{1,,n}\beta \subseteq \{1, \cdots, n\} 都是基数为 kmin{m,n}k \leqslant \min \{m, n\} 的指标集,按通常的辞典式次序排列,即 {1,2,4}\{1, 2, 4\} 排在 {1,2,5}\{1, 2, 5\} 之前, {1,2,5}\{1, 2, 5\} 排在 {1,3,4}\{1, 3, 4\} 之前,等等。例如,如果

A=[123456789].A = \left[ \begin{array}{c c c} 1 & 2 & 3 \\ 4 & 5 & 6 \\ 7 & 8 & 9 \end{array} \right].

C2(A)=[det[1245]det[1346]det[2356]det[1278]det[1379]det[2389]=[3636126363],det[4578]det[1679]det[5689]]C _ {2} (A) = \left[ \begin{array}{l l l l l} \det \left[ \begin{array}{l l} 1 & 2 \\ 4 & 5 \end{array} \right] & \det \left[ \begin{array}{l l} 1 & 3 \\ 4 & 6 \end{array} \right] & \det \left[ \begin{array}{l l} 2 & 3 \\ 5 & 6 \end{array} \right] & \\ \det \left[ \begin{array}{l l} 1 & 2 \\ 7 & 8 \end{array} \right] & \det \left[ \begin{array}{l l} 1 & 3 \\ 7 & 9 \end{array} \right] & \det \left[ \begin{array}{l l} 2 & 3 \\ 8 & 9 \end{array} \right] & = \left[ \begin{array}{l l l} - 3 & - 6 & - 3 \\ - 6 & 1 2 & - 6 \\ - 3 & - 6 & - 3 \end{array} \right], \\ \det \left[ \begin{array}{l l} 4 & 5 \\ 7 & 8 \end{array} \right] & \det \left[ \begin{array}{l l} 1 & 6 \\ 7 & 9 \end{array} \right] & \det \left[ \begin{array}{l l} - 5 & 6 ^ {-} \\ 8 & 9 \end{array} \right] & \end{array} \right]

如果 AMk,n(F)A \in M_{k,n}(\mathbf{F}) ,且 BMk,n(F)B \in M_{k,n}(\mathbf{F}) ,那么

C,(AB)=C,(A)C,(B),rmin1mk,n.C, (A B) = C, (A) C, (B), \quad r \vdots \min _ {1} ^ {m} k, n.

另外,还有

Ci(tA)=tCi(A),iF.C _ {i} (t A) = t ^ {\prime} C _ {i} (A), \quad i \in F.

IMnI \in M_{n} , 则 Ck(I)=IM(1)C_{k}(I) = I \in M_{(1)} .

AMnA \in M_{n} 是非奇异的,则 Ck(A)1=Ck(A1)C_{k}(A)^{-1} = C_{k}(A^{1})

AMm,n(F)A \in M_{m,n}(\mathbf{F}) ,则 Ck(AT)=Ck(A)TC_k(A^T) = C_k(A)^T .

AMm,n(C)A \in M_{m,n}(\mathbf{C}) ,则 Ck(A)=Ck(A)C_k(A^*) = C_k(A)^*

0.8.2 经典伴随和逆 如果 ΛMn(F)\Lambda \in M_{n}(\mathbf{F}) ,由诸代数余子式

bij=(1)r+jdetA({j},{i})b _ {i j} = (- 1) ^ {r + j} \det A (\{j \} ^ {\prime}, \{i \} ^ {\prime})

组成的转置矩阵 B=[bij]Mn(F)B = [b_{ij}] \in M_n(\mathbf{F}) 称为 Λ\Lambda 的(经典)伴随,常记作 adjA\operatorname{adj} A 。有时用转置伴随来代替伴随,以免与Hermite伴随 AA^* 相混淆。注意,

adjΛ=ECn1(Λ)E0,\operatorname {a d j} \Lambda = E C _ {n - 1} (\Lambda) ^ {\prime} E _ {0},

其中

E=[101110±1].E = \left[ \begin{array}{c c c c c c} 1 & & & & 0 & \\ & - 1 & & & & \\ & & 1 & & & \\ & & & - 1 & & \\ & & & & \ddots & \\ & 0 & & & & \pm 1 \end{array} \right].

用Laplace展开式计算行列式的公式说明.

(adjΛ)A=Λ(adjΛ)=(detA)I.\left(\operatorname {a d j} \Lambda\right) A = \Lambda \left(\operatorname {a d j} \Lambda\right) = (\det A) I.

因而,如果 AA 是非奇异的( detA0\det A \neq 0 ),那么

A1=1detAadjA.A ^ {- 1} = \frac {1}{\det A} \operatorname {a d j} A.

一般说来,用伴随来数值计算矩阵的逆不是可取的方法,但是伴随对于给出逆的解析表达式是有用的.

\ominus 原书给出的这个关系式是错误的(但书中尚未用到这个关系式),adj AA(A)(A) 应是如下关系:

adjA=J0Cn1(A)tJ1=J1Cn1(A)tJ(n为 偶 数)\operatorname {a d j} A = J _ {0} C _ {n - 1} (A) ^ {t} J _ {1} = J _ {1} C _ {n - 1} (A) ^ {t} J \quad (n \text {为 偶 数})
adjA=J0Cn1(A)TJ1=J1Cn1(A)TJ1(n为 奇 数).\operatorname {a d j} A = J _ {0} C _ {n - 1} (A) ^ {T} J _ {1} = J _ {1} C _ {n - 1} (A) ^ {T} J _ {1} \quad (n \text {为 奇 数}).

其中 nn 阶方阵 J0J_{0}J1J_{1} 分别为:

J0[011101],J1=[11111].J _ {0} \dots \left[ \begin{array}{c c c c c} & 0 & & & - 1 \\ & & & 1 & \\ & & - 1 & & \\ & \ddots & & 0 \\ \hline 1 \end{array} \right], J _ {1} = \left[ \begin{array}{c c c c c} & & & & - 1 \\ & & & 1 & \\ & & - 1 & & \\ & 1 & & \\ & \ddots & & \\ \hline 1 \end{array} \right].

0.8.3 Cramer法则 当 AMn(F)A \in M_{n}(\mathbf{F}) 非奇异时,Cramer法则是求线性方程组 Ax=bAx = b 唯一解的一种方法。它和逆的伴随表示有相同的计算手续,一般,只有在需要解析地给出解向量的个别解析分量时,这种方法才有用。如果 xix_{i} 是解向量 xFnx \in \mathbb{F}^{n} 的第 ii 个分量,那么,Cramer法则可述为公式

xi=det(Ab)detA.x _ {i} = \frac {\det (A \cdot b)}{\det A}.

记号 AbA \leftarrow b 表示 MnM_{n} 中第 ii 列是 bb ,其余各列与 AA 的对应列相同的矩阵。Cramer 法则可直接由行列式的乘法性质推出。把方程组 Ai=bA_{i} = b 改写成

A(Ir)=Ab,A (I \leftarrow r) = A \leftarrow b,

然后两边取行列式(利用乘法性质)可得

(detA)det(Ix)=det(Ab).(\det A) \det (I \leftarrow x) = \det (A \leftarrow b).

det(Ix)=x\operatorname{det}(I - x) = x ,因而公式得证。

0.8.4 逆的子式 推广非奇异矩阵的逆的伴随公式,有如下重要公式:

detA1(α,β)(1)(i=1nj=1n)detA(β,α)detA,\det A ^ {1} \left(\alpha^ {\prime}, \beta^ {\prime}\right) - (- 1) ^ {\left(\sum_ {i = 1} ^ {n} \sum_ {j = 1} ^ {n}\right)} \frac {\det A (\beta , \alpha)}{\det A},

它把 Λ1\Lambda^1 的诸子式与 AMλ(F)A \in M_{\lambda}(\mathbf{F}) 的诸子式联系起来。对于主子阵,这个公式有简单的形式

detA(α)=detA(α)detA.\det A ^ {\prime} \left(\alpha^ {\prime}\right) = \frac {\det A (\alpha)}{\det A}.

0.8.5 Schur补和行列式公式 对于给定的矩阵 AMn(F)A \in M_{n}(\mathbf{F}) ,设 α{1,,n}\alpha \subseteq \{1, \dots, n\} 是使 A(α)A(\alpha) 非奇异的指标集.记 A(α)A(\alpha) 的逆为 A(α)1A(\alpha)^{-1} .用 α\alphaα\alpha'AA2×22 \times 2 分块,据此,关于det AA 的重要公式是

detAdetA(α)det[A(α)A(α,α)A(α)A(α,α)].\det A - \det A (\alpha) \det \left[ A \left(\alpha^ {\prime}\right) - A \left(\alpha^ {\prime}, \alpha\right) A (\alpha) ^ {\prime} A \left(\alpha , \alpha^ {\prime}\right) \right].

注意,这个公式推广了(0.3.1)中的关于 2×22 \times 2 矩阵行列式的普通公式。称特殊矩阵

A(α)A(α,α)A(α)1A(α,α)A \left(\alpha^ {\prime}\right) - A \left(\alpha^ {\prime}, \alpha\right) A (\alpha) ^ {- 1} A \left(\alpha , \alpha^ {\prime}\right)

AA 的Schur补,将

[Λ11Λ12Λ21Λ22]右 乘 以[IA111A120I],\left[ \begin{array}{l l} {\Lambda_ {1 1}} & {\Lambda_ {1 2}} \\ {\Lambda_ {2 1}} & {\Lambda_ {2 2}} \end{array} \right] \text {右 乘 以} \left[ \begin{array}{c c} {I} & {- A _ {1 1} ^ {- 1} A _ {1 2}} \\ {0} & {I} \end{array} \right],

然后把 A:1A_{:1}A(α)A(\alpha) 等同起来,就可验证 detA\operatorname{det} A 和 Schur 补公式成立。注意,Schur 补已在 A1A^{-1} 的分块中出现过[见(0.7.3)]。

0.8.6 Sylvester 恒等式 设 α{1,,n}\alpha \subseteq \{1, \dots, n\} 是固定的指标集,设 B=[bij]Mnk(F)B = [b_{ij}] \in M_{n-k}(\mathbf{F})

bij=detA(α{i},α{j})b _ {i j} = \det A (\alpha \bigcup \{i \}, \alpha \bigcup \{j \})

所定义,其中 kkα\alpha 的基数, i,j{1,,n}i, j \in \{1, \dots, n\} 是不包含在 α\alpha 中的指标, AMn(F)A \in M_{n}(\mathbf{F}) 。另一个有用的行列式恒等式是

detB[detA(u)]nkdetA\det B \cdot \left[ \det A (u) \right] ^ {- n k} \det A

0.8.7 Cauchy-Binet 公式 这个有用的公式是可以想起来的,这是因为它看上去与矩阵的乘法公式相类似。它等价于复合矩阵的乘法性质(见 0.8.1),所以这不是偶然的巧合。设 AMm,k(F)A \in M_{m,k}(\mathbf{F})BMk,p(F)B \in M_{k,p}(\mathbf{F})C=ABC = AB 。再设 1rmin{m,k,n}1 \leqslant r \leqslant \min\{m, k, n\}α{1,,m}\alpha \subseteq \{1, \cdots, m\}β{1,,n}\beta \subseteq \{1, \cdots, n\} 都是基

数为 rr 的指标集。关于 CCα,β\alpha, \beta 子式的表示式是

detC(α,β)=γdetA(α,γ)detB(γ,β),\det C (\alpha , \beta) = \sum_ {\gamma} \det A (\alpha , \gamma) \det B (\gamma , \beta),

其中和式取遍基数为 rr 的所有指标集 γ{1,,k}\gamma \subseteq \{1, \dots, k\} .

0.8.8子式间的关系已知 AMm,n(F)A\in M_{m,n}(\mathbf{F}) ,给定基数为 k\pmb{k} 的固定指标集 α{1,,m}\alpha \subseteq \{1,\dots ,m\} ,当 ω{1,,n}\omega \subseteq \{1,\dots ,n\} 取遍基数为 k\pmb{k} 的有序指标集时,诸子式

detA(α,ω)\det A (\alpha , \omega)

不是代数无关的,因为在各子矩阵中诸子式多于诸子矩阵中的各不相同的元,在这些子式当中,二次关系是知道的。设 i1,i2,,ik{1,,n}i_1, i_2, \dots, i_k \in \{1, \dots, n\}kk 个互异的指标,不一定取自然顺序,又设

A(α;i1,,ik)A (\alpha ; i _ {1}, \dots , i _ {k})

表示这样一个矩阵,它的各行用 α\alpha 标号,而它的第 jj 列是 A(α,{1,,n})A(\alpha, \{1, \dots, n\})iji_j 列。这与前述记号的差别是,列可以不按自然顺序,如在 A({1,3};4,2)A(\{1, 3\}; 4, 2) 中,它的第 ii 列有 AA 中的1,4元和3,4元。于是有关系式

detA(α;i1,,ik)detA(α;j1,,jk)=i=1kdetA(α;i1,,ir1,jt,is+1,,ir)detA(α;j2,,jt1,i,jt+1,,jk).\begin{array}{l} \det A (\alpha ; i _ {1}, \dots , i _ {k}) \det A (\alpha ; j _ {1}, \dots , j _ {k}) \\ = \sum_ {i = 1} ^ {k} \det A (\alpha ; i _ {1}, \dots , i _ {r - 1}, j _ {t}, i _ {s + 1}, \dots , i _ {r}) \det A (\alpha ; j _ {2}, \dots , j _ {t - 1}, i, j _ {t + 1}, \dots , j _ {k}). \\ \end{array}

它对于每个 s=1,,ks = 1, \dots, k 和互异指标的所有序列

i1,,ik{1,,n}j1,,jk{1,,n}i _ {1}, \dots , i _ {k} \in \{1, \dots , n \} \text {和} j _ {1}, \dots , j _ {k} \in \{1, \dots , n \}

成立.