0.9_矩阵的特殊形式

0.9 矩阵的特殊形式

经常会遇到某些特殊形式的矩阵,这些矩阵具有特殊的性质。为了参阅,其中有些矩阵值得在这里介绍,并给出其名称。

0.9.1 对角矩阵 如果矩阵 D={dij}MnD = \left\{d_{ij}\right\} \in M_njij \neq i 时,有 dij=0d_{ij} = 0 ,就称 DD 为对角矩阵。平常,把这个矩阵记作 D=diag(d11,,dnn)D = \operatorname{diag}(d_{11}, \dots, d_{nn})D=diagdD = \operatorname{diag} d ,其中 ddDD 的对角元组成的向量。如果一个对角矩阵的所有对角元都是正(非负)实数,就称它为正(非负)对角矩阵。注意,术语正对角矩阵指的是,矩阵是对角形的,且有正对角元;它不是指那种所有对角元碰巧都是正数的一般矩阵。单位矩阵是正对角矩阵的一个例子。如果对角矩阵 DD 的诸对角元都相等,就称 DD 为纯量矩阵;即对某 αC\alpha \in \mathbf{C}D=αID = \alpha I 。一个矩阵左乘或右乘以一个纯量矩阵,与用相应的纯量乘这个矩阵的作用相同。

一个对角矩阵的行列式正好是它的诸对角元之乘积: detD=i=1ndii\det D = \prod_{i=1}^{n} d_{ii} 。因而,一个对角矩阵是非奇异的,当且仅当它的所有对角元是非零的。 AMnA \in M_n 左乘以对角阵 DD ,即 DADA ,就是用 DD 的诸对角元乘 AA 的各行( AA 的第 ii 行乘以 did_ii=1,2,,ni=1,2,\dots,n )。而右乘以 DD ,即 ADAD ,就是

DD 的诸对角元乘 AA 的各列。因此,所有对角矩阵关于乘法相互交换,并且,一个对角矩阵与某个矩阵 A=[aij]MnA = [a_{ij}] \in M_n 可交换,当且仅当在 DD 的第 ii 个对角元与第 jj 个对角元不相同时,有 aij=0a_{ij} = 0 。两个对角矩阵的乘积也是对角矩阵,其对角元正好是它们相应的对角元的两两乘积。类似地,可以规定一个对角矩阵的正整数幂。

0.9.2 分块对角矩阵 具有形式

A=[A110A220Akk]A = \left[ \begin{array}{c c c c} A _ {1 1} & & 0 \\ & A _ {2 2} & & \\ & & \ddots & \\ & 0 & & A _ {k k} \end{array} \right]

的矩阵 AMnA \in M_{n} 称为分块对角矩阵,其中, AiiMniA_{ii} \in M_{n_i}i=1,2,,ki = 1, 2, \dots, ki=1kni=n\sum_{i=1}^{k} n_i = n 。形式上,这个矩阵常常用 A=Λ11Λ22AkkA = \Lambda_{11} \oplus \Lambda_{22} \oplus \dots \oplus A_{kk} 来表示,或简记作 i=1kAn\oplus \sum_{i=1}^{k} A_n ,称这个矩阵为 A11A_{11}Λ22,,Akk\Lambda_{22}, \dots, A_{kk} 的直和。从分块矩阵的乘法来考虑,分块对角矩阵的许多性质推广了对角矩阵的性质,例如, det(i=1kAu)=i=1kdetAb\operatorname{det} \left( \oplus \sum_{i=1}^{k} A_u \right) = \prod_{i=1}^{k} \operatorname{det} A_b ,因而, Λ=An\Lambda = \oplus \sum A_n 是非奇异的,当且仅当每个 AnA_n 是非奇异的, i=1,2,,ki = 1, 2, \dots, k 。另外,直和 A=i=1kAuA = \oplus \sum_{i=1}^{k} A_uB=i=1kBuB = \oplus \sum_{i=1}^{k} B_u 可交换,其中 Au,BuA_u, B_u 是同阶的。当且仅当 AuA_uBuB_u 可交换, i=1,2,,ki = 1, 2, \dots, k 。还有, rank(i=1kAu)=i=1krankAu\operatorname{rank} \left( \oplus \sum_{i=1}^{k} A_u \right) = \sum_{i=1}^{k} \operatorname{rank} A_u

0.9.3 三角矩阵 如果矩阵 T=[tij]MnT = [t_{ij}] \in M_n ,当 j<ij < i 时,有 tij=0t_{ij} = 0 ,就称 TT 为上三角矩阵。如果当 jij \leq i 时, tij=0t_{ij} = 0 ,就称 TT 是严格上角矩阵,类似地, TT 称为下三角(或严格下三角)矩阵,是指它的转置是上三角(或严格上三角)矩阵。与对角矩阵类似,三角矩阵的行列式是它的诸对角元之乘积。三角矩阵(两种中的任一种)不一定与另一种三角矩阵可交换。 AMnA \in M_n 左乘以下三角矩阵 LL ,即 LALA ,就是用 LL 的第1行至第 ii 行的线性组合代替 AA 的第 ii 行。在述及三角矩阵时,有时采用术语右(代替上)和左(代替下)三角矩阵。三解矩阵的秩至少是(也可能大于)主对角线上非零元的个数。

0.9.4 分块三角矩阵 具有形状

A=[A1tA220Ank]A = \left[ \begin{array}{c c c} A _ {1 t} & & * \\ & A _ {2 2} \\ 0 & \ddots & \\ & & A _ {n k} \end{array} \right]

的矩阵 AMnA \in M_{n} 称为分块上三角矩阵,其中 AnMn,i=1,,k,i=1kni=nA_{n} \in M_{n}, i = 1, \dots, k, \sum_{i=1}^{k} n_{i} = n ,而“*”表示任意块元。分块下三角矩阵、严格分块下三角矩阵和严格分块上三角矩阵都可以类似地定义。分块三角矩阵的行列式是诸对角子块的行列式之积。分块三角矩阵的秩至少是(也可能大于)诸对角子块的秩之和。

0.9.5 置换矩阵 如果矩阵 PMnP \in M_{n} 在它的每一行和每一列正好有一个元等于1,而其余所有的元都是0,就称 PP 为置换矩阵。乘以这样一个矩阵的效果是使被乘矩阵的行或列互换。例如

P=[010100001]M3P = \left[ \begin{array}{l l l} 0 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1 \end{array} \right] \in M _ {3}

是置换矩阵,而

P[123]=[213]P \left[ \begin{array}{l} 1 \\ 2 \\ 3 \end{array} \right] = \left[ \begin{array}{l} 2 \\ 1 \\ 3 \end{array} \right]

是向量 [123]\left[ \begin{array}{l}1\\ 2\\ 3 \end{array} \right] 的行(分量)的互换,即它把第-项换到第2个位置,把第2项换到第1个位置,而让第3项保持在第3个位置.一般地,矩阵 AMm,nA\in M_{m,n} 左乘以置换矩阵 PMmP\in M_m 就是互换 AA 的行,而矩阵 AMm,nA\in M_{m,n} 右乘以置换矩阵 PMnP\in M_n 就是互换 AA 的列.实施(0.3.3)的第一种初等变换的矩阵是一个特殊形式的置换矩阵,称之为对换矩阵.

置换矩阵的行列式是 ±1\pm 1 在(0.3.2)的公式中正好有一个被加项非零],因而置换矩阵一定是非奇异的。虽然置换矩阵关于乘法一般是不交换的,但两个置换矩阵的乘积还是一个置换矩阵。因为单位矩阵是一个置换矩阵,并且对每个置换 PP ,有 PT=P1P^T = P^{-1} 。所以,置换矩阵构成 MnM_{n} 中的非奇异矩阵群 GL(n,C)GL(n, \mathbf{C}) 的一个子群,它具有有限基数 n!n! 。事实上,任一置换矩阵是一些对换矩阵的乘积。

因为,如果置换矩阵 PMnP \in M_{n} 以某种方式互换行,则 PTPP^T - P 就以同一方式互换列,所以,变换 APAPTA \to PAP^T 以相同的方式互换 AMnA \in M_{n} 的行和列,这个变换相当于重排诸元的足码。如果矩阵 AMnA \in M_{n} 有某个置换矩阵 PP 使得 PAPTPAP^T 是三角矩阵,就称 AA 为本性三角矩阵。这些矩阵与三角矩阵有许多共同之处。

0.9.6 轮换矩阵 具有形状

A=[a1a2anana1a2an1an1ana1an2a2a3ana1]A = \left[ \begin{array}{c c c c c} a _ {1} & a _ {2} & & \dots & a _ {n} \\ a _ {n} & a _ {1} & a _ {2} & \dots & a _ {n - 1} \\ a _ {n - 1} & a _ {n} & a _ {1} & \dots & a _ {n - 2} \\ \vdots & \vdots & \ddots & \ddots & \vdots \\ a _ {2} & a _ {3} & \dots & a _ {n} & a _ {1} \end{array} \right]

的矩阵称为轮换矩阵。每一行正好是前一行循环一步,使得每一行各元刚好是前一行的各元的一个循环排列。置换矩阵

C=[010001001100]C = \left[ \begin{array}{c c c c c} 0 & 1 & 0 & \dots & 0 \\ & 0 & 1 & & \vdots \\ \vdots & & & & \\ & & & \ddots & 0 \\ & & & \ddots & \\ 0 & & & & 1 \\ 1 & 0 & & \dots & 0 \end{array} \right]

称为基本轮换转置矩阵。矩阵 AMnA \in M_{n} 可以写成形式

A=k=1n1ak+1CkA = \sum_ {k = 1} ^ {n - 1} a _ {k + 1} C ^ {k}

当且仅当 AA 是轮换矩阵。这里 Cn=ICmC^{n} = I \equiv C^{m} ,而系数 a1,a2,,ana_{1}, a_{2}, \cdots, a_{n} 正好是 AA 的第 1 行的诸元。因为这个表达式,轮换矩阵具有与 CC 相关联的优美结构。又因为 Cn=IC^{n} = I ,所以两个轮换矩阵的乘积还是一个轮换矩阵。另外,轮换矩阵在乘法下交换。轮换矩阵有几种推广,例如其中之一,把各行向前(或向右)循环一个大于 1 的固定步数。

26

0.9.7 Toeplitz 矩阵 具有形状

A[a0a1a2ana1a0a1an1a2a1a0an2an+1an2a0a1anan+1a1a1]A - \left[ \begin{array}{c c c c c} a _ {0} & a _ {1} & a _ {2} & \dots & a _ {n} \\ a _ {- 1} & a _ {0} & a _ {1} & \dots & a _ {n - 1} \\ a _ {- 2} & a _ {1} & a _ {0} & \dots & a _ {n - 2} \\ \vdots & \vdots & \ddots & \ddots & \vdots \\ a _ {n + 1} & a _ {n - 2} & \ddots & a _ {0} & a _ {1} \\ a _ {- n} & a _ {n + 1} & \dots & a _ {- 1} & a _ {1} \end{array} \right]

的矩阵 A={an}Mn+1A = \{a_{n}\} \in M_{n + 1} 称为Toeplitz矩阵.对于某个给定的序列 an,an+1,,an1,a0,a1,a2,,an1,anCa_{n}, a_{n + 1}, \dots, a_{n - 1}, a_{0}, a_{1}, a_{2}, \dots, a_{n - 1}, a_{n} \in \mathbb{C} ,一般项 an=aja_{n} = a_{j} 沿着平行于主对角线的诸对角线从上到下, AA 的各元取常值.Toeplitz矩阵

B=[010100]F=[001101]B = \left[ \begin{array}{c c c c} 0 & 1 & & & 0 \\ & & \ddots & & \\ & & \ddots & \ddots & \\ & & & \ddots & 1 \\ 0 & & & & 0 \end{array} \right] \quad \text {和} \quad F = \left[ \begin{array}{c c c c} 0 & & & & 0 \\ 1 & & \ddots & & \\ & \ddots & & \ddots & \\ & & \ddots & \ddots & \\ & & 1 & & \\ & 0 & & \ddots & 1 \end{array} \right]

称为“后向位移”矩阵和“前向位移”矩阵,这是因它们在标准基 {e1,e2,,en+1}\{e_1, e_2, \dots, e_{n+1}\} 的诸元上的作用而得名。矩阵 AMn+1A \in M_{n+1} 可以写成形式

A=k=1nakFkk=0nakBkA = \sum_ {k = 1} ^ {n} a _ {k} F ^ {k} - \sum_ {k = 0} ^ {n} a _ {k} B ^ {k}

当且仅当 Λ\pmb{\Lambda} 是Toeplitz矩阵.在涉及三角矩的问题中,自然要遇到Toplitz矩阵.

0.9.8 Hankel 矩阵 具有形状

A[a0a1a2ana1a2a3an1a2a3a4an2an1anan1a2n1anan+1an+2a2n]A - \left[ \begin{array}{c c c c c} a _ {0} & a _ {1} & a _ {2} & \dots & a _ {n} \\ a _ {1} & a _ {2} & a _ {3} & \dots & a _ {n - 1} \\ a _ {2} & a _ {3} & a _ {4} & \dots & a _ {n - 2} \\ \vdots & \vdots & \vdots & & \vdots \\ a _ {n - 1} & a _ {n} & a _ {n - 1} & \dots & a _ {2 n - 1} \\ \vdots & \vdots & \vdots & & \vdots \\ a _ {n} & a _ {n + 1} & a _ {n + 2} & \dots & a _ {2 n} \end{array} \right]

27!

的矩阵 AMn+1A \in M_{n+1} 称为 Hankel 矩阵。对于某个给定的序列 a0,a1,a2,,a2n1,a2na_0, a_1, a_2, \cdots, a_{2n-1}, a_{2n} ,一般项

anan+1a_{n} - a_{n + 1} ,.沿着与主对角线垂直的诸对角线, AA 的各元取常值,在涉及幂矩的问题中,自然要遇到Hankel矩阵.注意,如果

P=[011110]P = \left[ \begin{array}{c c c c} 0 & & & 1 \\ & & 1 \\ & \ddots & \\ 1 & & \\ 1 & & 0 \end{array} \right]

称之为“后向单位”(置换)矩阵,那么,对任意 Toeplitz 矩阵 TTPTPT 是 Hankel 矩阵,而对于任意 Hankel 矩阵 HHPHPH 是 Toeplitz 矩阵。因为, P=PT=P1P = P^T = P^{-1} 和 Hankel 矩阵是对称的,这表明任一 Toeplitz 矩阵是两个对称矩阵( PP 和 Hankel 矩阵)的乘积。

0.9.9 Hessenberg 矩阵 如果矩阵 A=[aij]MnA = [a_{ij}] \in M_n 对于 i>j+1i > j + 1aij=0a_{ij} = 0 :

A=[a11a12a1na21a220a320000an,n1an,n]A = \left[ \begin{array}{c c c c c} a _ {1 1} & a _ {1 2} & \dots & & a _ {1 n} \\ a _ {2 1} & a _ {2 2} & & & \\ 0 & a _ {3 2} & \ddots & & \vdots \\ \vdots & 0 & \ddots & & \\ & \vdots & \ddots & & \\ 0 & 0 & \dots 0 & a _ {n, n - 1} & a _ {n, n} \end{array} \right]

就称 AA 呈上Hessenberg形状,或称 AA 是上Hessenberg矩阵.如果 ATA^T 是上Hessenberg矩阵,就称 AMnA \in M_n 为下Hessenberg矩阵.

0.9.10 三对角矩阵 如果矩阵 A=[aij]MnA = [a_{ij}] \in M_n 既是上,又是下Hessenberg矩阵,就称之为三对角矩阵。即, AA 是三对角矩阵,是指当 ij>1|i - j| > 1 时, aij=0a_{ij} = 0

A=[a11a12a01a22a23a12a33an1,n0an,n1an,n].A = \left[ \begin{array}{c c c c c} a _ {1 1} & a _ {1 2} & & & \\ a _ {0 1} & a _ {2 2} & a _ {2 3} & & \\ & a _ {1 2} & a _ {3 3} & & \\ & & & \ddots & \\ & & & \ddots & \\ & & & a _ {n - 1, n} & \\ 0 & & a _ {n, n - 1} & & a _ {n, n} \end{array} \right].

[28] 用归纳法容易计算三对角矩阵的行列式. 注意

detA({1,2,,k+1})=ak+1,k1detA({1,,k})ak+1,kak,k+1detA({1,,k1})k=2,,n1.\begin{array}{l} \det A (\{1, 2, \dots , k + 1 \}) \\ = a _ {k + 1, k - 1} \det A (\{1, \dots , k \}) - a _ {k + 1, k} a _ {k, k + 1} \det A (\{1, \dots , k - 1 \}) \\ k = 2, \dots , n - 1. \\ \end{array}

0.9.11 矩阵和 Lagrange 插值法 Vandermonde 矩阵 AMn(F)A \in M_{n}(\mathbf{F}) 是具有形状

A=[1x1x12x13x1n11x2x22x23x2n11xnxn2xn3xnn1](0.9.11.1)A = \left[ \begin{array}{c c c c c c} 1 & x _ {1} & x _ {1} ^ {2} & x _ {1} ^ {3} & \dots & x _ {1} ^ {n - 1} \\ 1 & x _ {2} & x _ {2} ^ {2} & x _ {2} ^ {3} & \dots & x _ {2} ^ {n - 1} \\ \vdots & \vdots & \vdots & \vdots & & \vdots \\ 1 & x _ {n} & x _ {n} ^ {2} & x _ {n} ^ {3} & \dots & x _ {n} ^ {n - 1} \end{array} \right] \tag {0.9.11.1}

的矩阵,其中 x1,x2,,xnFx_{1}, x_{2}, \dots, x_{n} \in \mathbf{F} ;即 A=[aij]A = [a_{ij}] ,其中 aijxii1a_{ij} - x_i^{i-1} 。下述等式成立

detA=1n(x1xj),(0.9.11.2)\det A = \iint_ {1} ^ {n} \left(x _ {1} - x _ {j}\right), \tag {0.9.11.2}

于是,一个Vandermonde矩阵是非奇异的,当且仅当 n\pmb{n} 个参数 x1,x2,,xnx_{1}, x_{2}, \dots, x_{n} 是互异的.

Vandermonde 矩阵出现在插值问题中,所谓插值问题。就是求系数在 F\mathbf{F} 中的、次数至多为 n1n - 1 的多项式 p(x)an1xn1an2xn2++a1x+a0p(x) - a_{n - 1}x^{n - 1} - a_{n - 2}x^{n - 2} + \dots + a_{1}x + a_{0} ,使得

p(x1)a1+a2x1+a2x12an1x1n1=y1,p(x2)=a1+a1x2+a2x22++an1x2n1y2,(0.9.11.3)\begin{array}{l} p \left(x _ {1}\right) - a _ {1} + a _ {2} x _ {1} + a _ {2} x _ {1} ^ {2} \cdot \dots \cdot a _ {n - 1} x _ {1} ^ {n - 1} = y _ {1}, \\ p \left(x _ {2}\right) = a _ {1} + a _ {1} x _ {2} + a _ {2} x _ {2} ^ {2} + \dots + a _ {n - 1} x _ {2} ^ {n - 1} - y _ {2}, \tag {0.9.11.3} \\ \vdots \qquad \vdots \qquad \vdots \qquad \vdots \qquad \vdots \\ \end{array}
p(xn)=a1a1xna2xn=an1xnn1=yn.p \left(x _ {n}\right) = a _ {1} \mid a _ {1} x _ {n} \mid a _ {2} x _ {n} ^ {\prime} \mid \dots = a _ {n - 1} x _ {n} ^ {n - 1} = y _ {n}.

其中 x1,x2,,xnx_{1}, x_{2}, \cdots, x_{n}y1,y2,,yny_{1}, y_{2}, \cdots, y_{n} 是中 F\mathbf{F} 的已知元素。插值条件(0.9.11.3)是关于 nn 个未知系数 a1,a2,,an1a_{1}, a_{2}, \cdots, a_{n-1}nn 个方程的组,并且它们有形式 Aa=yAa = y ,其中 a[a0,a1,,an1]TFn,y[y0,y1,,yn]TFna - [a_{0}, a_{1}, \cdots, a_{n-1}]^{T} \in \mathbf{F}^{n}, y - [y_{0}, y_{1}, \cdots, y_{n}]^{T} \in \mathbf{F}^{n} ,且 AMn(F)A \in M_{n}(\mathbf{F}) 是Vandermonde矩阵(0.9.11.1)。如果点 x1,x2,,xnx_{1}, x_{2}, \cdots, x_{n} 各不相同,这个插值问题总有一个解,因为这时 AA 是非奇异矩阵。

如果点 x1,x2,,xnx_{1}, x_{2}, \cdots, x_{n} 是互异的,插值多项式的系数原则上可以通过解方程组(0.9.11.3)求得。但是,用特殊的Lagrange插值多项式

Li(x)=j=1n(xxi)j=1n(xixj),i1,2,,nL _ {i} (x) = \frac {\prod_ {j = 1} ^ {n} (x - x _ {i})}{\prod_ {j = 1} ^ {n} (x _ {i} - x _ {j})}, i - 1, 2, \dots , n

表示插值多项式 P(x)P(x) 通常更为有效。每个多项式 Li(x)L_{i}(x)n1n - 1 次,且具有性质:如果 kik \neq iLi(xi)=0L_{i}(x_{i}) = 0 ;而 Li(xi)=1L_{i}(x_{i}) = 1 ,因此,对于满足方程组(0.9.11.3)的、次数不超过 n1n - 1 的多项式 p(x)p(x) ,有 Lagrange 插值公式

p(x)=y1L1(x)+y2L2(x)++ynLn(x).(0.9.11.4)p (x) = y _ {1} L _ {1} (x) + y _ {2} L _ {2} (x) + \dots + y _ {n} L _ {n} (x). \tag {0.9.11.4}