0.9 矩阵的特殊形式 经常会遇到某些特殊形式的矩阵,这些矩阵具有特殊的性质。为了参阅,其中有些矩阵值得在这里介绍,并给出其名称。
0.9.1 对角矩阵 如果矩阵 D = { d i j } ∈ M n D = \left\{d_{ij}\right\} \in M_n D = { d ij } ∈ M n 在 j ≠ i j \neq i j = i 时,有 d i j = 0 d_{ij} = 0 d ij = 0 ,就称 D D D 为对角矩阵。平常,把这个矩阵记作 D = diag ( d 11 , … , d n n ) D = \operatorname{diag}(d_{11}, \dots, d_{nn}) D = diag ( d 11 , … , d nn ) 或 D = diag d D = \operatorname{diag} d D = diag d ,其中 d d d 是 D D D 的对角元组成的向量。如果一个对角矩阵的所有对角元都是正(非负)实数,就称它为正(非负)对角矩阵。注意,术语正对角矩阵指的是,矩阵是对角形的,且有正对角元;它不是指那种所有对角元碰巧都是正数的一般矩阵。单位矩阵是正对角矩阵的一个例子。如果对角矩阵 D D D 的诸对角元都相等,就称 D D D 为纯量矩阵;即对某 α ∈ C \alpha \in \mathbf{C} α ∈ C 有 D = α I D = \alpha I D = α I 。一个矩阵左乘或右乘以一个纯量矩阵,与用相应的纯量乘这个矩阵的作用相同。
一个对角矩阵的行列式正好是它的诸对角元之乘积: det D = ∏ i = 1 n d i i \det D = \prod_{i=1}^{n} d_{ii} det D = ∏ i = 1 n d ii 。因而,一个对角矩阵是非奇异的,当且仅当它的所有对角元是非零的。 A ∈ M n A \in M_n A ∈ M n 左乘以对角阵 D D D ,即 D A DA D A ,就是用 D D D 的诸对角元乘 A A A 的各行( A A A 的第 i i i 行乘以 d i d_i d i , i = 1 , 2 , … , n i=1,2,\dots,n i = 1 , 2 , … , n )。而右乘以 D D D ,即 A D AD A D ,就是
用 D D D 的诸对角元乘 A A A 的各列。因此,所有对角矩阵关于乘法相互交换,并且,一个对角矩阵与某个矩阵 A = [ a i j ] ∈ M n A = [a_{ij}] \in M_n A = [ a ij ] ∈ M n 可交换,当且仅当在 D D D 的第 i i i 个对角元与第 j j j 个对角元不相同时,有 a i j = 0 a_{ij} = 0 a ij = 0 。两个对角矩阵的乘积也是对角矩阵,其对角元正好是它们相应的对角元的两两乘积。类似地,可以规定一个对角矩阵的正整数幂。
0.9.2 分块对角矩阵 具有形式 A = [ A 11 0 A 22 ⋱ 0 A k k ] A = \left[ \begin{array}{c c c c} A _ {1 1} & & 0 \\ & A _ {2 2} & & \\ & & \ddots & \\ & 0 & & A _ {k k} \end{array} \right] A = A 11 A 22 0 0 ⋱ A kk 的矩阵 A ∈ M n A \in M_{n} A ∈ M n 称为分块对角矩阵,其中, A i i ∈ M n i A_{ii} \in M_{n_i} A ii ∈ M n i , i = 1 , 2 , … , k i = 1, 2, \dots, k i = 1 , 2 , … , k 且 ∑ i = 1 k n i = n \sum_{i=1}^{k} n_i = n ∑ i = 1 k n i = n 。形式上,这个矩阵常常用 A = Λ 11 ⊕ Λ 22 ⊕ ⋯ ⊕ A k k A = \Lambda_{11} \oplus \Lambda_{22} \oplus \dots \oplus A_{kk} A = Λ 11 ⊕ Λ 22 ⊕ ⋯ ⊕ A kk 来表示,或简记作 ⊕ ∑ i = 1 k A n \oplus \sum_{i=1}^{k} A_n ⊕ ∑ i = 1 k A n ,称这个矩阵为 A 11 A_{11} A 11 , Λ 22 , … , A k k \Lambda_{22}, \dots, A_{kk} Λ 22 , … , A kk 的直和。从分块矩阵的乘法来考虑,分块对角矩阵的许多性质推广了对角矩阵的性质,例如, det ( ⊕ ∑ i = 1 k A u ) = ∏ i = 1 k det A b \operatorname{det} \left( \oplus \sum_{i=1}^{k} A_u \right) = \prod_{i=1}^{k} \operatorname{det} A_b det ( ⊕ ∑ i = 1 k A u ) = ∏ i = 1 k det A b ,因而, Λ = ⊕ ∑ A n \Lambda = \oplus \sum A_n Λ = ⊕ ∑ A n 是非奇异的,当且仅当每个 A n A_n A n 是非奇异的, i = 1 , 2 , … , k i = 1, 2, \dots, k i = 1 , 2 , … , k 。另外,直和 A = ⊕ ∑ i = 1 k A u A = \oplus \sum_{i=1}^{k} A_u A = ⊕ ∑ i = 1 k A u 与 B = ⊕ ∑ i = 1 k B u B = \oplus \sum_{i=1}^{k} B_u B = ⊕ ∑ i = 1 k B u 可交换,其中 A u , B u A_u, B_u A u , B u 是同阶的。当且仅当 A u A_u A u 与 B u B_u B u 可交换, i = 1 , 2 , … , k i = 1, 2, \dots, k i = 1 , 2 , … , k 。还有, rank ( ⊕ ∑ i = 1 k A u ) = ∑ i = 1 k rank A u \operatorname{rank} \left( \oplus \sum_{i=1}^{k} A_u \right) = \sum_{i=1}^{k} \operatorname{rank} A_u rank ( ⊕ ∑ i = 1 k A u ) = ∑ i = 1 k rank A u 。
0.9.3 三角矩阵 如果矩阵 T = [ t i j ] ∈ M n T = [t_{ij}] \in M_n T = [ t ij ] ∈ M n ,当 j < i j < i j < i 时,有 t i j = 0 t_{ij} = 0 t ij = 0 ,就称 T T T 为上三角矩阵。如果当 j ≤ i j \leq i j ≤ i 时, t i j = 0 t_{ij} = 0 t ij = 0 ,就称 T T T 是严格上角矩阵,类似地, T T T 称为下三角(或严格下三角)矩阵,是指它的转置是上三角(或严格上三角)矩阵。与对角矩阵类似,三角矩阵的行列式是它的诸对角元之乘积。三角矩阵(两种中的任一种)不一定与另一种三角矩阵可交换。 A ∈ M n A \in M_n A ∈ M n 左乘以下三角矩阵 L L L ,即 L A LA L A ,就是用 L L L 的第1行至第 i i i 行的线性组合代替 A A A 的第 i i i 行。在述及三角矩阵时,有时采用术语右(代替上)和左(代替下)三角矩阵。三解矩阵的秩至少是(也可能大于)主对角线上非零元的个数。
0.9.4 分块三角矩阵 具有形状 A = [ A 1 t ∗ A 22 0 ⋱ A n k ] A = \left[ \begin{array}{c c c} A _ {1 t} & & * \\ & A _ {2 2} \\ 0 & \ddots & \\ & & A _ {n k} \end{array} \right] A = A 1 t 0 A 22 ⋱ ∗ A nk 的矩阵 A ∈ M n A \in M_{n} A ∈ M n 称为分块上三角矩阵,其中 A n ∈ M n , i = 1 , … , k , ∑ i = 1 k n i = n A_{n} \in M_{n}, i = 1, \dots, k, \sum_{i=1}^{k} n_{i} = n A n ∈ M n , i = 1 , … , k , ∑ i = 1 k n i = n ,而“*”表示任意块元。分块下三角矩阵、严格分块下三角矩阵和严格分块上三角矩阵都可以类似地定义。分块三角矩阵的行列式是诸对角子块的行列式之积。分块三角矩阵的秩至少是(也可能大于)诸对角子块的秩之和。
0.9.5 置换矩阵 如果矩阵 P ∈ M n P \in M_{n} P ∈ M n 在它的每一行和每一列正好有一个元等于1,而其余所有的元都是0,就称 P P P 为置换矩阵。乘以这样一个矩阵的效果是使被乘矩阵的行或列互换。例如
P = [ 0 1 0 1 0 0 0 0 1 ] ∈ M 3 P = \left[ \begin{array}{l l l} 0 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1 \end{array} \right] \in M _ {3} P = 0 1 0 1 0 0 0 0 1 ∈ M 3 是置换矩阵,而
P [ 1 2 3 ] = [ 2 1 3 ] P \left[ \begin{array}{l} 1 \\ 2 \\ 3 \end{array} \right] = \left[ \begin{array}{l} 2 \\ 1 \\ 3 \end{array} \right] P 1 2 3 = 2 1 3 是向量 [ 1 2 3 ] \left[ \begin{array}{l}1\\ 2\\ 3 \end{array} \right] 1 2 3 的行(分量)的互换,即它把第-项换到第2个位置,把第2项换到第1个位置,而让第3项保持在第3个位置.一般地,矩阵 A ∈ M m , n A\in M_{m,n} A ∈ M m , n 左乘以置换矩阵 P ∈ M m P\in M_m P ∈ M m 就是互换 A A A 的行,而矩阵 A ∈ M m , n A\in M_{m,n} A ∈ M m , n 右乘以置换矩阵 P ∈ M n P\in M_n P ∈ M n 就是互换 A A A 的列.实施(0.3.3)的第一种初等变换的矩阵是一个特殊形式的置换矩阵,称之为对换矩阵.
置换矩阵的行列式是 ± 1 \pm 1 ± 1 在(0.3.2)的公式中正好有一个被加项非零],因而置换矩阵一定是非奇异的。虽然置换矩阵关于乘法一般是不交换的,但两个置换矩阵的乘积还是一个置换矩阵。因为单位矩阵是一个置换矩阵,并且对每个置换 P P P ,有 P T = P − 1 P^T = P^{-1} P T = P − 1 。所以,置换矩阵构成 M n M_{n} M n 中的非奇异矩阵群 G L ( n , C ) GL(n, \mathbf{C}) G L ( n , C ) 的一个子群,它具有有限基数 n ! n! n ! 。事实上,任一置换矩阵是一些对换矩阵的乘积。
因为,如果置换矩阵 P ∈ M n P \in M_{n} P ∈ M n 以某种方式互换行,则 P T − P P^T - P P T − P 就以同一方式互换列,所以,变换 A → P A P T A \to PAP^T A → P A P T 以相同的方式互换 A ∈ M n A \in M_{n} A ∈ M n 的行和列,这个变换相当于重排诸元的足码。如果矩阵 A ∈ M n A \in M_{n} A ∈ M n 有某个置换矩阵 P P P 使得 P A P T PAP^T P A P T 是三角矩阵,就称 A A A 为本性三角矩阵。这些矩阵与三角矩阵有许多共同之处。
0.9.6 轮换矩阵 具有形状 A = [ a 1 a 2 … a n a n a 1 a 2 … a n − 1 a n − 1 a n a 1 … a n − 2 ⋮ ⋮ ⋱ ⋱ ⋮ a 2 a 3 … a n a 1 ] A = \left[ \begin{array}{c c c c c} a _ {1} & a _ {2} & & \dots & a _ {n} \\ a _ {n} & a _ {1} & a _ {2} & \dots & a _ {n - 1} \\ a _ {n - 1} & a _ {n} & a _ {1} & \dots & a _ {n - 2} \\ \vdots & \vdots & \ddots & \ddots & \vdots \\ a _ {2} & a _ {3} & \dots & a _ {n} & a _ {1} \end{array} \right] A = a 1 a n a n − 1 ⋮ a 2 a 2 a 1 a n ⋮ a 3 a 2 a 1 ⋱ … … … … ⋱ a n a n a n − 1 a n − 2 ⋮ a 1 的矩阵称为轮换矩阵。每一行正好是前一行循环一步,使得每一行各元刚好是前一行的各元的一个循环排列。置换矩阵
C = [ 0 1 0 … 0 0 1 ⋮ ⋮ ⋱ 0 ⋱ 0 1 1 0 … 0 ] C = \left[ \begin{array}{c c c c c} 0 & 1 & 0 & \dots & 0 \\ & 0 & 1 & & \vdots \\ \vdots & & & & \\ & & & \ddots & 0 \\ & & & \ddots & \\ 0 & & & & 1 \\ 1 & 0 & & \dots & 0 \end{array} \right] C = 0 ⋮ 0 1 1 0 0 0 1 … ⋱ ⋱ … 0 ⋮ 0 1 0 称为基本轮换转置矩阵。矩阵 A ∈ M n A \in M_{n} A ∈ M n 可以写成形式
A = ∑ k = 1 n − 1 a k + 1 C k A = \sum_ {k = 1} ^ {n - 1} a _ {k + 1} C ^ {k} A = k = 1 ∑ n − 1 a k + 1 C k 当且仅当 A A A 是轮换矩阵。这里 C n = I ≡ C m C^{n} = I \equiv C^{m} C n = I ≡ C m ,而系数 a 1 , a 2 , ⋯ , a n a_{1}, a_{2}, \cdots, a_{n} a 1 , a 2 , ⋯ , a n 正好是 A A A 的第 1 行的诸元。因为这个表达式,轮换矩阵具有与 C C C 相关联的优美结构。又因为 C n = I C^{n} = I C n = I ,所以两个轮换矩阵的乘积还是一个轮换矩阵。另外,轮换矩阵在乘法下交换。轮换矩阵有几种推广,例如其中之一,把各行向前(或向右)循环一个大于 1 的固定步数。
26
0.9.7 Toeplitz 矩阵 具有形状
A − [ a 0 a 1 a 2 … a n a − 1 a 0 a 1 … a n − 1 a − 2 a 1 a 0 … a n − 2 ⋮ ⋮ ⋱ ⋱ ⋮ a n + 1 a n − 2 ⋱ a 0 a 1 a − n a n + 1 … a − 1 a 1 ] A - \left[ \begin{array}{c c c c c} a _ {0} & a _ {1} & a _ {2} & \dots & a _ {n} \\ a _ {- 1} & a _ {0} & a _ {1} & \dots & a _ {n - 1} \\ a _ {- 2} & a _ {1} & a _ {0} & \dots & a _ {n - 2} \\ \vdots & \vdots & \ddots & \ddots & \vdots \\ a _ {n + 1} & a _ {n - 2} & \ddots & a _ {0} & a _ {1} \\ a _ {- n} & a _ {n + 1} & \dots & a _ {- 1} & a _ {1} \end{array} \right] A − a 0 a − 1 a − 2 ⋮ a n + 1 a − n a 1 a 0 a 1 ⋮ a n − 2 a n + 1 a 2 a 1 a 0 ⋱ ⋱ … … … … ⋱ a 0 a − 1 a n a n − 1 a n − 2 ⋮ a 1 a 1 的矩阵 A = { a n } ∈ M n + 1 A = \{a_{n}\} \in M_{n + 1} A = { a n } ∈ M n + 1 称为Toeplitz矩阵.对于某个给定的序列 a n , a n + 1 , … , a n − 1 , a 0 , a 1 , a 2 , … , a n − 1 , a n ∈ C a_{n}, a_{n + 1}, \dots, a_{n - 1}, a_{0}, a_{1}, a_{2}, \dots, a_{n - 1}, a_{n} \in \mathbb{C} a n , a n + 1 , … , a n − 1 , a 0 , a 1 , a 2 , … , a n − 1 , a n ∈ C ,一般项 a n = a j a_{n} = a_{j} a n = a j 沿着平行于主对角线的诸对角线从上到下, A A A 的各元取常值.Toeplitz矩阵
B = [ 0 1 0 ⋱ ⋱ ⋱ ⋱ 1 0 0 ] 和 F = [ 0 0 1 ⋱ ⋱ ⋱ ⋱ ⋱ 1 0 ⋱ 1 ] B = \left[ \begin{array}{c c c c} 0 & 1 & & & 0 \\ & & \ddots & & \\ & & \ddots & \ddots & \\ & & & \ddots & 1 \\ 0 & & & & 0 \end{array} \right] \quad \text {和} \quad F = \left[ \begin{array}{c c c c} 0 & & & & 0 \\ 1 & & \ddots & & \\ & \ddots & & \ddots & \\ & & \ddots & \ddots & \\ & & 1 & & \\ & 0 & & \ddots & 1 \end{array} \right] B = 0 0 1 ⋱ ⋱ ⋱ ⋱ 0 1 0 和 F = 0 1 ⋱ 0 ⋱ ⋱ 1 ⋱ ⋱ ⋱ 0 1 称为“后向位移”矩阵和“前向位移”矩阵,这是因它们在标准基 { e 1 , e 2 , … , e n + 1 } \{e_1, e_2, \dots, e_{n+1}\} { e 1 , e 2 , … , e n + 1 } 的诸元上的作用而得名。矩阵 A ∈ M n + 1 A \in M_{n+1} A ∈ M n + 1 可以写成形式
A = ∑ k = 1 n a k F k − ∑ k = 0 n a k B k A = \sum_ {k = 1} ^ {n} a _ {k} F ^ {k} - \sum_ {k = 0} ^ {n} a _ {k} B ^ {k} A = k = 1 ∑ n a k F k − k = 0 ∑ n a k B k 当且仅当 Λ \pmb{\Lambda} Λ 是Toeplitz矩阵.在涉及三角矩的问题中,自然要遇到Toplitz矩阵.
0.9.8 Hankel 矩阵 具有形状
A − [ a 0 a 1 a 2 … a n a 1 a 2 a 3 … a n − 1 a 2 a 3 a 4 … a n − 2 ⋮ ⋮ ⋮ ⋮ a n − 1 a n a n − 1 … a 2 n − 1 ⋮ ⋮ ⋮ ⋮ a n a n + 1 a n + 2 … a 2 n ] A - \left[ \begin{array}{c c c c c} a _ {0} & a _ {1} & a _ {2} & \dots & a _ {n} \\ a _ {1} & a _ {2} & a _ {3} & \dots & a _ {n - 1} \\ a _ {2} & a _ {3} & a _ {4} & \dots & a _ {n - 2} \\ \vdots & \vdots & \vdots & & \vdots \\ a _ {n - 1} & a _ {n} & a _ {n - 1} & \dots & a _ {2 n - 1} \\ \vdots & \vdots & \vdots & & \vdots \\ a _ {n} & a _ {n + 1} & a _ {n + 2} & \dots & a _ {2 n} \end{array} \right] A − a 0 a 1 a 2 ⋮ a n − 1 ⋮ a n a 1 a 2 a 3 ⋮ a n ⋮ a n + 1 a 2 a 3 a 4 ⋮ a n − 1 ⋮ a n + 2 … … … … … a n a n − 1 a n − 2 ⋮ a 2 n − 1 ⋮ a 2 n 27!
的矩阵 A ∈ M n + 1 A \in M_{n+1} A ∈ M n + 1 称为 Hankel 矩阵。对于某个给定的序列 a 0 , a 1 , a 2 , ⋯ , a 2 n − 1 , a 2 n a_0, a_1, a_2, \cdots, a_{2n-1}, a_{2n} a 0 , a 1 , a 2 , ⋯ , a 2 n − 1 , a 2 n ,一般项
a n − a n + 1 a_{n} - a_{n + 1} a n − a n + 1 ,.沿着与主对角线垂直的诸对角线, A A A 的各元取常值,在涉及幂矩的问题中,自然要遇到Hankel矩阵.注意,如果
P = [ 0 1 1 ⋱ 1 1 0 ] P = \left[ \begin{array}{c c c c} 0 & & & 1 \\ & & 1 \\ & \ddots & \\ 1 & & \\ 1 & & 0 \end{array} \right] P = 0 1 1 ⋱ 1 0 1 称之为“后向单位”(置换)矩阵,那么,对任意 Toeplitz 矩阵 T T T , P T PT PT 是 Hankel 矩阵,而对于任意 Hankel 矩阵 H H H , P H PH P H 是 Toeplitz 矩阵。因为, P = P T = P − 1 P = P^T = P^{-1} P = P T = P − 1 和 Hankel 矩阵是对称的,这表明任一 Toeplitz 矩阵是两个对称矩阵( P P P 和 Hankel 矩阵)的乘积。
0.9.9 Hessenberg 矩阵 如果矩阵 A = [ a i j ] ∈ M n A = [a_{ij}] \in M_n A = [ a ij ] ∈ M n 对于 i > j + 1 i > j + 1 i > j + 1 有 a i j = 0 a_{ij} = 0 a ij = 0 :
A = [ a 11 a 12 … a 1 n a 21 a 22 0 a 32 ⋱ ⋮ ⋮ 0 ⋱ ⋮ ⋱ 0 0 … 0 a n , n − 1 a n , n ] A = \left[ \begin{array}{c c c c c} a _ {1 1} & a _ {1 2} & \dots & & a _ {1 n} \\ a _ {2 1} & a _ {2 2} & & & \\ 0 & a _ {3 2} & \ddots & & \vdots \\ \vdots & 0 & \ddots & & \\ & \vdots & \ddots & & \\ 0 & 0 & \dots 0 & a _ {n, n - 1} & a _ {n, n} \end{array} \right] A = a 11 a 21 0 ⋮ 0 a 12 a 22 a 32 0 ⋮ 0 … ⋱ ⋱ ⋱ … 0 a n , n − 1 a 1 n ⋮ a n , n 就称 A A A 呈上Hessenberg形状,或称 A A A 是上Hessenberg矩阵.如果 A T A^T A T 是上Hessenberg矩阵,就称 A ∈ M n A \in M_n A ∈ M n 为下Hessenberg矩阵.
0.9.10 三对角矩阵 如果矩阵 A = [ a i j ] ∈ M n A = [a_{ij}] \in M_n A = [ a ij ] ∈ M n 既是上,又是下Hessenberg矩阵,就称之为三对角矩阵。即, A A A 是三对角矩阵,是指当 ∣ i − j ∣ > 1 |i - j| > 1 ∣ i − j ∣ > 1 时, a i j = 0 a_{ij} = 0 a ij = 0 :
A = [ a 11 a 12 a 01 a 22 a 23 a 12 a 33 ⋱ ⋱ a n − 1 , n 0 a n , n − 1 a n , n ] . A = \left[ \begin{array}{c c c c c} a _ {1 1} & a _ {1 2} & & & \\ a _ {0 1} & a _ {2 2} & a _ {2 3} & & \\ & a _ {1 2} & a _ {3 3} & & \\ & & & \ddots & \\ & & & \ddots & \\ & & & a _ {n - 1, n} & \\ 0 & & a _ {n, n - 1} & & a _ {n, n} \end{array} \right]. A = a 11 a 01 0 a 12 a 22 a 12 a 23 a 33 a n , n − 1 ⋱ ⋱ a n − 1 , n a n , n . [28] 用归纳法容易计算三对角矩阵的行列式. 注意
det A ( { 1 , 2 , … , k + 1 } ) = a k + 1 , k − 1 det A ( { 1 , … , k } ) − a k + 1 , k a k , k + 1 det A ( { 1 , … , k − 1 } ) k = 2 , … , n − 1. \begin{array}{l} \det A (\{1, 2, \dots , k + 1 \}) \\ = a _ {k + 1, k - 1} \det A (\{1, \dots , k \}) - a _ {k + 1, k} a _ {k, k + 1} \det A (\{1, \dots , k - 1 \}) \\ k = 2, \dots , n - 1. \\ \end{array} det A ({ 1 , 2 , … , k + 1 }) = a k + 1 , k − 1 det A ({ 1 , … , k }) − a k + 1 , k a k , k + 1 det A ({ 1 , … , k − 1 }) k = 2 , … , n − 1. 0.9.11 矩阵和 Lagrange 插值法 Vandermonde 矩阵 A ∈ M n ( F ) A \in M_{n}(\mathbf{F}) A ∈ M n ( F ) 是具有形状
A = [ 1 x 1 x 1 2 x 1 3 … x 1 n − 1 1 x 2 x 2 2 x 2 3 … x 2 n − 1 ⋮ ⋮ ⋮ ⋮ ⋮ 1 x n x n 2 x n 3 … x n n − 1 ] (0.9.11.1) A = \left[ \begin{array}{c c c c c c} 1 & x _ {1} & x _ {1} ^ {2} & x _ {1} ^ {3} & \dots & x _ {1} ^ {n - 1} \\ 1 & x _ {2} & x _ {2} ^ {2} & x _ {2} ^ {3} & \dots & x _ {2} ^ {n - 1} \\ \vdots & \vdots & \vdots & \vdots & & \vdots \\ 1 & x _ {n} & x _ {n} ^ {2} & x _ {n} ^ {3} & \dots & x _ {n} ^ {n - 1} \end{array} \right] \tag {0.9.11.1} A = 1 1 ⋮ 1 x 1 x 2 ⋮ x n x 1 2 x 2 2 ⋮ x n 2 x 1 3 x 2 3 ⋮ x n 3 … … … x 1 n − 1 x 2 n − 1 ⋮ x n n − 1 ( 0.9.11.1 ) 的矩阵,其中 x 1 , x 2 , … , x n ∈ F x_{1}, x_{2}, \dots, x_{n} \in \mathbf{F} x 1 , x 2 , … , x n ∈ F ;即 A = [ a i j ] A = [a_{ij}] A = [ a ij ] ,其中 a i j − x i i − 1 a_{ij} - x_i^{i-1} a ij − x i i − 1 。下述等式成立
det A = ∬ 1 n ( x 1 − x j ) , (0.9.11.2) \det A = \iint_ {1} ^ {n} \left(x _ {1} - x _ {j}\right), \tag {0.9.11.2} det A = ∬ 1 n ( x 1 − x j ) , ( 0.9.11.2 ) 于是,一个Vandermonde矩阵是非奇异的,当且仅当 n \pmb{n} n 个参数 x 1 , x 2 , … , x n x_{1}, x_{2}, \dots, x_{n} x 1 , x 2 , … , x n 是互异的.
Vandermonde 矩阵出现在插值问题中,所谓插值问题。就是求系数在 F \mathbf{F} F 中的、次数至多为 n − 1 n - 1 n − 1 的多项式 p ( x ) − a n − 1 x n − 1 − a n − 2 x n − 2 + ⋯ + a 1 x + a 0 p(x) - a_{n - 1}x^{n - 1} - a_{n - 2}x^{n - 2} + \dots + a_{1}x + a_{0} p ( x ) − a n − 1 x n − 1 − a n − 2 x n − 2 + ⋯ + a 1 x + a 0 ,使得
p ( x 1 ) − a 1 + a 2 x 1 + a 2 x 1 2 ⋅ ⋯ ⋅ a n − 1 x 1 n − 1 = y 1 , p ( x 2 ) = a 1 + a 1 x 2 + a 2 x 2 2 + ⋯ + a n − 1 x 2 n − 1 − y 2 , ⋮ ⋮ ⋮ ⋮ ⋮ (0.9.11.3) \begin{array}{l} p \left(x _ {1}\right) - a _ {1} + a _ {2} x _ {1} + a _ {2} x _ {1} ^ {2} \cdot \dots \cdot a _ {n - 1} x _ {1} ^ {n - 1} = y _ {1}, \\ p \left(x _ {2}\right) = a _ {1} + a _ {1} x _ {2} + a _ {2} x _ {2} ^ {2} + \dots + a _ {n - 1} x _ {2} ^ {n - 1} - y _ {2}, \tag {0.9.11.3} \\ \vdots \qquad \vdots \qquad \vdots \qquad \vdots \qquad \vdots \\ \end{array} p ( x 1 ) − a 1 + a 2 x 1 + a 2 x 1 2 ⋅ ⋯ ⋅ a n − 1 x 1 n − 1 = y 1 , p ( x 2 ) = a 1 + a 1 x 2 + a 2 x 2 2 + ⋯ + a n − 1 x 2 n − 1 − y 2 , ⋮ ⋮ ⋮ ⋮ ⋮ ( 0.9.11.3 ) p ( x n ) = a 1 ∣ a 1 x n ∣ a 2 x n ′ ∣ ⋯ = a n − 1 x n n − 1 = y n . p \left(x _ {n}\right) = a _ {1} \mid a _ {1} x _ {n} \mid a _ {2} x _ {n} ^ {\prime} \mid \dots = a _ {n - 1} x _ {n} ^ {n - 1} = y _ {n}. p ( x n ) = a 1 ∣ a 1 x n ∣ a 2 x n ′ ∣ ⋯ = a n − 1 x n n − 1 = y n . 其中 x 1 , x 2 , ⋯ , x n x_{1}, x_{2}, \cdots, x_{n} x 1 , x 2 , ⋯ , x n 和 y 1 , y 2 , ⋯ , y n y_{1}, y_{2}, \cdots, y_{n} y 1 , y 2 , ⋯ , y n 是中 F \mathbf{F} F 的已知元素。插值条件(0.9.11.3)是关于 n n n 个未知系数 a 1 , a 2 , ⋯ , a n − 1 a_{1}, a_{2}, \cdots, a_{n-1} a 1 , a 2 , ⋯ , a n − 1 的 n n n 个方程的组,并且它们有形式 A a = y Aa = y A a = y ,其中 a − [ a 0 , a 1 , ⋯ , a n − 1 ] T ∈ F n , y − [ y 0 , y 1 , ⋯ , y n ] T ∈ F n a - [a_{0}, a_{1}, \cdots, a_{n-1}]^{T} \in \mathbf{F}^{n}, y - [y_{0}, y_{1}, \cdots, y_{n}]^{T} \in \mathbf{F}^{n} a − [ a 0 , a 1 , ⋯ , a n − 1 ] T ∈ F n , y − [ y 0 , y 1 , ⋯ , y n ] T ∈ F n ,且 A ∈ M n ( F ) A \in M_{n}(\mathbf{F}) A ∈ M n ( F ) 是Vandermonde矩阵(0.9.11.1)。如果点 x 1 , x 2 , ⋯ , x n x_{1}, x_{2}, \cdots, x_{n} x 1 , x 2 , ⋯ , x n 各不相同,这个插值问题总有一个解,因为这时 A A A 是非奇异矩阵。
如果点 x 1 , x 2 , ⋯ , x n x_{1}, x_{2}, \cdots, x_{n} x 1 , x 2 , ⋯ , x n 是互异的,插值多项式的系数原则上可以通过解方程组(0.9.11.3)求得。但是,用特殊的Lagrange插值多项式
L i ( x ) = ∏ j = 1 n ( x − x i ) ∏ j = 1 n ( x i − x j ) , i − 1 , 2 , … , n L _ {i} (x) = \frac {\prod_ {j = 1} ^ {n} (x - x _ {i})}{\prod_ {j = 1} ^ {n} (x _ {i} - x _ {j})}, i - 1, 2, \dots , n L i ( x ) = ∏ j = 1 n ( x i − x j ) ∏ j = 1 n ( x − x i ) , i − 1 , 2 , … , n 表示插值多项式 P ( x ) P(x) P ( x ) 通常更为有效。每个多项式 L i ( x ) L_{i}(x) L i ( x ) 为 n − 1 n - 1 n − 1 次,且具有性质:如果 k ≠ i k \neq i k = i , L i ( x i ) = 0 L_{i}(x_{i}) = 0 L i ( x i ) = 0 ;而 L i ( x i ) = 1 L_{i}(x_{i}) = 1 L i ( x i ) = 1 ,因此,对于满足方程组(0.9.11.3)的、次数不超过 n − 1 n - 1 n − 1 的多项式 p ( x ) p(x) p ( x ) ,有 Lagrange 插值公式
p ( x ) = y 1 L 1 ( x ) + y 2 L 2 ( x ) + ⋯ + y n L n ( x ) . (0.9.11.4) p (x) = y _ {1} L _ {1} (x) + y _ {2} L _ {2} (x) + \dots + y _ {n} L _ {n} (x). \tag {0.9.11.4} p ( x ) = y 1 L 1 ( x ) + y 2 L 2 ( x ) + ⋯ + y n L n ( x ) . ( 0.9.11.4 )