0.2 矩阵 这里所研究的对象可以用两种重要的方式来考察:一是把它看成纯量的矩形阵列,一是给每个空间指定一个基,然后把它看作两个向量空间之间的线性变换。
0.2.1 矩形阵列 一个矩阵是由域 F \mathbf{F} F 中若干个纯量组成的一个 m × n m \times n m × n 阵列。如果 m = n m = n m = n ,就称矩阵是方阵。 F \mathbf{F} F 上的所有 m × n m \times n m × n 的矩阵集合用 M m , n ( F ) M_{m,n}(\mathbf{F}) M m , n ( F ) 来表示,而 M n , n ( F ) M_{n,n}(\mathbf{F}) M n , n ( F ) 简记为 M n ( F ) M_{n}(\mathbf{F}) M n ( F ) 。最常见的情形是 F = C \mathbf{F} = \mathbf{C} F = C (复数域)。还把 M n ( C ) M_{n}(\mathbf{C}) M n ( C ) 简记为 M n M_{n} M n , M m , n ( C ) M_{m,n}(\mathbf{C}) M m , n ( C ) 简记为 M m , n M_{m,n} M m , n ,通常用大写字母来表示矩阵。例如,如果
A = ∣ 2 − 3 2 0 − 1 π 4 . A = \begin{array}{c c c c} | & 2 & - \frac {3}{2} & 0 \\ - & 1 & \pi & 4 \end{array} . A = ∣ − 2 1 − 2 3 π 0 4 . 那么 A ∈ M 2 , 3 ( R ) A \in M_{2,3}(\mathbf{R}) A ∈ M 2 , 3 ( R ) 。一个给定矩阵的子矩阵是位于该矩阵的一些指定的行和列的矩形阵列,例如, ∣ π , 4 ] |\pi, 4] ∣ π , 4 ] 是上述 A A A 的子矩阵(位于第2行,第2列,第3列)。
0.2.2 线性变换 设 U U U 和 V V V 分别是同一个纯量域 F \mathbf{F} F 上的 n n n 维向量空间和 m m m 维向量空间:设 β 1 , β 2 \beta_{1}, \beta_{2} β 1 , β 2 和 β 3 \beta_{3} β 3 分别是 U U U 和 V V V 的基。我们可以分别用同构 r → [ r ] α 1 r \rightarrow [r]_{\alpha_{1}} r → [ r ] α 1 和 y → [ y ] α 2 y \rightarrow [y]_{\alpha_{2}} y → [ y ] α 2 把 U U U 和 V V V 中的向量表示成 F \mathbf{F} F 上的 n n n 元组和 m m m 元组。一个线性变换是一个函数 T : U → V T: U \rightarrow V T : U → V ,使得对于任意纯量 a 1 a_{1} a 1 和 a 2 a_{2} a 2 ,以及向量 x 1 x_{1} x 1 和 x 2 x_{2} x 2 ,都有 T ( a 1 r 1 ∣ a 2 s 1 ) = a 1 T ( r 1 ) + a 2 T ( x 2 ) T(a_{1}r_{1} | a_{2}s_{1}) = a_{1}T(r_{1}) + a_{2}T(x_{2}) T ( a 1 r 1 ∣ a 2 s 1 ) = a 1 T ( r 1 ) + a 2 T ( x 2 ) 。一个矩阵 A ∈ M m , n ( F ) A \in M_{m,n}(\mathbf{F}) A ∈ M m , n ( F ) 可以用下述方式对应于一个线性变换 T : U → V T: U \rightarrow V T : U → V :向量 y = T ( x ) y = T(x) y = T ( x ) 当且仅当 [ y ] α 1 = A [ x ] α 2 [y]_{\alpha_{1}} = A[x]_{\alpha_{2}} [ y ] α 1 = A [ x ] α 2 。这时就称矩阵 A A A 表示线性变换 T T T (关于基 β 1 \beta_{1} β 1 和 β 2 \beta_{2} β 2 ):表示矩阵 A A A 与基的选择有关,在讨论矩阵时,要意识到是在讨论关于特别选定的基下的线性交换,但借助于什么基,一般不必明言。
0.2.3 与一个已知矩阵或线性交换相关联的向量空间 不失一般性, 使 F \mathbf{F} F 上的 n n n 维向量空间与 F n \mathbf{F}^n F n 相对应, 于是, 就把 A ∈ M n , n ( F ) A \in M_{n,n}(\mathbf{F}) A ∈ M n , n ( F ) 看作从 F n \mathbf{F}^n F n 到 F m \mathbf{F}^m F m 的线性变换 (同时也看作一个阵列). 这样一个线性变换的定义域是 F n \mathbf{F}^n F n : 它的值域是 { y ∈ F m : y − A x \{y \in \mathbf{F}^m : y - A_x { y ∈ F m : y − A x , 对所有 x ∈ F n } x \in \mathbf{F}^n\} x ∈ F n } . Λ \Lambda Λ 的零空间是 { x ∈ F n : A x = 0 } \{x \in \mathbf{F}^n : Ax = 0\} { x ∈ F n : A x = 0 } . Λ \Lambda Λ 的值域是 F m \mathbf{F}^m F m 的子空间, 而 Λ \Lambda Λ 的零空间是 F n \mathbf{F}^n F n 的子空间. 关于这两个子空间的关系式是:
n = A 的 零 空 间 的 维 数 + A 的 值 域 的 维 数 . n = A \text {的 零 空 间 的 维 数} + A \text {的 值 域 的 维 数}. n = A 的 零 空 间 的 维 数 + A 的 值 域 的 维 数 . 0.2.4 矩阵运算 矩阵加法定义为两个同维阵列按对应元相加,并且用 + ( A : B ) +(A:B) + ( A : B ) 表示。它对应线性变换的加法(关于相同的基),且继承了从纯量域来的交换性和结合性。零矩阵(所有元全为 0 的矩阵)是矩阵加法的单位元,并且 M m , n ( F ) M_{m,n}(\mathbf{F}) M m , n ( F ) 自身也是 F \mathbf{F} F 上的向量空间。按通常方式定义的矩阵乘法用 A B AB A B 来表示,它与线性交换的复合相对应。这样,只有当 A ∈ M m , n ( F ) A \in M_{m,n}(\mathbf{F}) A ∈ M m , n ( F ) , B ∈ B \in B ∈
5 \boxed{5} 5 M p , n ( F ) M_{p,n}(\mathbf{F}) M p , n ( F ) ,且 p = n p = n p = n 时,它才有定义;它是结合的,一般是不交换的,例如,
[ 1 0 0 2 ] [ 1 2 3 4 ] ≠ [ 1 2 3 4 ] [ 1 0 0 2 ] . \left[ \begin{array}{l l} 1 & 0 \\ 0 & 2 \end{array} \right] \left[ \begin{array}{l l} 1 & 2 \\ 3 & 4 \end{array} \right] \neq \left[ \begin{array}{l l} 1 & 2 \\ 3 & 4 \end{array} \right] \left[ \begin{array}{l l} 1 & 0 \\ 0 & 2 \end{array} \right]. [ 1 0 0 2 ] [ 1 3 2 4 ] = [ 1 3 2 4 ] [ 1 0 0 2 ] . 但是,当把矩阵限制在 M n ( F ) M_{n}(\mathbf{F}) M n ( F ) 的某些有研究价值的子集时,它可以是交换的。矩阵乘法有一个单位元,即形如
I − [ 1 0 1 ⋱ 0 1 ] I - \left[ \begin{array}{c c c} 1 & & 0 \\ & 1 & \\ & & \\ & & \ddots \\ 0 & & 1 \end{array} \right] I − 1 0 1 0 ⋱ 1 的矩阵 I ∈ M n ( F ) I \in M_{n}(\mathbf{F}) I ∈ M n ( F ) 。这个矩阵以及它的所有纯量倍数(称为纯量矩阵)与 M n ( F ) M_{n}(\mathbf{F}) M n ( F ) 中的所有其他矩阵都可交换,并且只有纯量矩阵具有这一性质。矩阵乘法对于矩阵加法是分配的。
这里需要指出,我们总是用符号 0 0 0 表示以下各种术语:零纯量、零向量(所有分量都等于零纯量的向量)和零矩阵(所有的元都等于零纯量)。一般地,上下文将明确它是哪种情形,因而不会引起混淆。我们还用符号 I I I 表示任意阶数的单位矩阵。如果可能引起混淆,就指明其阶数。
0.2.5 转置与Hermite伴随 如果 λ = [ a i j ] ∈ M m , n ( F ) \lambda = [a_{ij}] \in M_{m,n}(\mathbf{F}) λ = [ a ij ] ∈ M m , n ( F ) , λ \lambda λ 的转置,记作 A i A^i A i ,是 M n , m ( F ) M_{n,m}(\mathbf{F}) M n , m ( F ) 中的一个矩阵,它的元是 a i j a_{ij} a ij ;即将原矩阵行与列调换,反之亦然。例如,
1 2 3 ↓ 4 5 6 = 1 47 2 5 3 6 . \begin{array}{c c c} 1 & 2 & 3 \\ \downarrow 4 & 5 & 6 \end{array} = \begin{array}{c c} 1 & 4 7 \\ 2 & 5 \\ 3 & 6 \end{array} . 1 ↓ 4 2 5 3 6 = 1 2 3 47 5 6 . 显然, ( A ⊺ ) ⊺ = A (A^{\intercal})^{\intercal} = A ( A ⊺ ) ⊺ = A 。 A ∈ M m , n ( C ) A \in M_{m,n}(\mathbf{C}) A ∈ M m , n ( C ) 的Hermite伴随 A ⋆ A^{\star} A ⋆ 定义为 A ⋆ = A ⊺ A^{\star} = A^{\intercal} A ⋆ = A ⊺ ,其中 A ˉ \bar{A} A ˉ 表示按分量取共轭。例如,
[ 1 + i 2 − 3 − 2 i ] ∗ = [ 1 − i − 3 2 + i 2 i ] . \left[ \begin{array}{l l} 1 + i & 2 \\ - 3 & - 2 i \end{array} \right] ^ {*} = \left[ \begin{array}{l l} 1 - i & - 3 \\ 2 + i & 2 i \end{array} \right]. [ 1 + i − 3 2 − 2 i ] ∗ = [ 1 − i 2 + i − 3 2 i ] . 转置和Hermite伴随[以及将在(0.5)中讨论的矩阵的逆]都服从倒序律: [ A B ] ∗ = B ∗ A ∗ [AB]^* = B^* A^* [ A B ] ∗ = B ∗ A ∗ 和 [ A B ] t = B T A T [AB]^t = B^T A^T [ A B ] t = B T A T ,当然要假定乘积有定义.对于乘积的共轭,不存在倒序: A B ‾ = A B A\overline{B} = AB A B = A B ,如果 x x x y ∈ M n , 1 = C n y\in M_{n,1} = \mathbf{C}^{n} y ∈ M n , 1 = C n ,那么 y ′ x y^{\prime}x y ′ x 是纯量,并且它的Hermite伴随与它的复共轭相同;因此, ( y ∗ x ) ∗ = (y^{*}x)^{*}= ( y ∗ x ) ∗ = y ∗ ‾ x ‾ = x ∗ y = y ∗ x . \overline{y^{*}}\overline{x} = x^{*}y = y^{*}x. y ∗ x = x ∗ y = y ∗ x .
0.2.6 矩阵乘法的技巧 这里,给出几个要反复用到的矩阵乘法的简单性质。
如果 b j b_{j} b j 表示矩阵 B B B 的第 j j j 列,那么乘积 A B AB A B 的第 j j j 列正好是 A b j Ab_{j} A b j .
如果 a i a_{i} a i 表示矩阵 A A A 的第 i i i 行,那么乘积 A B AB A B 的第 i i i 行正好是 a i B a_{i}B a i B .
解释一下,在乘积 A B AB A B 中,左乘以 A A A 是乘 B B B 的列,而右乘以 B B B 是乘 A A A 的行。对其中一个因子是对角矩阵的情形,在(0.9.1)中再讨论。
如果 A ∈ M m , n ( F ) A \in M_{m,n}(\mathbf{F}) A ∈ M m , n ( F ) ,且 x ∈ F n x \in \mathbf{F}^n x ∈ F n ,那么 Λ x \Lambda_x Λ x 是(以 r r r 的坐标为系数的) A A A 的各列的线性组合。
如果 A ∈ M m , n ( F ) A \in M_{m,n}(\mathbf{F}) A ∈ M m , n ( F ) ,且 y ∈ F n y \in \mathbf{F}^n y ∈ F n ,那么 y T A y^T A y T A 是(以 y y y 的坐标为系数的) A A A 的各行的线性组合。