2._矩阵的定义

线性方程组

先看一个二元一次方程组:

{2x+y=4x2y=1\left\{\begin{array}{l} 2 x+y=4 \\ x-2 y=-1 \end{array}\right.

这是一个含有22个未知数,22个等式的方程,我们把他的系数提取出来,排成一个数表,就形成了一个矩阵,如下

A=(2112)\boldsymbol{A}=\left(\begin{array}{ccc} 2 & 1 \\ 1 & -2 \\ \end{array}\right)

这样一个数表为称作矩阵

如果把等号右边的常数项也加进去,如下面所示

A=(214121)\boldsymbol{A}=\left(\begin{array}{ccc} 2 & 1 &4 \\ 1 & -2 & -1 \\ \end{array}\right)

这样,也形成了一个矩阵被称为增广矩阵

矩阵的记法

上面对矩阵的记法使用的是大括号,在有些教程里,使用的是方括号,即

A=[2112]\boldsymbol{A}=\left[\begin{array}{ccc} 2 & 1 \\ 1 & -2 \\ \end{array}\right]

矩阵的写法有 大括号中括号两种写法,这两种写法一种源自苏联,一种源自美国。 早期教程在排版方面,因为大括号比方括号容易排版,所以多使用大括号。 随着计算机发展,现代教程多使用方括号。

行列式的矩阵表示法

如果把上面方程的系数取出来,就组成了一个行列式:

A=2112|A|=\left|\begin{array}{ccc} 2 & 1 \\ 1 & -2 \\ \end{array}\right|

因为,这个行列式来自矩阵,所以,为了方便,对于一个矩阵AA 使用

detA=Adet A=|A|

表示 矩阵A对应的行列式。

对角矩阵

形如

A=(λ1λ2λn)A=\left(\begin{array}{llll} \lambda_1 & & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & & \lambda_n \end{array}\right)

的矩阵称作对角矩阵,此时可以写成

A=diag(λ1,λ2,,λn)A=\operatorname{diag}\left(\lambda_1, \lambda_2, \cdots, \lambda_n\right)

奇异矩阵/非奇异矩阵

如果方程A0|A| \ne 0,则成AA非奇异矩阵(也叫非退化矩阵满秩矩阵

如果方程A=0|A| = 0,则成AA奇异矩阵(也叫退化矩阵降秩矩阵

矩阵的定义

mm 个方程 nn 个末知量 x1,x2,,xnx_1, x_2, \cdots, x_n 构成的线性方程组可以表示为:

{a11x1+a12x2++a1nxn=b1,a21x1+a22x2++a2nxn=b2,am1x1+am2x2++amnxn=bm,...(1)\left\{\begin{array}{c} a_{11} x_1+a_{12} x_2+\cdots+a_{1 n} x_n=b_1, \\ a_{21} x_1+a_{22} x_2+\cdots+a_{2 n} x_n=b_2, \\ \cdots \cdots \cdots \\ a_{m 1} x_1+a_{m 2} x_2+\cdots+a_{m n} x_n=b_m, \end{array}\right. ...(1)

把他们的未知数的系数提取出来,形成一个 mmnn 列的数表,这个数表称作矩阵。

(a11a12a1na21a22a2nam1am2amn)\left(\begin{array}{ccccc} a_{11} & a_{12} & \cdots & a_{1 n} \\ a_{21} & a_{22} & \cdots & a_{2 n} \\ \vdots & \vdots & & \vdots \\ a_{m 1} & a_{m 2} & \cdots & a_{m n} \end{array}\right)

抛去具体意义,下面给出矩阵的数学定义

矩阵的定义

定义1 m×nm \times n 个数 aij(i=1,2,,m;j=1,2,,n)a_{i j}(i=1,2, \cdots, m ; j=1,2, \cdots, n) 排成的 mmnn 列的数表

A=(a11a12a1na21a22a2nam1am2amn)\boldsymbol{A}=\left(\begin{array}{cccc} a_{11} & a_{12} & \cdots & a_{1 n} \\ a_{21} & a_{22} & \cdots & a_{2 n} \\ \vdots & \vdots & & \vdots \\ a_{m 1} & a_{m 2} & \cdots & a_{m n} \end{array}\right)

称为一个 m×nm \times n 矩阵,简记为 (aij)\left(a_{i j}\right) ,也记为 (aij)m×n\left(a_{i j}\right)_{m \times n}. 数 aija_{i j} 位于矩阵 (aij)\left(a_{i j}\right) 的第 ii 行第 jj 列,称为矩阵的 (i,j)(i, j) 元素, 其中 ii 称为元素 aija_{i j}行标jj 称为元素 aija_{i j}列标.

一般地,常用英文大写字母 A,B,CA, B, C \cdots 或字母 α,β,γ,\alpha, \beta, \gamma, \cdots 表示矩阵.

元素是实数的矩阵称为实矩阵,元素是复数的矩阵称为复矩阵. 本书除特别指明外,都是指实矩阵.

方阵

如果矩阵中m=nm=n,即矩阵的行数等于列数,则称为方阵(正方形矩阵的简称),如果mnm \ne n 则成为长方阵。 方阵在矩阵研究中占据极其重要的位置。 因此定义:含有 nn 行及 nn 列的矩阵称为 nn 阶方阵 (亦称为 nn 阶矩阵)。

一些概念汇总

(1)1×11 \times 1 的矩阵 A=(a)A=(a) 就记为 A=a\boldsymbol{A}=a.

(2)1×n1 \times n 的矩阵 (a1,a2,,an)\left(a_1, a_2, \cdots, a_n\right) 称为行矩阵,也称为 nn维行向量.

(3)n×1 n \times 1 的矩阵 (a1a2an)\left(\begin{array}{c}a_1 \\ a_2 \\ \vdots \\ a_n\end{array}\right) 称为列矩阵,也称为 nn 维列向量.

注意:除非特别声明,我们默认总是研究矩阵的列向量

(4)所有元素都是零的 m×nm \times n 矩阵称为零矩阵,记为 Om×nO_{m \times n} ,或简记为 O\boldsymbol{O}.

因为阶数不同,所以两个零矩阵不一定相等。

(5)m×nm \times n 矩阵,如果m=nm=n, 即 (a11a12a1na21a22a2nan1an2amn)\left(\begin{array}{cccc}a_{11} & a_{12} & \cdots & a_{1 n} \\ a_{21} & a_{22} & \cdots & a_{2 n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n 1} & a_{n 2} & \cdots & a_{m n}\end{array}\right) \quad 称为 nn阶方阵. 元素 aii(i=1,2,,n)a_{i i}(i=1,2, \cdots, n) 所在的位置称为 nn 阶方阵的主对角线.

(6)一个 nn 阶方阵主对角线上方的元素全为零, 即

(a1100a21a220an1an2ann),\left(\begin{array}{cccc} a_{11} & 0 & \cdots & 0 \\ a_{21} & a_{22} & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ a_{n 1} & a_{n 2} & \cdots & a_{n n} \end{array}\right),

称该 nn 阶方阵为下三角矩阵

类似地,有上三角矩阵 ,即

(a11a12a1n0a22a2n00ann),\left(\begin{array}{cccc} a_{11} & a_{12} & \cdots & a_{1 n} \\ 0 & a_{22} & \cdots & a_{2 n} \\ \vdots & \vdots & & \vdots \\ 0 & 0 & \cdots & a_{n n} \end{array}\right),

(7)nn 阶方阵只有主对角线有元素,其它元素都是零的矩阵

(a1000a2000an)\left(\begin{array}{cccc} a_1 & 0 & \cdots & 0 \\ 0 & a_2 & \cdots & 0 \\ \cdots & \cdots & \ddots & \vdots \\ 0 & 0 & \cdots & a_n \end{array}\right)

称为 nn对角矩阵,简称对角阵,记为 diag(a1,a2,,an)\operatorname{diag}\left(a_1, a_2, \cdots, a_n\right).

(8)如果 nn 阶对角矩阵 diag(a1,a2,,an)\operatorname{diag}\left(a_1, a_2, \cdots, a_n\right) 对角线上的元素全相等, 即 a1=a2==ana_1=a_2=\cdots=a_n ,则称其为数量矩阵.

(9)当数量矩阵的 a1=a2==an=1a_1=a_2=\cdots=a_n=1 时,这个数量矩阵就称为 nn阶单位矩阵,简称为单位阵, 记为 IIEE

E=(100010001).E=\left(\begin{array}{cccc} 1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ \ldots & \cdots & \ddots & \vdots \\ 0 & 0 & \cdots & 1 \end{array}\right) .

方程的矩阵写法

有了矩阵,可以简化方程的写法,

定义方程的系数矩阵AA:

A=(a11a12a1na21a22a2nam1am2amn)\boldsymbol{A}=\left(\begin{array}{cccc} a_{11} & a_{12} & \cdots & a_{1 n} \\ a_{21} & a_{22} & \cdots & a_{2 n} \\ \vdots & \vdots & & \vdots \\ a_{m 1} & a_{m 2} & \cdots & a_{m n} \end{array}\right)

定义方程变量为XX为列矩阵

X=(x1x2xn)X=\left(\begin{array}{cccc} x_{1} \\ x_{2} \\ \vdots \\ x_{n} \end{array}\right)

定义方程等式右边为矩阵 BB

B=(b1b2bn)B=\left(\begin{array}{cccc} b_{1} \\ b_{2} \\ \vdots \\ b_{n} \end{array}\right)

则上面方程(1)可以写成(这里用到了矩阵乘法,详见后面介绍)

AX=B\boldsymbol{AX=B}

还记得初中学的代数方程吗?矩阵AX=BAX=B的这种写法和初中学过的ax=bax=b写法完全一致,从外形看,仅仅把字母从小写变成大写就完成了代数乘法到矩阵乘法的转变,因此非常方便记忆。

为什么我们不定义: X={x1,x2,...,xn}X=\{x_{1} ,x_{2},...,x_{n}\}B={b1,b2,...,bn}B=\{b_{1} ,b_{2},...,b_{n}\} 因为这样无法得到AX=BAX=B,这和我们初中学的ax=bax=b写法不一致,因此才定义X,BX,B为列形式。当然这也导致了后面研究向量都以“列”向量为基准。

例如

{2x+3yz=3x2y+5z=93xyz=0\left\{\begin{array}{l}2 x+3 y-z=3 \\ x-2 y+5 z=9 \\ 3 x-y-z=0\end{array}\right.

仿照初中ax=bax=b得记忆法,写成矩阵的形式就是

(231125311)(xyz)=(390)\left(\begin{array}{ccc} 2 & 3 & -1 \\ 1 & -2 & 5 \\ 3 & -1 & 1 \end{array}\right) \left(\begin{array}{c} x \\ y \\ z \end{array}\right) = \left(\begin{array}{c} 3 \\ 9 \\ 0 \end{array}\right)

矩阵的相等

定义2 两个矩阵的行数相等、列数也相等,则称这两个矩阵为同型矩阵. 如果两个同型矩阵 A=(aij)m×n\boldsymbol{A}=\left(a_{i j}\right)_{m \times n}B=(bij)m×nB=\left(b_{i j}\right)_{m \times n} 中所有对应位置的元素都相等, 即 aij=bija_{i j}=b_{i j} ,其中 i=1,2,,m;j=1,2,,ni=1,2, \cdots, m ; j=1,2, \cdots, n ,则称矩阵 AABB 相等,记为 A=BA=B.

两个零矩阵并不相等,比如02×203×30_{2\times2} \neq 0_{3\times 3}

矩阵和行列式的关系

从定义上可以看到矩阵就是“表格”, 而行列式是一个“数”,这是计算上最大的区别。矩阵是m×nm \times n 而行列式是 n×n n \times n,这意味着大部分矩阵和行列式是没有关系的,但是当矩阵的m=nm=n时,即矩阵是方阵时,矩阵和行列式会产生联系。

A\boldsymbol{A}nn 阶方阵, 则我们用 A|\boldsymbol{A}|detA\operatorname{det} \boldsymbol{A} 表示矩阵 A\boldsymbol{A} 的行列式. 注意对长方阵而言, 谈论其行列式显然没有意义.

因此,通过行列式就可以判断方程有没有解。如果D=0D=0,意味着这个空间坍塌为一个点,自然无法“存放”向量,因此方程也就无解。