线性方程组
先看一个二元一次方程组:
{2x+y=4x−2y=−1 这是一个含有2个未知数,2个等式的方程,我们把他的系数提取出来,排成一个数表,就形成了一个矩阵,如下
A=(211−2) 这样一个数表为称作矩阵。
如果把等号右边的常数项也加进去,如下面所示
A=(211−24−1) 这样,也形成了一个矩阵被称为增广矩阵。
矩阵的记法
上面对矩阵的记法使用的是大括号,在有些教程里,使用的是方括号,即
A=[211−2] 矩阵的写法有 大括号或中括号两种写法,这两种写法一种源自苏联,一种源自美国。 早期教程在排版方面,因为大括号比方括号容易排版,所以多使用大括号。 随着计算机发展,现代教程多使用方括号。
行列式的矩阵表示法
如果把上面方程的系数取出来,就组成了一个行列式:
∣A∣=211−2 因为,这个行列式来自矩阵,所以,为了方便,对于一个矩阵A 使用
detA=∣A∣ 表示 矩阵A对应的行列式。
对角矩阵
形如
A=λ1λ2⋱λn 的矩阵称作对角矩阵,此时可以写成
A=diag(λ1,λ2,⋯,λn)
奇异矩阵/非奇异矩阵
如果方程∣A∣=0,则成A为 非奇异矩阵(也叫非退化矩阵或满秩矩阵)
如果方程∣A∣=0,则成A为 奇异矩阵(也叫退化矩阵或降秩矩阵)
矩阵的定义
由 m 个方程 n 个末知量 x1,x2,⋯,xn 构成的线性方程组可以表示为:
⎩⎨⎧a11x1+a12x2+⋯+a1nxn=b1,a21x1+a22x2+⋯+a2nxn=b2,⋯⋯⋯am1x1+am2x2+⋯+amnxn=bm,...(1) 把他们的未知数的系数提取出来,形成一个 m 行 n 列的数表,这个数表称作矩阵。
a11a21⋮am1a12a22⋮am2⋯⋯⋯a1na2n⋮amn 抛去具体意义,下面给出矩阵的数学定义
矩阵的定义
定义1 m×n 个数 aij(i=1,2,⋯,m;j=1,2,⋯,n) 排成的 m 行 n 列的数表
A=a11a21⋮am1a12a22⋮am2⋯⋯⋯a1na2n⋮amn 称为一个 m×n 矩阵,简记为 (aij) ,也记为 (aij)m×n.
数 aij 位于矩阵 (aij) 的第 i 行第 j 列,称为矩阵的 (i,j) 元素,
其中 i 称为元素 aij 的行标, j 称为元素 aij 的列标.
一般地,常用英文大写字母 A,B,C⋯ 或字母 α,β,γ,⋯ 表示矩阵.
元素是实数的矩阵称为实矩阵,元素是复数的矩阵称为复矩阵.
本书除特别指明外,都是指实矩阵.
方阵
如果矩阵中m=n,即矩阵的行数等于列数,则称为方阵(正方形矩阵的简称),如果m=n 则成为长方阵。
方阵在矩阵研究中占据极其重要的位置。 因此定义:含有 n 行及 n 列的矩阵称为 n 阶方阵 (亦称为 n 阶矩阵)。
一些概念汇总
(1)1×1 的矩阵 A=(a) 就记为 A=a.
(2)1×n 的矩阵 (a1,a2,⋯,an) 称为行矩阵,也称为 n维行向量.
(3)n×1 的矩阵 a1a2⋮an 称为列矩阵,也称为 n 维列向量.
注意:除非特别声明,我们默认总是研究矩阵的列向量
(4)所有元素都是零的 m×n 矩阵称为零矩阵,记为 Om×n ,或简记为 O.
因为阶数不同,所以两个零矩阵不一定相等。
(5)m×n 矩阵,如果m=n, 即 a11a21⋮an1a12a22⋮an2⋯⋯⋱⋯a1na2n⋮amn 称为 n阶方阵.
元素 aii(i=1,2,⋯,n) 所在的位置称为 n 阶方阵的主对角线.
(6)一个 n 阶方阵主对角线上方的元素全为零, 即
a11a21⋮an10a22⋮an2⋯⋯⋱⋯00⋮ann, 称该 n 阶方阵为下三角矩阵
类似地,有上三角矩阵 ,即
a110⋮0a12a22⋮0⋯⋯⋯a1na2n⋮ann, (7)n 阶方阵只有主对角线有元素,其它元素都是零的矩阵
a10⋯00a2⋯0⋯⋯⋱⋯00⋮an 称为 n 阶对角矩阵,简称对角阵,记为 diag(a1,a2,⋯,an).
(8)如果 n 阶对角矩阵 diag(a1,a2,⋯,an) 对角线上的元素全相等, 即 a1=a2=⋯=an ,则称其为数量矩阵.
(9)当数量矩阵的 a1=a2=⋯=an=1 时,这个数量矩阵就称为 n阶单位矩阵,简称为单位阵, 记为 I 或 E 即
E=10…001⋯0⋯⋯⋱⋯00⋮1. 方程的矩阵写法
有了矩阵,可以简化方程的写法,
定义方程的系数矩阵A:
A=a11a21⋮am1a12a22⋮am2⋯⋯⋯a1na2n⋮amn 定义方程变量为X为列矩阵
X=x1x2⋮xn 定义方程等式右边为矩阵 B,
B=b1b2⋮bn 则上面方程(1)可以写成(这里用到了矩阵乘法,详见后面介绍)
AX=B 还记得初中学的代数方程吗?矩阵AX=B的这种写法和初中学过的ax=b写法完全一致,从外形看,仅仅把字母从小写变成大写就完成了代数乘法到矩阵乘法的转变,因此非常方便记忆。
为什么我们不定义:
X={x1,x2,...,xn} 和 B={b1,b2,...,bn}
因为这样无法得到AX=B,这和我们初中学的ax=b写法不一致,因此才定义X,B为列形式。当然这也导致了后面研究向量都以“列”向量为基准。
例如
⎩⎨⎧2x+3y−z=3x−2y+5z=93x−y−z=0
仿照初中ax=b得记忆法,写成矩阵的形式就是
2133−2−1−151xyz=390 矩阵的相等
定义2 两个矩阵的行数相等、列数也相等,则称这两个矩阵为同型矩阵. 如果两个同型矩阵
A=(aij)m×n 和 B=(bij)m×n 中所有对应位置的元素都相等, 即 aij=bij ,其中 i=1,2,⋯,m;j=1,2,⋯,n ,则称矩阵 A 和 B 相等,记为 A=B.
两个零矩阵并不相等,比如02×2=03×3
矩阵和行列式的关系
从定义上可以看到矩阵就是“表格”, 而行列式是一个“数”,这是计算上最大的区别。矩阵是m×n 而行列式是 n×n,这意味着大部分矩阵和行列式是没有关系的,但是当矩阵的m=n时,即矩阵是方阵时,矩阵和行列式会产生联系。
若 A 是 n 阶方阵, 则我们用 ∣A∣ 或 detA 表示矩阵 A 的行列式. 注意对长方阵而言, 谈论其行列式显然没有意义.
因此,通过行列式就可以判断方程有没有解。如果D=0,意味着这个空间坍塌为一个点,自然无法“存放”向量,因此方程也就无解。