13._向量组的秩与矩阵的秩的关系

向量组的秩与矩阵的秩的关系通俗解释

矩阵的秩 等于 行向量组的秩 等于 列向量组的秩

矩阵的秩反应的是方程组有效的方程的个数,而向量组的秩,反应的是向量组成的空间维度。

从方程理解1

如下一个方程组

{x1+x2=02x2+2x2=0\left\{ \begin{array}{c} x_1 +x_2= 0 \\ 2x_2+2 x_2=0 \end{array} \right.

①写出他的系数矩阵,可以得到他的秩为1. 而如果我们从方程看,虽然这里有2个方程,但是第二个方程是第一个方程的2倍,所以,第二个方程是滥竽充数的。因此方程有效的个数是1. 因此,我们得到一个结论:矩阵的秩,本质上反映的是有效方程的个数。详见矩阵的秩

②仍然以上面方程为例,写出向量为 (1,2)(1,2)(1,2)(1,2) ,虽然这里有2个向量,但是他们是共线的,因此是线性相关,这2个向量组成向量组的秩为1. 因此,对于向量组含有n个向量,如果秩等于1表示这n个向量共线;如果秩等于2,表示这n个向量组共面;如果秩等于3,表示这n个向量组共体,一次类推,详见 向量组的等价

从几何理解2

假设有一个矩阵 A=(120212)\boldsymbol{A}=\left(\begin{array}{cc}-1 & 2 \\ 0 & 2 \\ 1 & -2\end{array}\right) 他的列空间、行空间都是平面,因此列秩、行秩相等,都为 2

以列视角看,他有2个列向量,这2个向量张成了一个平面。 以行视角看,他有3个行向量,这3个行向量也张成了一个平面

图片{width=500px}

数学推导

定理 设 A\boldsymbol{A}m×nm \times n 矩阵,则 A\boldsymbol{A} 的列向量组 α1,α2,,αn\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n的秩等于矩阵 A\boldsymbol{A} 的秩; A\boldsymbol{A} 的行向量组的秩也等于 A\boldsymbol{A} 的秩.

证明:我们分两步证明这个定理. (1)先证明,若矩阵 A\boldsymbol{A} 的秩为 rr ,则 A\boldsymbol{A} 中有 rr 个线性无关的列向量. 设 r(A)=rr(\boldsymbol{A})=r ,则 A\boldsymbol{A} 中必有一个 rr 阶子式 Dr0D_r \neq 0 .设 DrD_r 位于 A\boldsymbol{A}的第 j1,j2,,jrj_1, j_2, \cdots, j_r 列,且

j1<j2<<jr.j_1<j_2<\cdots<j_r .

A\boldsymbol{A} 的这 rr 个列向量 αj1,αj2,,αjr\boldsymbol{\alpha}_{j_1}, \boldsymbol{\alpha}_{j_2}, \cdots, \boldsymbol{\alpha}_{j_r} 构成的矩阵记为 A1\boldsymbol{A}_1 .显然, r(A1)=rr\left(\boldsymbol{A}_1\right)=r .由定理“向量 α1,α2,,αm\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_m 线性相关的充分必要条件是 r(A)<mr(\boldsymbol{A})<m ;向量 α1,α2,,αm\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_m 线性无关的充分必要条件是 r(A)=mr(\boldsymbol{A})=m ”知 αj1,αj2,,αjr\boldsymbol{\alpha}_{j_1}, \boldsymbol{\alpha}_{j_2}, \cdots, \boldsymbol{\alpha}_{j_r} 线性无关. (2)再证明, A\boldsymbol{A} 中的任一列向量 αj\boldsymbol{\alpha}_j 都可由(1)中的 rr 个线性无关的列向量线性表示.

事实上,若 αj\boldsymbol{\alpha}_jαj1,αj2,,αjr\boldsymbol{\alpha}_{j_1}, \boldsymbol{\alpha}_{j_2}, \cdots, \boldsymbol{\alpha}_{j_r} 中的某个向量,则显然 αj\boldsymbol{\alpha}_j 可由 αj1,αj2,,αj\boldsymbol{\alpha}_{j_1}, \boldsymbol{\alpha}_{j_2}, \cdots, \boldsymbol{\alpha}_j 线性表示;若 αj\boldsymbol{\alpha}_j 不在 αj1,αj2,,αjr\boldsymbol{\alpha}_{j_1}, \boldsymbol{\alpha}_{j_2}, \cdots, \boldsymbol{\alpha}_{j_r} 中,不妨设 j1<j2<<ji<j<ji+1<<jrj_1< j_2<\cdots<j_i<j<j_{i+1}<\cdots<j_r ,于是矩阵

A2=(αj1,αj2,,αji,αj,αji+1,,αjr)A_2=\left(\alpha_{j_1}, \alpha_{j_2}, \cdots, \alpha_{j_i}, \alpha_j, \alpha_{j_{i+1}}, \cdots, \alpha_{j_r}\right)

是矩阵 A\boldsymbol{A} 的子式,故 r(A2)r(A)=r<r+1r\left(\boldsymbol{A}_2\right) \leqslant r(\boldsymbol{A})=r<r+1 ,仍由定理“向量 α1,α2,,αm\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_m 线性相关的充分必要条件是 r(A)<mr(\boldsymbol{A})<m ;向量 α1,α2,,αm\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_m 线性无关的充分必要条件是 r(A)=mr(\boldsymbol{A})=m ” 可知,A2A_2 的列向量线性相关.所以 αj\boldsymbol{\alpha}_j 可由 αj1,αj2,,αjr\boldsymbol{\alpha}_{j_1}, \boldsymbol{\alpha}_{j_2}, \cdots, \boldsymbol{\alpha}_{j_r}线性表示.

综合(1)(2)可知, αj1,αj2,,αjr\boldsymbol{\alpha}_{j_1}, \boldsymbol{\alpha}_{j_2}, \cdots, \boldsymbol{\alpha}_{j_r} 是矩阵 A\boldsymbol{A} 的列向量组的一个极大无关组,所以

r(α1,α2,,αn)=r=r(A).r\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n\right)=r=r(\boldsymbol{A}) .

由于 r(A)=r(AT)r(\boldsymbol{A})=r\left(\boldsymbol{A}^{\mathrm{T}}\right) ,而 A\boldsymbol{A} 的行向量组的秩就是 AT\boldsymbol{A}^{\mathrm{T}} 的列向量组的秩,故也等于 A\boldsymbol{A} 的秩,所以

r(A)=Ar(\boldsymbol{A})=\boldsymbol{A} 的列向量组的秩 =A=\boldsymbol{A} 的行向量组的秩.

证毕

上述定理的证明过程给出了求向量组的秩及其找一个极大无关组的方法:向量组排成列做成矩阵 A\boldsymbol{A} ,若 r(A)=rr(\boldsymbol{A})=r ,则向量组的秩为 rr 。在 A\boldsymbol{A} 中只要找到一个 rr 阶子式不等于零,则这个 rr 阶子式所在的 rr 个列向量即为 A\boldsymbol{A} 中列向量组的一个极大无关组.而不等于零的 rr 阶子式可通过 A\boldsymbol{A} 的阶梯形看出.

设有向量组

α1=(121),α2=(242),α3=(103),α4=(044),\boldsymbol{\alpha}_1=\left(\begin{array}{r} 1 \\ -2 \\ 1 \end{array}\right), \quad \boldsymbol{\alpha}_2=\left(\begin{array}{r} 2 \\ -4 \\ 2 \end{array}\right), \quad \boldsymbol{\alpha}_3=\left(\begin{array}{l} 1 \\ 0 \\ 3 \end{array}\right), \quad \boldsymbol{\alpha}_4=\left(\begin{array}{r} 0 \\ -4 \\ -4 \end{array}\right),

求该向量组的秩和它的一个极大无关组,并将其余向量用所求的极大无关组线性表示。

解:构造矩阵 A=(α1,α2,α3,α4)\boldsymbol{A}=\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \boldsymbol{\alpha}_3, \boldsymbol{\alpha}_4\right) ,对 A\boldsymbol{A} 作初等行变换,将其化为简化的阶梯形矩阵,即

A=(121024041234) 初等行变换 (120200120000)=B.\boldsymbol{A}=\left(\begin{array}{rrrr} 1 & 2 & 1 & 0 \\ -2 & -4 & 0 & -4 \\ 1 & 2 & 3 & -4 \end{array}\right) \xrightarrow{\text { 初等行变换 }}\left(\begin{array}{rrrr} 1 & 2 & 0 & 2 \\ 0 & 0 & 1 & -2 \\ 0 & 0 & 0 & 0 \end{array}\right)=\boldsymbol{B} .

显然,r(A)=r(B)=2r(\boldsymbol{A})=r(\boldsymbol{B})=2 ,即 r(α1,α2,α3,α4)=2r\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \boldsymbol{\alpha}_3, \boldsymbol{\alpha}_4\right)=2 .把上面最后一个矩阵 B\boldsymbol{B} 记作 B=(β1,β2,β3,β4)\boldsymbol{B}=\left(\boldsymbol{\beta}_1, \boldsymbol{\beta}_2, \boldsymbol{\beta}_3, \boldsymbol{\beta}_4\right) 。易见 β1,β3\boldsymbol{\beta}_1, \boldsymbol{\beta}_3B\boldsymbol{B} 的列向量组的一个极大无关组,它可以看作是矩阵 A1=(α1,α3)\boldsymbol{A}_1=\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_3\right) 经初等行变换得到的,所以 α1,α3\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_3A\boldsymbol{A} 的列向量组的一个极大线性无关组。

α2=k1α1+k3α3,α4=l1α1+l3α3\boldsymbol{\alpha}_2=k_1 \boldsymbol{\alpha}_1+k_3 \boldsymbol{\alpha}_3, \boldsymbol{\alpha}_4=l_1 \boldsymbol{\alpha}_1+l_3 \boldsymbol{\alpha}_3 ,利用简化的阶梯形矩阵 B\boldsymbol{B} 求解这两个线性方程组,易得

k1=2,k3=0;l1=2,l3=2.k_1=2, k_3=0 ; l_1=2, l_3=-2 .

所以

α2=2α1,α4=2α12α3.\alpha_2=2 \alpha_1, \quad \alpha_4=2 \alpha_1-2 \alpha_3 .

提示

值得注意的是 α2\boldsymbol{\alpha}_2α1,α3\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_3 表示的系数 2, 0 与 α4\boldsymbol{\alpha}_4α1,α3\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_3 表示的系数 2,22,-2 恰是简化的阶梯形矩阵 B\boldsymbol{B} 的第二列与第四列的前两个元素.这不是偶然的.因为解线性方程组 α2=k1α1+k3α3\boldsymbol{\alpha}_2=k_1 \boldsymbol{\alpha}_1+k_3 \boldsymbol{\alpha}_3 等价于解线性方程组 β2=k1β1+k3β3\boldsymbol{\beta}_2=k_1 \boldsymbol{\beta}_1+k_3 \boldsymbol{\beta}_3 .解后面的线性方程组,相当于解以矩阵 B\boldsymbol{B} 的第一列与第三列为系数矩阵,以第二列为常数项的线性方程组.由于矩阵 B\boldsymbol{B} 为简化的阶梯形矩阵,去掉它的零行,与第一列和第三列对应的是单位矩阵,因而第二列的前两个元素即为方程组的解.同理,容易从矩阵 B\boldsymbol{B} 得到线性方程组 α4=l1α1+l3α3\boldsymbol{\alpha}_4= l_1 \boldsymbol{\alpha}_1+l_3 \boldsymbol{\alpha}_3 的解.

更详细解释清参考 向量组的等价

A,B\boldsymbol{A}, \boldsymbol{B} 均为 m×nm \times n 矩阵,证明

r(A+B)r(A)+r(B).r(\boldsymbol{A}+\boldsymbol{B}) \leqslant r(\boldsymbol{A})+r(\boldsymbol{B}) .

证明:设 A=(α1,α2,,αn)\boldsymbol{A}=\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n\right)B=(β1,β2,,βn)\boldsymbol{B}=\left(\boldsymbol{\beta}_1, \boldsymbol{\beta}_2, \cdots, \boldsymbol{\beta}_n\right) ,则

A+B=(α1+β1,α2+β2,,αn+βn).\boldsymbol{A}+\boldsymbol{B}=\left(\boldsymbol{\alpha}_1+\boldsymbol{\beta}_1, \boldsymbol{\alpha}_2+\boldsymbol{\beta}_2, \cdots, \boldsymbol{\alpha}_n+\boldsymbol{\beta}_n\right) .

再设 A\boldsymbol{A}B\boldsymbol{B} 的列向量组的极大线性无关组分别为

αi1,αi2,,αis 与 βj1,βj2,,βjt\boldsymbol{\alpha}_{i_1}, \boldsymbol{\alpha}_{i_2}, \cdots, \boldsymbol{\alpha}_{i_s} \text { 与 } \boldsymbol{\beta}_{j_1}, \boldsymbol{\beta}_{j_2}, \cdots, \boldsymbol{\beta}_{j_t} \text {, }

则矩阵 A\boldsymbol{A}B\boldsymbol{B} 的列向量分别可由 αi1,αi2,,αi3\boldsymbol{\alpha}_{i_1}, \boldsymbol{\alpha}_{i_2}, \cdots, \boldsymbol{\alpha}_{i_3}βj1,βj2,,βj1\boldsymbol{\beta}_{j_1}, \boldsymbol{\beta}_{j_2}, \cdots, \boldsymbol{\beta}_{j_1} 线性表示,即

αp=k1αi1+k2αi2++ksαisβp=l1βj1+l2βj2++ltβjt.\begin{gathered} \boldsymbol{\alpha}_p=k_1 \boldsymbol{\alpha}_{i_1}+k_2 \boldsymbol{\alpha}_{i_2}+\cdots+k_s \boldsymbol{\alpha}_{i_s} \\ \boldsymbol{\beta}_p=l_1 \boldsymbol{\beta}_{j_1}+l_2 \boldsymbol{\beta}_{j_2}+\cdots+l_t \boldsymbol{\beta}_{j_t} . \end{gathered}

因而

αp+βp=k1αi1+k2αi2++ksαis+l1βj1+l2βj2++ltβjt,p=1,2,,n,\boldsymbol{\alpha}_p+\boldsymbol{\beta}_p=k_1 \boldsymbol{\alpha}_{i_1}+k_2 \boldsymbol{\alpha}_{i_2}+\cdots+k_s \boldsymbol{\alpha}_{i_s}+l_1 \boldsymbol{\beta}_{j_1}+l_2 \boldsymbol{\beta}_{j_2}+\cdots+l_t \boldsymbol{\beta}_{j_t}, p=1,2, \cdots, n,

即矩阵 A+B\boldsymbol{A}+\boldsymbol{B} 的列向量组可由矩阵 C=(αi1,αi2,,αis,βj1,βj2,\boldsymbol{C}=\left(\boldsymbol{\alpha}_{i_1}, \boldsymbol{\alpha}_{i_2}, \cdots, \boldsymbol{\alpha}_{i_s}, \boldsymbol{\beta}_{j_1}, \boldsymbol{\beta}_{j_2}, \cdots\right.βjt)\left.\boldsymbol{\beta}_{j_t}\right) 的列向量组线性表示,由命题3.11得

r(A+B)r(C)s+t=r(A)+r(B)r(\boldsymbol{A}+\boldsymbol{B}) \leqslant r(\boldsymbol{C}) \leqslant s+t=r(\boldsymbol{A})+r(\boldsymbol{B})

类似地可以证明

max{r(A),r(B)}r(AB)r(A)+r(B),\max \{r(\boldsymbol{A}), r(\boldsymbol{B})\} \leqslant r(\boldsymbol{A} \boldsymbol{B}) \leqslant r(\boldsymbol{A})+r(\boldsymbol{B}),

其中 A\boldsymbol{A}m×pm \times p 矩阵, B\boldsymbol{B}m×qm \times q 矩阵,(A,B)(\boldsymbol{A}, \boldsymbol{B})m×(p+q)m \times(p+q)矩阵.

证明

r(AB)min{r(A),r(B)},r(\boldsymbol{A B}) \leqslant \min \{r(\boldsymbol{A}), r(\boldsymbol{B})\},

其中 A\boldsymbol{A}m×pm \times p 矩阵, B\boldsymbol{B}p×np \times n 矩阵。 证明:设

A=(aij)m×p=(α1,α2,,αp),B=(bij)p×n,AB=(γ1,γ2,,γn)\boldsymbol{A}=\left(a_{i j}\right)_{m \times p}=\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_p\right), \boldsymbol{B}=\left(b_{i j}\right)_{p \times n}, \boldsymbol{A} \boldsymbol{B}=\left(\boldsymbol{\gamma}_1, \boldsymbol{\gamma}_2, \cdots, \boldsymbol{\gamma}_n\right)

AB=(γ1,γ2,,γn)=(α1,α2,,αp)B.A B=\left(\boldsymbol{\gamma}_1, \boldsymbol{\gamma}_2, \cdots, \boldsymbol{\gamma}_n\right)=\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_p\right) \boldsymbol{B} .

这说明, γ1,γ2,,γn\boldsymbol{\gamma}_1, \boldsymbol{\gamma}_2, \cdots, \boldsymbol{\gamma}_n 可由 α1,α2,,αp\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_p 线性表示.由命题3.11,

r(AB)=r(γ1,γ2,,γn)r(α1,α2,,αp)=r(A).r(\boldsymbol{A} \boldsymbol{B})=r\left(\boldsymbol{\gamma}_1, \boldsymbol{\gamma}_2, \cdots, \boldsymbol{\gamma}_n\right) \leqslant r\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_p\right)=r(\boldsymbol{A}) .

又因为 (AB)T=BTAT(\boldsymbol{A} \boldsymbol{B})^{\mathrm{T}}=\boldsymbol{B}^{\mathrm{T}} \boldsymbol{A}^{\mathrm{T}} ,由上面的讨论知

r(BTAT)r(BT)r\left(\boldsymbol{B}^{\mathrm{T}} \boldsymbol{A}^{\mathrm{T}}\right) \leqslant r\left(\boldsymbol{B}^{\mathrm{T}}\right)

r(B)=r(BT),r(AB)=r(BTAT)r(\boldsymbol{B})=r\left(\boldsymbol{B}^{\mathrm{T}}\right), r(\boldsymbol{A B})=r\left(\boldsymbol{B}^{\mathrm{T}} \boldsymbol{A}^{\mathrm{T}}\right) ,故

r(AB)r(B)r(\boldsymbol{A} \boldsymbol{B}) \leqslant r(\boldsymbol{B})

因而

r(AB)min{r(A),r(B)}.r(\boldsymbol{A} \boldsymbol{B}) \leqslant \min \{r(\boldsymbol{A}), r(\boldsymbol{B})\} .

求向量组 α1=(1230),α2=(1131),α3=(501510),α4=(2165),α5=(2054)\alpha _1=\left(\begin{array}{l}1 \\ 2 \\ 3 \\ 0\end{array}\right), \alpha _2=\left(\begin{array}{c}-1 \\ -1 \\ -3 \\ 1\end{array}\right), \alpha _3=\left(\begin{array}{c}5 \\ 0 \\ 15 \\ -10\end{array}\right), \alpha _4=\left(\begin{array}{c}-2 \\ 1 \\ -6 \\ 5\end{array}\right), \alpha _5=\left(\begin{array}{c}2 \\ 0 \\ 5 \\ -4\end{array}\right) 的秩和一个极大无关组,并把不属于极大无关组的向量用极大无关组线性表示.

解 令矩阵

A=(α1,α2,α3,α4,α5) ,对矩阵 A 实施初等行变换化为行最简形矩阵 R :A=(α1,α2,α3,α4,α5)=(1152221010331565011054)(1152201105400001011054)(105300110500000100000)=(β1,β2,β3,β4,β5)=R\begin{aligned} & A =\left( \alpha _1, \alpha _2, \alpha _3, \alpha _4, \alpha _5\right) \text { ,对矩阵 } A \text { 实施初等行变换化为行最简形矩阵 } R \text { :}\\ &A =\left( \alpha _1, \alpha _2, \alpha _3, \alpha _4, \alpha _5\right)=\left(\begin{array}{ccccc} 1 & -1 & 5 & -2 & 2 \\ 2 & -1 & 0 & 1 & 0 \\ 3 & -3 & 15 & -6 & 5 \\ 0 & 1 & -10 & 5 & -4 \end{array}\right) \rightarrow\left(\begin{array}{ccccc} 1 & -1 & 5 & -2 & 2 \\ 0 & 1 & -10 & 5 & -4 \\ 0 & 0 & 0 & 0 & -1 \\ 0 & 1 & -10 & 5 & -4 \end{array}\right) \rightarrow\left(\begin{array}{ccccc} 1 & 0 & -5 & 3 & 0 \\ 0 & 1 & -10 & 5 & 0 \\ 0 & 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 & 0 \end{array}\right)=\left( \beta _1, \beta _2, \beta _3, \beta _4, \beta _5\right)= R \end{aligned}

R(R)=3R( R )=3 可知 R(A)=3.RR( A )=3 . R 中的 3 阶非零子式为 100010001=10\left|\begin{array}{lll}1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1\end{array}\right|=1 \neq 0 , 所以 β1,β2,β5\beta _1, \beta _2, \beta _5RR 的列向量组的极大无关组,且

β3=5β110β2+0β5,β4=3β1+5β2+0β5\beta _3=-5 \beta _1-10 \beta _2+0 \cdot \beta _5, \quad \beta _4=3 \beta _1+5 \beta _2+0 \cdot \beta _5

由于向量组 α1,α2,α3,α4,α5\alpha_1, \alpha_2, \alpha_3, \alpha_4, \alpha_5 与向量组 β1,β2,β3,β4,β5\beta _1, \beta _2, \beta _3, \beta _4, \beta _5 有相同的线性相关性,所以 α1,α2,α5\alpha_1, \alpha_2, \alpha_5 是向量组 α1,α2,α3,α4,α5\alpha_1, \alpha_2, \alpha_3, \alpha_4, \alpha_5 的极大无关组,

且有

α3=5α110α2+0α5,α4=3α1+5α2+0α5.\alpha _3=-5 \alpha _1-10 \alpha _2+0 \cdot \alpha _5, \quad \alpha _4=3 \alpha _1+5 \alpha _2+0 \cdot \alpha _5 .

在上面的计算里,有些同学可能不太明白表达式的系数是矩阵例值,这不是偶然的,具体原因可以在 极大线性无关性 例2 例解释。