11._矩阵的乘法的四个视角

说明:我们把单位行矩阵看成向量α\alpha, 单位列矩阵看成向量β\beta

矩阵乘法包括8个视角: 向量 x 向量 (2个视角,分为左乘和右乘) 矩阵 x 向量 (2个视角,分为左乘和右乘) 矩阵 x 矩阵 (4个视角,分为左乘和右乘)

本文节选自《the-Art-of-Linear-Algebra-zh-CN.pdf》,原文给出了8个视角的解释,因为8个视角太多了,最常用的是下面3个混合模式。所以本站先给出3个常用的混合模式,再列出原书给出的8个模式

本节内容是高度抽象甚至贯穿《线性代数》全书,因此初学者不要期望一下子就掌握。

矩阵的四个视角

设有一个矩阵AA,如何理解他

A=[142536]A=\left[\begin{array}{ll} 1 & 4 \\ 2 & 5 \\ 3 & 6 \end{array}\right]

第一个视角:就是一个数表。 第二个视角:就是6个数,排成了2行3列 第三个视角:两个列向量(最常用) 第四个视角:三个行向量。

一个矩阵 (m×n)(m \times n) 可以被视为 1 个矩阵,mnm n 个数,nn 个列和 mm 个行.

图片{width=400px}

以下表述里,默认都是使用列向量α\alpha模式,如果写成α\alpha^* 表示行向量。转置向量和转置矩阵则使用 αT\alpha^T

矩阵乘法的几个常用的重要视角

列模式

参考下图,数字矩阵乘以颜色矩阵的结果相当于颜色矩阵对数字列做线性组合。

图片

特别的,如果颜色矩阵是对角形矩阵,那么结果就相当于对对角线矩阵的数字直接作用到前面矩阵的每一列上。 图片

行模式

参考下图,颜色矩阵乘以数字矩阵的结果相当于颜色矩阵按行对数字矩阵做线性组合。 图片

下图显示对角形矩阵作用的结果。(我们默认bb向量都是列向量,下面的 bb^* 表示行向量)

图片

混合模式

如果将上面的乘法组合在一起就是

图片

下面列出《the-Art-of-Linear-Algebra-zh-CN.pdf》所有的视角,

向量与向量相乘的两个视角

向量与向量相乘,一般会涉及两种形式:一种是行向量乘以列向量,其结果为一个数值(标量),也称为内积;另一种是列向量乘以行向量,其结果为秩为 1 的矩阵,也称为外积

假设 nn 维列向量 a=[a1a2an],b=[b1b2bn]a =\left[\begin{array}{c}a_1 \\ a_2 \\ \vdots \\ a_n\end{array}\right], b =\left[\begin{array}{c}b_1 \\ b_2 \\ \vdots \\ b_n\end{array}\right] ,则其行向量可以用转置的形式表示,即 aT=[a1a2an],bT=[b1b2bn]a ^{ T }=\left[\begin{array}{llll}a_1 & a_2 & \ldots & a_n\end{array}\right], b ^{ T }=\left[\begin{array}{llll}b_1 & b_2 & \ldots & b_n\end{array}\right]

行乘以列

行向量乘以列向量(内积)---结果是一个数值

图片

列乘以行(主流视角)

列向量乘以行向量(外积)---结果是一个矩阵

图片

结论

  • 行向量乘以列向量(内积): aTb=a1b1+a2b2++anbna ^{ T } b =a_1 b_1+a_2 b_2+\cdots+a_n b_n

  • 列向量乘以行向量(外积):

abT=[a1a2an][b1b2bn]=[a1b1a1b2a1bna2b1a2b2a2bnanb1anb2anbn]a b ^{T}=\left[\begin{array}{c} a_1 \\ a_2 \\ \vdots \\ a_n \end{array}\right]\left[\begin{array}{llll} b_1 & b_2 & \ldots & b_n \end{array}\right]=\left[\begin{array}{cccc} a_1 b_1 & a_1 b_2 & \ldots & a_1 b_n \\ a_2 b_1 & a_2 b_2 & \ldots & a_2 b_n \\ \vdots & \vdots & \ddots & \vdots \\ a_n b_1 & a_n b_2 & \ldots & a_n b_n \end{array}\right]

举例说明:

 假设列向量 a=[102],b=[123] ,则:aTb=[102][123]=1×1+0×2+2×3=7abT=[102][123]=[123000246]\begin{aligned} &\text { 假设列向量 } a =\left[\begin{array}{l} 1 \\ 0 \\ 2 \end{array}\right], b =\left[\begin{array}{l} 1 \\ 2 \\ 3 \end{array}\right] \text { ,则:}\\ &\begin{aligned} & a ^{T} b =\left[\begin{array}{lll} 1 & 0 & 2 \end{array}\right]\left[\begin{array}{l} 1 \\ 2 \\ 3 \end{array}\right]=1 \times 1+0 \times 2+2 \times 3=7 \\ & a b ^{T}=\left[\begin{array}{l} 1 \\ 0 \\ 2 \end{array}\right]\left[\begin{array}{lll} 1 & 2 & 3 \end{array}\right]=\left[\begin{array}{lll} 1 & 2 & 3 \\ 0 & 0 & 0 \\ 2 & 4 & 6 \end{array}\right] \end{aligned} \end{aligned}

矩阵与向量(向量与矩阵)相乘的2个视角

设矩阵 A=[a11a12a1na21a22a2nam1am2amn]Rm×n, nA=\left[\begin{array}{cccc}a_{11} & a_{12} & \ldots & a_{1 n} \\ a_{21} & a_{22} & \ldots & a_{2 n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m 1} & a_{m 2} & \ldots & a_{m n}\end{array}\right] \in R ^{m \times n}, ~ n 维列向量 x=[x1x2xn]x =\left[\begin{array}{c}x_1 \\ x_2 \\ \vdots \\ x_n\end{array}\right] ,则 AxA x 的两种视角为:

行视角

矩阵乘法视角:根据矩阵乘法规则,计算其结果:

Ax=[a11a12a1na21a22a2nam1am2amn][x1x2xn]=[a11x1+a22x2++annxna21x1+a22x2++a2nxnam1x1+am2x2++amnxn]A x =\left[\begin{array}{cccc} a_{11} & a_{12} & \ldots & a_{1 n} \\ a_{21} & a_{22} & \ldots & a_{2 n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m 1} & a_{m 2} & \ldots & a_{m n} \end{array}\right]\left[\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right]=\left[\begin{array}{c} a_{11} x_1+a_{22} x_2+\cdots+a_{n n} x_n \\ a_{21} x_1+a_{22} x_2+\cdots+a_{2 n} x_n \\ \vdots \\ a_{m 1} x_1+a_{m 2} x_2+\cdots+a_{m n} x_n \end{array}\right]

图片

一般线性方程组 {a11x1+a22x2++annxn=b1a21x1+a22x2++a2nxn=b2am1x1+am2x2++amnxn=bm\left\{\begin{array}{l}a_{11} x_1+a_{22} x_2+\cdots+a_{n n} x_n=b_1 \\ a_{21} x_1+a_{22} x_2+\cdots+a_{2 n} x_n=b_2 \\ \vdots \\ a_{m 1} x_1+a_{m 2} x_2+\cdots+a_{m n} x_n=b_m\end{array}\right. ,可以用矩阵的形式进行表示:Ax=bA x = b ,其中 bbmm 维列向量。

列视角

列向量线性组合视角:将矩阵 AA 视为 nnmm 维列向量,即

A=[a1a2an], 其中, m 维列向量 aj=[a1ja2jamj](j=1,2,,n)A=\left[\begin{array}{llll} \boldsymbol{a _1 } & \boldsymbol{a _2} & \cdots & \boldsymbol{a _n} \end{array}\right] \text {, 其中, } m \text { 维列向量 } \boldsymbol{a _j}=\left[\begin{array}{c} a_{1 j} \\ a_{2 j} \\ \vdots \\ a_{m j} \end{array}\right](j=1,2, \cdots, n) \text {, }

Ax=[a1a2an][x1x2xn]=x1a1+x2a2++xnan\boldsymbol{A} \boldsymbol{x} =\left[\begin{array}{llll} \boldsymbol{a _1} & \boldsymbol{a _2} & \cdots & \boldsymbol{a _n} \end{array}\right]\left[\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right]=x_1 \boldsymbol{a _1}+x_2 \boldsymbol{a _2} +\cdots+x_n \boldsymbol{a _n}

这也就是意味着 AxA x 的结果是对 AA 的列向量进行线性组合的结果,AA 的每个列向量前的系数即为向量 xx 中对应的元素。

一般线性方程组 {a11x1+a22x2++annxn=b1a21x1+a22x2++a2nxn=b2am1x1+am2x2++amnxn=bm\left\{\begin{array}{l}a_{11} x_1+a_{22} x_2+\cdots+a_{n n} x_n=b_1 \\ a_{21} x_1+a_{22} x_2+\cdots+a_{2 n} x_n=b_2 \\ \vdots \\ a_{m 1} x_1+a_{m 2} x_2+\cdots+a_{m n} x_n=b_m\end{array}\right. , 可以表示为

x1[a11a21am1]+x2[a12a22am2]++xn[a1na2namn]=[b1b2bm]x_1\left[\begin{array}{c} a_{11} \\ a_{21} \\ \vdots \\ a_{m 1} \end{array}\right]+x_2\left[\begin{array}{c} a_{12} \\ a_{22} \\ \vdots \\ a_{m 2} \end{array}\right]+\cdots+x_n\left[\begin{array}{c} a_{1 n} \\ a_{2 n} \\ \vdots \\ a_{m n} \end{array}\right]= \left[\begin{array}{c} b_{1} \\ b_{2} \\ \vdots \\ b_{m} \end{array}\right]

图片

例如:A=[123456], x=[x1x2x3]A=\left[\begin{array}{lll}1 & 2 & 3 \\ 4 & 5 & 6\end{array}\right], ~ x =\left[\begin{array}{l}x_1 \\ x_2 \\ x_3\end{array}\right]

矩阵乘法视角:Ax=[123456][x1x2x3]=[1x1+2x2+3x34x1+5x2+6x3]A x =\left[\begin{array}{lll}1 & 2 & 3 \\ 4 & 5 & 6\end{array}\right]\left[\begin{array}{l}x_1 \\ x_2 \\ x_3\end{array}\right]=\left[\begin{array}{l}1 \cdot x_1+2 \cdot x_2+3 \cdot x_3 \\ 4 \cdot x_1+5 \cdot x_2+6 \cdot x_3\end{array}\right] 列向量线性组合视角:Ax=[123456][x1x2x3]=x1[14]+x2[25]+x3[36]A x =\left[\begin{array}{lll}1 & 2 & 3 \\ 4 & 5 & 6\end{array}\right]\left[\begin{array}{l}x_1 \\ x_2 \\ x_3\end{array}\right]=x_1\left[\begin{array}{l}1 \\ 4\end{array}\right]+x_2\left[\begin{array}{l}2 \\ 5\end{array}\right]+x_3\left[\begin{array}{l}3 \\ 6\end{array}\right]

向量 ×\times 矩阵的两个视角

此种形式,一般为一个行向量 bT=[b1b2bm]b ^{ T }=\left[\begin{array}{llll}b_1 & b_2 & \cdots & b_m\end{array}\right] 与一个 mmnn 列矩阵 AA 相乘。同样也可以有以下两种形式: (1)矩阵乘法视角

bTA=[b1b2bm][a11a12a1na21a22a2nam1am2amn]=[b1a11+b2a21++bmam1,b1a12+b2a22++bmam2,,b1a1n+b2a2n++bmamn]\begin{aligned} & b ^{T} A=\left[\begin{array}{llll} b_1 & b_2 & \cdots & b_m \end{array}\right]\left[\begin{array}{cccc} a_{11} & a_{12} & \cdots & a_{1 n} \\ a_{21} & a_{22} & \cdots & a_{2 n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m 1} & a_{m 2} & \cdots & a_{m n} \end{array}\right] \\ & =\left[\begin{array}{lll} b_1 a_{11}+b_2 a_{21}+\cdots+b_m a_{m 1}, & b_1 a_{12}+b_2 a_{22}+\cdots+b_m a_{m 2}, & \cdots, \end{array} b_1 a_{1 n}+b_2 a_{2 n}+\cdots+b_m a_{m n}\right] \end{aligned}

图片

(2)行向量线性组合视角:此时,将矩阵 AA 视为 mmnn 维行向量,即 A=[a1Ta2TamT]A=\left[\begin{array}{c} a _1^{ T } \\ a _2^{ T } \\ \vdots \\ a _m^{ T }\end{array}\right]

此处 ai=[ai1ai2ain](i=1,2,,m)a _i=\left[\begin{array}{c}a_{i 1} \\ a_{i 2} \\ \vdots \\ a_{i n}\end{array}\right](i=1,2, \cdots, m) ,则:

bTA=[b1b2bm][a1Ta2TamT]=b1a1T+b2a2T++bmamTb ^{T} A=\left[\begin{array}{llll} b_1 & b_2 & \cdots & b_m \end{array}\right]\left[\begin{array}{c} a _1^{T} \\ a _2^{T} \\ \vdots \\ a _m^{T} \end{array}\right]=b_1 a _1^{T}+b_2 a _2^{T}+\cdots+b_m a _m^{T}

图片

举例

例如:A=[142536],y=[y1y2y3]A=\left[\begin{array}{ll}1 & 4 \\ 2 & 5 \\ 3 & 6\end{array}\right], \quad y =\left[\begin{array}{l}y_1 \\ y_2 \\ y_3\end{array}\right]

矩阵乘法视角:

yTA=[y1y2y3][142536]=[y11+y22+y33y14+y25+y36]\begin{aligned} & y ^{T} A=\left[\begin{array}{lll} y_1 & y_2 & y_3 \end{array}\right]\left[\begin{array}{cc} 1 & 4 \\ 2 & 5 \\ 3 & 6 \end{array}\right] \\ & =\left[y_1 \cdot 1+y_2 \cdot 2+y_3 \cdot 3 \quad y_1 \cdot 4+y_2 \cdot 5+y_3 \cdot 6\right] \end{aligned}

行向量线性组合视角:

yTA=[y1y2y3][142536]=y1[14]+y2[25]+y3[36]y ^{T} A=\left[\begin{array}{lll} y_1 & y_2 & y_3 \end{array}\right]\left[\begin{array}{ll} 1 & 4 \\ 2 & 5 \\ 3 & 6 \end{array}\right]=y_1\left[\begin{array}{ll} 1 & 4 \end{array}\right]+y_2\left[\begin{array}{ll} 2 & 5 \end{array}\right]+y_3\left[\begin{array}{ll} 3 & 6 \end{array}\right]

矩阵与矩阵相乘的四个视角

图中带*的向量表示行向量。

图片

(1)矩阵乘法定义(MM1)视角:根据矩阵乘法的定义来看矩阵乘法,其本质是 AA 的每个行向量依次与 BB 的每个列向量求内积。 (2)矩阵与列向量组相乘(MM2)视角:将矩阵 BB 视为列向量组,依次将矩阵 AA 与矩阵 BB 的每个列向量相乘,最终得到结果。 (3)行向量组与矩阵相乘(MM3)视角:将矩 AA 视为不同的行向量组,依次将每个行向量依次与矩阵 BB 相乘,然后得到结果 (4)矩阵分解(向量外积)(MM4)视角:将矩 AA 视为列向量组,且每个列向量视为一个元素;将矩阵 BB 视为行向量组,且每个行向量视为一个元素;这样矩阵 ABA B 变成了一系列的 AA 列向量与 BB 的行向量的外积之和了。若 AA 的列向量和 BB 的行向量都为非零向量,则它们的每个外积(结果为 m×nm \times n 矩阵)的秩为 1 ,矩阵相乘的结果就变成了一列的秩为 1 的矩阵之和了。