5._矩阵乘法_列视角

列视角理解矩阵乘法

本课程叫做《线性代数》,核心包含了“线性”和“代数”两层含义,在 引言了介绍了 线性代数 四字的意义。 只有以列为视角,才能把线性组合关联起来。

为主的视角将矩阵乘法视为对矩阵的列向量进行线性组合。所谓线性组合,即线性+组合,线性是指向量乘以一个标量,沿着向量的方向缩放,方向不变;组合是把多个向量加起来(向量加法使用平行四边形法则,可以直接坐标相加)。列视角是最重要的视角

参考下图

红绿蓝三种颜色乘以矩阵 A=[abc]A=\left[\begin{array}{l}a\\b\\c \end{array} \right],得到的结果是红色乘以aa,绿色乘以bb,蓝色乘以cc,然后得到紫色

这里体现了两层含义:线性,即红绿蓝分别被a,b,ca,b,c作用,彼此不被干扰。 组合,就是把最终结果相加。

图片

比如下面这个矩阵乘法

[202219170171175606563]×[x1x2x3]=x1[2017060]+x2[2217165]+x3[1917563]=[b1b2b3] \left[\begin{array}{l} 20 & 22 & 19\\ 170 & 171 & 175\\60 & 65 & 63 \end{array} \right] \times \left[\begin{array}{l}x_1\\x_2\\x_3 \end{array} \right] = x_1 \left[\begin{array}{l} 20 \\ 170 \\ 60\end{array} \right] + x_2 \left[\begin{array}{l} 22 \\ 171 \\ 65\end{array} \right] + x_3 \left[\begin{array}{l} 19 \\ 175 \\ 63\end{array} \right] = \left[\begin{array}{l}b_1\\b_2\\b_3 \end{array} \right]

上面的矩阵乘法可以理解为:有一组学生,每一列都包含了学生的基本信息:年龄、身高和体重。现在对每个学生进行采样,采样次数分别是x1,x2,x3x_1,x_2,x_3次,最终形成了第一批采样报告 B=[b1b2b3]B=\left[\begin{array}{l}b_1\\b_2\\b_3 \end{array} \right]

图片

多次采样

假设有一天又进行了第二次采样,如下

[202219170171175606563]×[x1x4x2x5x3x6]=[b1b4b2b5b3b6] \left[\begin{array}{l} 20 & 22 & 19\\ 170 & 171 & 175\\60 & 65 & 63 \end{array} \right] \times \left[\begin{array}{l}x_1 &x_4 \\x_2 & x_5\\x_3 & x_6 \end{array} \right] = \left[\begin{array}{l}b_1 & b_4\\b_2 &b_5\\b_3 & b_6 \end{array} \right]

参考下图可以看到,每一列采样数据和采样结果彼此互相对应,如果把上面看成方程,我们发现变量还是竖着写舒服,因为能跟右边的值一一对应起来。进一步的,可以发现这个方程其实是2个方程组,含有6个等式。

图片

如果采样次数是第三次、第四次、第n次呢?不用担心,直接把汇总结果矩阵继续案列放置即可。所以按列理解矩阵乘法,是最常用的思考方式。

推广

现在把上面的结果推广,把矩阵AA推广为多列,为了方便理解,我们从结果看过程 可以看到,最后的结果就是前面线性的叠加。

图片

理解了上面的思想,再来看矩阵乘法。

计算

(123456)×(789101112)=\left(\begin{array}{lll} 1 & 2 & 3 \\ 4 & 5 & 6 \end{array}\right) \times\left(\begin{array}{cc} 7 & 8 \\ 9 & 10 \\ 11 & 12 \end{array}\right)=?

解:我们使用列向量视角,就可以把矩阵转换为

(123456)×(7090110)+(123456)×(08010012) \left(\begin{array}{lll} 1 & 2 & 3 \\ 4 & 5 & 6 \end{array}\right) \times\left(\begin{array}{cc} 7 & 0 \\ 9 & 0 \\ 11 & 0 \end{array}\right) + \left(\begin{array}{lll} 1 & 2 & 3 \\ 4 & 5 & 6 \end{array}\right) \times\left(\begin{array}{cc} 0 & 8 \\ 0 & 10 \\ 0 & 12 \end{array}\right)
(5801390)+(0640154)\left(\begin{array}{lll} 58 & 0 \\ 139 & 0 \end{array}\right) + \left(\begin{array}{lll} 0 & 64 \\ 0 & 154 \end{array}\right)
=(5864139154)= \left(\begin{array}{lll} 58 & 64 \\ 139 & 154 \end{array}\right)

注意:正如上面所说,使用列视角方便人脑的理解,但是计算量反而可能比行视角大,所以行视角多用于计算机处理中。

列视角下的方程组

设有方程

{a11x1+a12x2++a1nxn=b1a21x1+a22x2++a2nxn=b2an1x1+an2x2++annxn=bn\left\{\begin{array}{c} a_{11} x_1+a_{12} x_2+\cdots+a_{1 n} x_n=b_1 \\ a_{21} x_1+a_{22} x_2+\cdots+a_{2 n} x_n=b_2 \\ \cdots \cdots \cdots \\ a_{n 1} x_1+a_{n 2} x_2+\cdots+a_{n n} x_n=b_n \end{array}\right.

则方程可以写成

Ax=[a11a12a1na21a22a2nan1an2ann][x1x2xn]=x1[a11a21an1]+x2[a12a22an2]++xn[a1na2nann]=b\begin{aligned} & A x=\left[\begin{array}{cccc} a_{11} & a_{12} & \cdots & a_{1 n} \\ a_{21} & a_{22} & \cdots & a_{2 n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n 1} & a_{n 2} & \cdots & a_{n n} \end{array}\right]\left[\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right]=x_1\left[\begin{array}{c} a_{11} \\ a_{21} \\ \vdots \\ a_{n 1} \end{array}\right]+x_2\left[\begin{array}{c} a_{12} \\ a_{2 2} \\ \vdots \\ a_{n 2} \end{array}\right]+\cdots & +x_n\left[\begin{array}{c} a_{1 n} \\ a_{2 n} \\ \vdots \\ a_{n n} \end{array}\right] \end{aligned}= \boldsymbol{b}

**仅从长相上看,矩阵方程 Ax=βAx=\beta 和初中学习的代数方程 ax=bax=b 长相几乎张一模一样, 都是左边是数,中间是xx右边是结果 **,

上面这种把方程转换为矩阵的写法要能倒过来理解,即给了一个矩阵方程,能理解他的传统方程的写法。

向量空间的视角

现在我们把矩阵以列视角,从向量空间来观察他,考察下面一个矩阵乘法

图片

如果把矩阵的列当做三维空间的x,y,zx,y,z 坐标轴,那么这3个向量将张成三维空间,根据平行四边形法则,空间的任何一个向量,在这个三维空间里都有自己的坐标值(x1,x2,x3)(x_1,x_2,x_3), 参考下图

图片{width=300px}

因此, 在这种思维模型下,AX=BAX=B中的AXAX可以看成一个向量在AA空间里的坐标值是XX,那么BB呢?

我们说一个向量,要测量他的大小和方向,得有一个“尺度”,最常用的是笛卡尔坐标系,即e1=(1,0,0),e2=(0,1,0),e3=(0,0,1)e_1=(1,0,0),e_2=(0,1,0),e_3=(0,0,1),其实BB隐含这E单位矩阵。即 AX=EBAX=EB,即

[311131113][123]=[100010001][81012]\left[\begin{array}{lll} 3 & 1 & 1 \\ 1 & 3 & 1 \\ 1 & 1 & 3 \end{array}\right]\left[\begin{array}{l} 1 \\ 2 \\ 3 \end{array}\right] = \left[\begin{array}{lll} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{array}\right] \begin{bmatrix}8 \\ 10 \\ 12\end{bmatrix}

你可以这么理解:

AA空间里看到的一个向量,他的坐标值是 [123]\left[\begin{array}{l}1\\2\\3 \end{array} \right] 如果我换一个标准的视角EE去看他,他的坐标值是 [81012]\left[\begin{array}{l}8\\10\\12 \end{array} \right] 两个值相等表示向量还是那个向量,只是观察角度不一样了。

如果把矩阵视为拍照,你给小猪猪可以正面拍,侧面拍,上面拍,下面拍,猪还是那头猪,但是拍摄的角度不一样,得到的照片并不一样。在这些拍照里,有一个视角是最好的:就是正面拍照,因为不失真,这个正面其实就是我们说的单位矩阵E。

同样,如下面的矩阵 图片 可以看成在

[1234]\left[\begin{array}{l}1 & 2\\3 &4\end{array} \right] 里看到的2个向量 [57]\left[\begin{array}{l}5\\7\end{array} \right][68]\left[\begin{array}{l}6\\8\end{array} \right] 换到笛卡尔坐标系下看,变成了 [1943]\left[\begin{array}{l}19\\43\end{array} \right][2250]\left[\begin{array}{l}22\\50\end{array} \right]

矩阵右乘

如果我们把上面矩阵固定不变,用给猪猪拍照做类比,向量右乘一个矩阵,可以看到相当于“改变了坐标系,进而改变了观察的视角”,对比见下表

场景左乘右乘
坐标变换将点从原坐标系变换到新坐标系将坐标系本身进行变换
图形学旋转、缩放物体(物体不动,坐标系不变)改变观察视角(坐标系旋转,物体不变)