7._向量投影

二维投影

向量投影是向量空间到自身的线性变换。例如在二维平面上,有两个向量 aabb。 向量bb在向量aa上的投影,是自bbaa做垂线,我们把这个投影向量命名为 pp

由于pp是投影到aa上的,所以我们可以用某个常数系数xx来表示pp相对于aa的位置。

此外,我们还可以定义另一个向量ee,它与aa正交如下图。如果把所有关系都写下来,就会变成这样。

图片

根据高中向量平面向量的运行性质,很容易得出下面的性质

(1)p=xa\vec{p}=x \vec{a} ( xx为常数,向量共线定理) (2)e=bp\vec{e}=\vec{b}-\vec{p} (向量减法的三角形法则详见此处) (3)ae=0\vec{a} \vec{e}=0 (向量正交定义,几何意义详见此处)

由了上面的三个等式后,我们的目标是投影向量pp能用a,ba,b向量表示。把(1)(2)(3)当做普通方程来解即可。

答案如下: ① 将 (1) 带入 (2) : e=bxa\vec{e}= \vec{b}-x\vec{a} ...(4)

②将(4)带入(3)得:

a(bxa)=0\vec{a}(\vec{b}-x \vec{a}) =0

abaxa=0\vec{a} \vec{b}-\vec{a} x \vec{a} =0

③因为 xx 为常数,可以提取到前面

abxaa=0\vec{a} \vec{b}-x \vec{a} \vec{a}=0

即得到

x=abaa...(5)x=\dfrac{\vec{a} \vec{b}}{\vec{a} \vec{a}} ...(5)

将(5)带入(1)式得

p=abaaa...(1.1)\boxed{ p =\dfrac{\vec{a} \vec{b}}{\vec{a} \vec{a}} {\vec{a}} ...(1.1) }

这就是投影公式,要完全理解这个等式可能比较困难,下面让我举一个具体的例子就明白了。

举例

假设有两个向量: a=(5,2)\boldsymbol{a}=(5,2)b=(2,3)\boldsymbol{b}=(2,3) 计算bbaa 上的投影。

图片{width=350px}

我们先计算一下 x=abaax=\dfrac{\boldsymbol{a b}}{\boldsymbol{a a}} 因为两个向量内积,为两个向量坐标分量直接乘积,所以, ab=52+23=16\boldsymbol{ab}=5*2+2*3=16 aa=52+22=29\boldsymbol{aa}=5^2+2^2=29

所以x=1629x=\dfrac{16}{29}

所以 p=xa=1629(5,2)=(8029,3229)p=x\boldsymbol{a}= \dfrac{16}{29} (5,2)= (\dfrac{80}{29},\dfrac{32}{29})

现在你可以看到,投影向量 pp只不过是向量aa的缩放版本。

投影矩阵

给定 aRma \in R ^mbRmb \in R ^m ,上面我们从向量的角度除非,给出了 bbaa 上的投影 pp。现在再从矩阵的角度理解这个问题:能否找到一个矩阵 PP ,使得我们有:

Pb=pP\boldsymbol{b}=\boldsymbol{p}

可以证明

P=aaaaP=\dfrac{a a^{\top}}{a^{\top} a}

这里 PP 是一个 m×mm \times m 的矩阵。

证明.

Pb=aaaab=aabaa=abaaa=abaaa=pPb=\frac{a a^{\top}}{a^{\top} a} b=\frac{a a^{\top} b}{a^{\top} a}=\frac{a^{\top} b a}{a^{\top} a}=\frac{a^{\top} b}{a^{\top} a} a=p

三维投影

如下图: 1.平面AAa1a_1a2a_2 张成的平面。 2.a1a_1a2a_2 是 A 的列向量 即:

A=[a1a2]A=\left[\begin{array}{ll} a_1 & a_2 \end{array}\right]

我们看到的平面是一个列空间,由列向量 a1a_1a2a_2 表示。AA 是一个矩阵,其中包含了这些列向量。现在我们要做的是将不在这个平面上的向量bb投影到平面上。

就像在二维示例中一样,我们定义了两个向量 ppee

图片{width=450px}

1.因为 pp 在平面内,所以 pp 可以表示为 a1,a2a_1, a_2 的线性组合, x1,x2x_1, x_2 为常数

p=Ax=x1a1+x2a2p=A x=x_1 a_1+x_2 a_2

2.在 b,pb, p 平面内,向量 ee 依然可以表示为:

e=bp=bAxe=b-p=b-A x

由于ee 垂直于平面,根据两个向量垂直内积为零,可以建立如下两个方程。

{a1e=0a2e=0\left\{\begin{array}{l} a_1 e=0 \\ a_2 e=0 \end{array}\right.

将这两个等式合并并进行相应的修改,我们就得到了缩放因子xx. 然后将 ee 代入后

[a1a2](bAx)=[00]\left[\begin{array}{l} a_1 \\ a_2 \end{array}\right](b-A x)=\left[\begin{array}{l} 0 \\ 0 \end{array}\right]

通过解这个方程也可以求得投影P向量。 有了上面二维和三维作为铺垫,现在可以推广到nn维了。

n维向量投影

RnR ^n 中给出的非零向量 uu, 考虑 RnR ^n 中一个向量 yy 分解为两个向量之和的问题, 一个向量是向量 uu 的数量乘积,另一个向量与 uu 垂直。根据向量运算的平行四边形法则,我们期望写成

y=y^+z...(1)y=\hat{y}+z ...(1)

其中 y^=αu,α\hat{ y }=\alpha u , \alpha 是一个数, zz 是一个垂直于 uu 的向量,见下图.

对给定数 α\alpha, 记 z=yαuz= y -\alpha u,则方程(1)可以满足,那么 yy^y -\hat{ y }uu 正交的充分必要条件是

0=(yαu)u=yu(αu)u=yuα(uu)0=( y -\alpha u ) \cdot u = y \cdot u -(\alpha u ) \cdot u = y \cdot u -\alpha( u \cdot u )

图片

也就是满足方程 (1), 且 zzuu 正交的充分必要条件是

α=yuuu\boxed{ \alpha=\dfrac{ y \cdot u }{ u \cdot u } }

y^=yuuuu\boxed{ \hat{y}=\dfrac{ y \cdot u }{ u \cdot u } \cdot u }

这就是投影公式。

向量 y^\hat{ y } 称为 yyuu上的正交投影,向量 zz 称为 yy 垂直 uu 的分量.

。有时用 projLy\operatorname{proj}_L y 来表示 y^\hat{ y }, 并称之为 yyuu 上的正交投影, 即

y^=projLy=yuuuu...(2)\boxed { \hat{y}=\operatorname{proj}_L y=\frac{y \cdot u}{u \cdot u} \cdot u ...(2) }

例题

假设 y=[76]y =\left[\begin{array}{l}7 \\ 6\end{array}\right]u=[42]u =\left[\begin{array}{l}4 \\ 2\end{array}\right], 找出 yyuu 上的正交投影, 然后将 yy 写成两个正交向量之和,一个在 Span{u}\operatorname{Span}\{ u \}, 另一个与 uu 正交.

解 计算

yu=[76][42]=40uu=[42][42]=20\begin{aligned} & y \cdot u =\left[\begin{array}{l} 7 \\ 6 \end{array}\right] \cdot\left[\begin{array}{l} 4 \\ 2 \end{array}\right]=40 \\ & u \cdot u =\left[\begin{array}{l} 4 \\ 2 \end{array}\right] \cdot\left[\begin{array}{l} 4 \\ 2 \end{array}\right]=20 \end{aligned}

yyuu 上的正交投影是:

y^=yuuuu=4020u=2[42]=[84]\hat{ y }=\frac{ y \cdot u }{ u \cdot u } \cdot u =\frac{40}{20} u =2\left[\begin{array}{l} 4 \\ 2 \end{array}\right]=\left[\begin{array}{l} 8 \\ 4 \end{array}\right]

yy 垂直于 uu 的分量是:

yy^=[76][84]=[12]y -\hat{ y }=\left[\begin{array}{l} 7 \\ 6 \end{array}\right]-\left[\begin{array}{l} 8 \\ 4 \end{array}\right]=\left[\begin{array}{r} -1 \\ 2 \end{array}\right]

两个向量之和为 yy, 即 图片

向量 yy 的分解可表示为下图. 图片

作为检验、计算

y^(yy^)=[84][12]=8+8=0\hat{ y } \cdot( y -\hat{ y })=\left[\begin{array}{l} 8 \\ 4 \end{array}\right] \cdot\left[\begin{array}{r} -1 \\ 2 \end{array}\right]=-8+8=0

从高中物理的角度上看,合力y被分解为一个是沿着uu方向的水平力,一个是沿着yy^y-\hat{y}方向上的垂直力。

向量间的距离

由于上图中连接 yyy^\hat{y} 的线段垂直于 LL, 由 y^\hat{ y } 的构造可知, 标记为 y^\hat{ y } 的点是 yy 距离 LL最近点. (这可用几何方法证明,)

计算上例中从 yyLL 的距离。 解 从 yyLL 的距离,是从 yy 到正交投影垂直线段的长度,这个长度等于 yy^y -\hat{y} 的长度,从而距离为

yy^=(1)2+22=5\|y-\hat{y}\|=\sqrt{(-1)^2+2^2}=\sqrt{5}

几何解释

对于 W=R2=Span{u1,u2},u1W= R ^2=\operatorname{Span}\left\{u_1, u _2\right\}, u _1u2u _2 相互正交的情形,很容易看到分解式,对任意 R2R ^2 中的向量 yy 可以写成:

y=yu1u1u1u1+yu2u2u2u2...(3)y =\frac{ y \cdot u _1}{ u _1 \cdot u _1} u _1+\frac{ y \cdot u _2}{ u _2 \cdot u _2} u _2 ...(3)

(3)中的第一项是 yy 在子空间 Span{u1}\operatorname{Span}\left\{ u _1\right\} 上的投影(通过原点和 u1u _1 的直线),第二项 yy 在子空间 Span {u2}\left\{ u _2\right\} 上的投影,(3)式将 yy 表示为由 y1y _1y2y _2 确定的(正交)轴上的投影之和,

图片

单位正交集

集合 {u1,,up}\left\{ u _1, \cdots, u _p\right\} 是一个单位正交集,如果它是由单位向量构成的正交集。如果 WW 是一个由单位正交集合组成的子空间,那么 {u1,,up}\left\{ u _1, \cdots, u _p\right\}WW 的单位正交基,原因是这类集合自然线性无关.

最简单的单位正交集合是 RnR ^n 中的标准基 {e1,,en}\left\{ e _1, \cdots, e _n\right\}, 任何集合 {e1,,en}\left\{ e _1, \cdots, e _n\right\} 的非空子集也是单位正交的, 下面是一个更复杂的例子.

证明 {u1,u2,u3}\left\{ u _1, u _2, u _3\right\}R3R ^3 的一个单位正交基, 其中:

v1=[3/111/111/11]v2=[1/62/61/6]v3=[1/664/667/66]v _1=\left[\begin{array}{l} 3 / \sqrt{11} \\ 1 / \sqrt{11} \\ 1 / \sqrt{11} \end{array}\right] \quad v _2=\left[\begin{array}{r} -1 / \sqrt{6} \\ 2 / \sqrt{6} \\ 1 / \sqrt{6} \end{array}\right] \quad v _3=\left[\begin{array}{c} -1 / \sqrt{66} \\ -4 / \sqrt{66} \\ 7 / \sqrt{66} \end{array}\right]

解 计算

v1v2=3/66+2/66+1/66=0v1v3=3/7264/726+7/726=0v2v3=1/3968/396+7/396=0\begin{aligned} & v_1 \cdot v_2=-3 / \sqrt{66}+2 / \sqrt{66}+1 / \sqrt{66}=0 \\ & v_1 \cdot v_3=-3 / \sqrt{726}-4 / \sqrt{726}+7 / \sqrt{726}=0 \\ & v_2 \cdot v_3=1 / \sqrt{396}-8 / \sqrt{396}+7 / \sqrt{396}=0 \end{aligned}

从而 {v1,v2,v3}\left\{ v _1, v _2, v _3\right\} 是一个正交基, 另外

v1v1=9/11+1/11+1/11=1v2v2=1/6+4/6+1/6=1v3v3=1/66+16/66+49/66=1\begin{aligned} & v_1 \cdot v_1=9 / 11+1 / 11+1 / 11=1 \\ & v_2 \cdot v_2=1 / 6+4 / 6+1 / 6=1 \\ & v_3 \cdot v_3=1 / 66+16 / 66+49 / 66=1 \end{aligned}

从而证明 v1,v2v_1, v_2v3v_3 是单位向量,即 {v1,v2,v3}\left\{v_1, v_2, v_3\right\} 是一个单位正交集。由于集合线性无关,它的 \because 个向量构成 R3R ^3 的一个基, 见图 图片 当一个正交集中的向量被 "单位化" 具有单位长度后, 这些新向量仍然保持正交性, 因此新的集合成为单位正交基

7._向量投影 - 线性代数 | OpenTech