9._施密特正交化过程

向量减法

在理解施密特正交化之前,还是回顾一下向量减法。在高中介绍过向量的三角形法则, ab=a+(b)\vec{a}-\vec{b}=\vec{a}+(\vec{-b}), 表示如下,也就是向量减法里,向量的起点是BB,终点是AA, 即由BB指向AA, 详见 向量加减

图片{width=200px} 记住这个结论,稍后将会用到。

重要 在学习本文前务必理解了本章前面已经介绍的向量投影

施密特正交化简单解释

假设有两个线性无关的向量 aabb, 现在标准正交化这两个向量,让它们变成互相垂直的 q1q_1q2q_2 。 所谓向量正交化就是找到一组垂直的向量 q1q_1q2q_2,使得他们可以很容易的表示出aabb.

在理解正交化之前,我们举一个小例子:假设你是老师,要寻找班级里身高最高的学生,你会怎么做?你会让学生排成一排,然后从第一个学生开始,你默认他是班级里最高的,然后用第二个学生和第一个学生比较,如果第二个比第一个高,则交换他们的位置,否则,保持位置不变。 然后用第三个人还和“第一个”人比较,如果第三个人比第一个人高,则交换他们的位置,否则,保持不变,以此类推,最终,“第一个”人就是班级里最高的。施密特正交化的思想和此类似,给你一组向量,要找到一组互相垂直的向量,那我随便选一个作为基准,后续向量和他垂直即可。

现在有两个向量a,ba,b,首先保持 aa 不变让向量 A=aA=a ,接下来要寻找到另一个向量 BB ,使得 ABA \perp B (参考下图) 。假设BB已经找到,容易看到ppbbaa 上的投影, 根据上面介绍的向量的三角形减法法则,BB 就相当于bpb-p 接下来的工作是看看BB怎么用a,ba,b来表示。

图片

pp 相当于 aa 放缩了 xx 倍,在一维空间内, xx 是一个标量,可以表示为 (参考内积):

x=aTbaTap=xa=aTbaTaxaB=bp=baTbaTaxa\begin{gathered} x=\frac{a^T b}{a^T a} \\ p= x \boldsymbol{a}=\frac{a^T b}{a^T a} x \boldsymbol{a} \\ \therefore B=b-p=b- \frac{a^T b}{a^T a} x \boldsymbol{a} \end{gathered}

这相当于 BBbb 减去 bbaa 上的投影.

最后将 AA 变成指向 AA 方向的单位向量, BB 变成指向 BB 方向的单位向量:

q1=AA,q2=BBq_1=\frac{A}{\|A\|}, \quad q_2=\frac{B}{\|B\|}

这就是格拉姆-施密特正交化方法。

简单举例

假设有两个向量: a=[52]\boldsymbol{a}=\left[\begin{array}{c}5\\2\end{array} \right] b=[23]\boldsymbol{b}=\left[\begin{array}{c}2\\3\end{array} \right]

图片{width=350px}

仿照上面的步骤,看看怎么把他们正交化,我们必须时刻记着我们的目的是什么:找两个向量A,BA,B,他们模长为1,且互相垂直。

所以,对于AA直接使用aa即可,即A=[52]A=\left[\begin{array}{c}5\\2\end{array} \right]

可以看到,对于AA还是非常好找的,直接令A=aA=a即可。

接下来找BB,我们先计算一下 x=aTbaTax=\dfrac{\boldsymbol{a^T b}}{\boldsymbol{a^T a}} 因为两个向量内积,为两个向量坐标分量直接乘积,所以,

aTb=[5,2][23]=16\boldsymbol{a^T b}=[5,2] * \left[\begin{array}{c}2\\3\end{array} \right] = 16
aTa=[5,2][52]=29\boldsymbol{a^T a}=[5,2] * \left[\begin{array}{c}5\\2\end{array} \right] = 29

所以x=1629x=\dfrac{16}{29}

所以 p=xa=1629(5,2)=(8029,3229)p=x\boldsymbol{a}= \dfrac{16}{29} (5,2)= (\dfrac{80}{29},\dfrac{32}{29})

因此B=bp=[23][80293229]=[22295529]B=b-p=\left[\begin{array}{c}2\\3\end{array} \right] - \left[\begin{array}{c} \frac{80}{29}\\\frac{32}{29}\end{array} \right]= \left[\begin{array}{c} \frac{-22}{29}\\ \frac{55 }{29} \end{array} \right]

这样,我们就找到了一组互相垂直的向量A,BA,B,即

A=[52]A=\left[\begin{array}{c}5\\2\end{array} \right]
B=[22295529]B=\left[\begin{array}{c} \frac{-22}{29}\\ \frac{55 }{29} \end{array} \right]

单位化

上面找到的A,B是互相垂直的向量,但是我们还要向量的模长为1,所以需要把A,BA,B单位化(单位化见此处)。

A=52+22=29||A||=\sqrt{5^2+2^2}=\sqrt{29}

q1=[529229]q_1= \left[\begin{array}{c}\frac{5}{\sqrt{29}}\\\frac{2}{\sqrt{29}}\end{array} \right]

B=112929||B||= \dfrac{11 \sqrt{29}}{29} ,所以

q2=129[25]q_2=\dfrac{1}{\sqrt{29}} \left[\begin{array}{c} -2\\5\end{array} \right]

这样 q1,q2q_1,q_2 就是我们找到的正交向量组。

施密特正交化定义

α1,α2,,αr\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_r 是向量空间 VV 的一个基,从基 α1,α,,αr\boldsymbol{\alpha}_1, \boldsymbol{\alpha}, \cdots, \boldsymbol{\alpha}_r 出发,找一组两两正交的单位向量, ξ1,ξ2,,ξr\xi_1, \xi_2, \cdots, \xi_r , 使 ξ1,ξ2,,ξr\xi_1, \xi_2, \cdots, \xi_rα1,α2,,αr\alpha_1, \alpha_2, \cdots, \alpha_r 等价, 这个过程称为把基 α1,α2,,αr\alpha_1, \alpha_2, \cdots, \alpha_r 规范正交化.

具体步骤如下: 第一步,将基 α1,α2,,αr\alpha_1, \alpha_2, \cdots, \alpha_r 正交化 (施密特 (Schmidt) 正交化过程) .

β1=α1,β2=α2[α2,β1][β1,β1]β1,β3=α3[α3,β1][β1,β1]β1[α3,β2][β2,β2]β2\begin{aligned} & \beta_1=\alpha_1, \\ & \beta_2=\alpha_2-\frac{\left[\alpha_2, \beta_1\right]}{\left[\beta_1, \beta_1\right]} \beta_1, \\ & \beta_3=\alpha_3-\frac{\left[\alpha_3, \beta_1\right]}{\left[\beta_1, \beta_1\right]} \beta_1-\frac{\left[\alpha_3, \beta_2\right]}{\left[\beta_2, \beta_2\right]} \beta_2 \text {, } \\ & \end{aligned}

第二步,将 β1,β2,,βr\beta_1, \beta_2, \cdots, \beta_r 单位化,得到 ξ1=1β1β1,ξ2=1β2β2,,ξr=1βrβr\xi_1=\frac{1}{\left\|\beta_1\right\|} \beta_1, \quad \xi_2=\frac{1}{\left\|\beta_2\right\|} \beta_2, \cdots, \xi_r=\frac{1}{\left\|\beta_r\right\|} \beta_r 于是, ξ1,ξ2,,ξ2\xi_1, \xi_2, \cdots, \xi_2 就是 VV 的一个规范正交基.

上面计算里,[β1,α2]\left[\beta_1, \alpha_2\right] 表示 向量β1,α2\beta_1, \alpha_2的内积(见下面例题)[β1,β1]\left[\beta_1, \beta_1\right] 表示 β1\beta_1和自己的内积,即模长的平方。

记忆方法

施密特对角化看起来很复杂,但是有规律可循,假设给你四个向量α1,α2,α3,α4\alpha_1,\alpha_2,\alpha_3,\alpha_4 要用施密特正交化找到四个向量 β1,β2,β3,β4\beta_1,\beta_2,\beta_3,\beta_4 可以参考下面视频:(视频来B站自宋浩《线性代数》教材)

α1=(111),α2=(041),α3=(211)\boldsymbol{\alpha}_1=\left(\begin{array}{c}1 \\ 1 \\ -1\end{array}\right), \boldsymbol{\alpha}_2=\left(\begin{array}{l}0 \\ 4 \\ 1\end{array}\right), \boldsymbol{\alpha}_3=\left(\begin{array}{c}-2 \\ 1 \\ 1\end{array}\right)R3\mathbf{R}^3 的一个基,求一个与 α1,α2,α3\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \boldsymbol{\alpha}_3 等价的规范正交基. 解 取

β1=α1=(111),β2=α2[β1,α2][β1,β1]β1=(041)33(111)=(132),β3=α3[β1,α3][β1,β1]β1[β2,α3][β2,β2]β2=(211)23(111)714(132)=(561623),\begin{aligned} & \boldsymbol{\beta}_1=\boldsymbol{\alpha}_1=\left(\begin{array}{c} 1 \\ 1 \\ -1 \end{array}\right), \\ & \boldsymbol{\beta}_2=\boldsymbol{\alpha}_2-\frac{\left[\boldsymbol{\beta}_1, \boldsymbol{\alpha}_2\right]}{\left[\boldsymbol{\beta}_1, \boldsymbol{\beta}_1\right]} \boldsymbol{\beta}_1=\left(\begin{array}{l} 0 \\ 4 \\ 1 \end{array}\right)-\frac{3}{3}\left(\begin{array}{c} 1 \\ 1 \\ -1 \end{array}\right)=\left(\begin{array}{c} -1 \\ 3 \\ 2 \end{array}\right), \\ & \boldsymbol{\beta}_3=\boldsymbol{\alpha}_3-\frac{\left[\boldsymbol{\beta}_1, \boldsymbol{\alpha}_3\right]}{\left[\boldsymbol{\beta}_1, \boldsymbol{\beta}_1\right]} \boldsymbol{\beta}_1-\frac{\left[\boldsymbol{\beta}_2, \boldsymbol{\alpha}_3\right]}{\left[\boldsymbol{\beta}_2, \boldsymbol{\beta}_2\right]} \boldsymbol{\beta}_2=\left(\begin{array}{c} -2 \\ 1 \\ 1 \end{array}\right)-\frac{2}{3}\left(\begin{array}{c} 1 \\ 1 \\ -1 \end{array}\right)-\frac{7}{14}\left(\begin{array}{c} -1 \\ 3 \\ 2 \end{array}\right)=\left(\begin{array}{c} -\frac{5}{6} \\ \frac{1}{6} \\ -\frac{2}{3} \end{array}\right), \end{aligned}

再将 β1,β2,β3\boldsymbol{\beta}_1, \boldsymbol{\beta}_2, \boldsymbol{\beta}_3 单位化,得到 ξ1=1β1β1=13(111),ξ2=1β2β2=114(132),ξ3=1β3β3=142(514)\xi_1=\frac{1}{\left\|\boldsymbol{\beta}_1\right\|} \boldsymbol{\beta}_1=\frac{1}{\sqrt{3}}\left(\begin{array}{c}1 \\ 1 \\ -1\end{array}\right), \boldsymbol{\xi}_2=\frac{1}{\left\|\boldsymbol{\beta}_2\right\|} \boldsymbol{\beta}_2=\frac{1}{\sqrt{14}}\left(\begin{array}{c}-1 \\ 3 \\ 2\end{array}\right), \xi_3=\frac{1}{\left\|\boldsymbol{\beta}_3\right\|} \boldsymbol{\beta}_3=\frac{1}{\sqrt{42}}\left(\begin{array}{c}-5 \\ 1 \\ -4\end{array}\right), ξ1,ξ2,ξ3\xi_1, \xi_2, \xi_3 即为所求.

在上面计算里,[β1,α2]=10+14+(1)1=3\left[\boldsymbol{\beta}_1, \boldsymbol{\alpha}_2\right]= 1*0+1*4+(-1)*1=3 (即坐标对应乘积之和)

[β1,β1]=12+12+12=3\left[\boldsymbol{\beta}_1, \boldsymbol{\beta}_1\right]= 1^2+1^2+1^2=3 (即坐标平方之和)

上面是教材上常给的定义,但是很少进行解释。下面对上面进行几何解释。

如何理解施密特(Schmidt)正交化

为什么要使用施密特正交化法

在一个平面,或者三维空间中,任意一点都可以被坐标系表示出来。而我们更喜欢的是单位直角坐标系,因为在一个单位直角坐标系中,任意一个向量的坐标分量,通过简单的投影就可以搞定。

虽然我们喜欢用笛卡尔坐标系,但是其实任何模长为1切互相垂直的向量都可以坐标系。 因此,如何找到欧式空间的一个“直角坐标系”,变得非常重要。施密特正交化法就告诉我们了一种把“任意坐标系”变为“直角坐标系”的方法。

利用这个投影公式,我们便可以轻松理解施密特正交化法。如果您还未理解向量投影,请点击向量投影此处

我们首先需要理解一个向量 α2\alpha_2 在另外一个向量 α1\alpha_1 的投影公式。只要利用正交的定义,就很容易知道 α2\alpha_2α1\alpha_1 的投影向量为

(α2,α1)(α1,α1)α1\frac{\left(\alpha_2, \alpha_1\right)}{\left(\alpha_1, \alpha_1\right)} \alpha_1

02.gif{width=450px}

二维空间施密特正交化

平面上任意两个不共线的向量都可以构成平面的一个坐标系(也就是一组基),我们可以利用这两个向量之间的投影得到两个正交的向量:

Step1: 令 β1=α1\beta_1=\alpha_1

Step2: 做向量 α2\alpha_2 在向量 β1=α1\beta_1=\alpha_1 的投影,并与 α2\alpha_2 做差得到

β2=α2(β1,α2)(β1,β1)β1\beta_2=\alpha_2-\frac{\left(\beta_1, \alpha_2\right)}{\left(\beta_1, \beta_1\right)} \beta_1

03.gif

三维空间施密特正交化

对于一个三维欧空间来说, 我们看看如何利用施密特正交化法将这一组基正交化。

Step1: 令 β1=α1\beta_1=\alpha_1 04.gif

Step2:做向量α2\alpha_2 在向量 β1=α1 \beta_1=\alpha_1 的投影,并与 α2\alpha_2 做差得到 β2=α2(α2,β1)(β1,β1)β1:\beta_2=\alpha_2-\frac{\left(\alpha_2, \beta_1 \right)}{\left(\beta_1, \beta_1\right)} \beta_1: 04.gif

Step3: 分别做向量 α3\alpha_3 在向量 β1,β2\beta_1, \beta_2 的投影 (β1,α3)(β1,β1)β1,(β2,α3)(β2,β2)β2\frac{\left(\beta_1, \alpha_3\right)}{\left(\beta_1, \beta_1\right)} \beta_1, \frac{\left(\beta_2, \alpha_3\right)}{\left(\beta_2, \beta_2\right)} \beta_2 ,利用 α3\alpha_3 减去两个投影的和得到

β3=α3(β1,α3)(β1,β1)β1(β2,α3)(β2,β2)β2\beta_3=\alpha_3-\frac{\left(\beta_1, \alpha_3\right)}{\left(\beta_1, \beta_1\right)} \beta_1-\frac{\left(\beta_2, \alpha_3\right)}{\left(\beta_2, \beta_2\right)} \beta_2

请仔细观察下图理解。

04.gif

对于n维空间,和2维,3维类似。

下一节将给出具体例题,看过例题后,再来回顾本文介绍的内容。