17._基变换与坐标变换_过渡矩阵

为什么会有基变换与坐标变换

对于基变换,最容易理解的是“火车模型”,想象火车以 100m/s100m/s 匀速向东行驶,火车里有一个水杯,AA站在地面上,对于AA而言,他看到水杯在以100m/s100m/s匀速运动,而对于坐在火车里的BB而言,水杯是静止的,根据运动的相对论,那么A,BA,B对于水杯的速度描述,会有一个转换“公式”,这就是坐标变换。

进一步,如果地面的基准速度为0m/s0m/s,火车的速度为100m/s100m/s,地面上另一个人CC以速度v=30m/sv=30m/s 向东运动时, 则v=100v=70m/sv'=100-v=70m/s ,这意味在AA看到火车速度为100m/s100m/sCC看来火车速度为70m/s70m/s ,我们甚至可以写出简单的速度转换公式 vx=vxvv_x'=v_x-v ,其中vv是坐标系转换速度。

图片{width=550px}

其实上面语境有一个陷阱,当我们一开始说火车以100m/s100m/s 匀速向东行驶时,隐含着我们以地面为参照物,如果我们以BB为参照物,我们可以说,火车是静止的,地面上的AA在以100m/s100m/s 向西运动。 这就是运动的相对性。 详见伽利略变换与洛伦兹变换

基变换可以通俗理解就是高中物理课中说的“参照物”改变了,而坐标变化就是在参照物变了的情况下,对同一运动运动变化的转化

线性空间里的基变换

在一个有限维线性空间 VV 内,基的选取并不唯一,实际上有无穷多组不同的基.特别要指出的是,如果 ε1,ε2,,εn\varepsilon_1, \varepsilon_2, \cdots, \varepsilon_nVV 的一组基,那么把它们按任意次序重排得 εi1,εi2,,εin\varepsilon_{i_1}, \varepsilon_{i_2}, \cdots, \varepsilon_{i_n} 仍为 VV 的一组基(因为它也是 nn 个线性无关向量),而且与原来的基不同(因为一个向量 α\alpha 在这两组基下的坐标是 KnK^n 中两个不同向量).由此立即需要解决一个问题:找出 VV 中两组基之间的关系

注意:本节内容较为抽象,如果您理解有困难, 可以先阅读下一节 基变换的几何意义 然后再来阅读本文。

过渡矩阵

设在 nn 维线性空间 VV 内给定两组基

ε1,ε2,,εn,η1,η2,,ηn,\begin{aligned} & \varepsilon_1, \varepsilon_2, \cdots, \varepsilon_n, \\ & \eta_1, \eta_2, \cdots, \eta_n, \end{aligned}

每个 ηi\eta_i 都能被 ε1,ε2,,εn\varepsilon_1, \varepsilon_2, \cdots, \varepsilon_n 线性表示.设

η1=t11ε1+t21ε2++tn1εn,η2=t12ε1+t22ε2++tn2εn,ηn=t1nε1+t2nε2++tnnεn.\begin{aligned} & \eta_1=t_{11} \varepsilon_1+t_{21} \varepsilon_2+\cdots+t_{n 1} \varepsilon_n, \\ & \eta_2=t_{12} \varepsilon_1+t_{22} \varepsilon_2+\cdots+t_{n 2} \varepsilon_n, \\ & \cdots \cdots \cdots \cdots \cdots \cdots \cdots \cdots \\ & \eta_n=t_{1 n} \varepsilon_1+t_{2 n} \varepsilon_2+\cdots+t_{n n} \varepsilon_n . \end{aligned}

再度借助矩阵乘法法则,把上面的公式形式地写成

(η1,η2,,ηn)=(ε1,ε2,,εn)[t11t12t1nt21t22t2ntn1tn2tnn].\left(\eta_1, \eta_2, \cdots, \eta_n\right)=\left(\varepsilon_1, \varepsilon_2, \cdots, \varepsilon_n\right)\left[\begin{array}{cccc} t_{11} & t_{12} & \cdots & t_{1 n} \\ t_{21} & t_{22} & \cdots & t_{2 n} \\ \vdots & \vdots & & \vdots \\ t_{n 1} & t_{n 2} & \cdots & t_{n n} \end{array}\right] .

T=[t11t12t1nt21t22t2ntn1tn2tnn].T=\left[\begin{array}{cccc} t_{11} & t_{12} & \cdots & t_{1 n} \\ t_{21} & t_{22} & \cdots & t_{2 n} \\ \vdots & \vdots & & \vdots \\ t_{n 1} & t_{n 2} & \cdots & t_{n n} \end{array}\right] .

TT 为从基 ε1,ε2,,εn\varepsilon_1, \varepsilon_2, \cdots, \varepsilon_n 到基 η1,η2,,ηn\eta_1, \eta_2, \cdots, \eta_n过渡矩阵

基变换公式

在上面推导过渡矩阵的过程中,得到了一个公式

(η1,η2,,ηn)=(ε1,ε2,,εn)T...(基变换公式)\boxed{ \left(\eta_1, \eta_2, \cdots, \eta_n\right)=\left(\varepsilon_1, \varepsilon_2, \cdots, \varepsilon_n\right) T ...(\text{基变换公式}) }

上式就称为基(η1,η2,,ηn)\left(\eta_1, \eta_2, \cdots, \eta_n\right)(ε1,ε2,,εn)\left(\varepsilon_1, \varepsilon_2, \cdots, \varepsilon_n\right) 基变换公式,其中 TT 称作从基(η1,η2,,ηn)\left(\eta_1, \eta_2, \cdots, \eta_n\right)(ε1,ε2,,εn)\left(\varepsilon_1, \varepsilon_2, \cdots, \varepsilon_n\right) 的过渡矩阵。

根据上面的命题,两组基之间的过渡矩阵是可逆矩阵.反过来,从一组给定的基出发,借助于某一可逆矩阵 TT ,就可以获得一组新的基.

坐标变换公式

VV 中一个向量 α\alpha 在第一组基 ε1,ε2,,εn\varepsilon_1, \varepsilon_2, \cdots, \varepsilon_n 下的坐标为 x1,x2x_1, x_2,xn\cdots, x_n ,即

α=x1ε1+x2ε2++xnεn=(ε1,ε2,,εn)[x1x2xn].\alpha=x_1 \varepsilon_1+x_2 \varepsilon_2+\cdots+x_n \varepsilon_n=\left(\varepsilon_1, \varepsilon_2, \cdots, \varepsilon_n\right)\left[\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right] .

又设 α\alpha 在第二组基 η1,η2,,ηn\eta_1, \eta_2, \cdots, \eta_n 下的坐标为 x1,x2,,xnx'_1, x'_2, \cdots, x'_n ,即

α=x1η1+x2η2++xnηn=(η1,η2,,ηn)[x1x2xn].\alpha=x'_1 \eta_1+x'_2 \eta_2+\cdots+x'_n \eta_n=\left(\eta_1, \eta_2, \cdots, \eta_n\right)\left[\begin{array}{c} x'_1 \\ x'_2 \\ \vdots \\ x'_n \end{array}\right] .

现设两组基间的过渡矩阵为 TT ,即

(η1,η2,,ηn)=(ε1,ε2,,εn)T.\left(\eta_1, \eta_2, \cdots, \eta_n\right)=\left(\varepsilon_1, \varepsilon_2, \cdots, \varepsilon_n\right) T .

x=[x1x2xn],x=[x1x2xn]\boldsymbol{x}=\left[\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right], \quad \boldsymbol{x'}=\left[\begin{array}{c} x'_1 \\ x'_2 \\ \vdots \\ x'_n \end{array}\right]

那么

α=(ε1,ε2,,εn)x=(η1,η2,,ηn)x.\alpha=\left(\varepsilon_1, \varepsilon_2, \cdots, \varepsilon_n\right) \boldsymbol{x}=\left(\eta_1, \eta_2, \cdots, \eta_n\right) \boldsymbol{x'} .

以关系式

(η1,η2,,ηn)=(ε1,ε2,,εn)T\left(\eta_1, \eta_2, \cdots, \eta_n\right)=\left(\varepsilon_1, \varepsilon_2, \cdots, \varepsilon_n\right) T

代入,得

(ε1,ε2,,εn)x=[(ε1,ε2,,εn)T]x=(ε1,ε2,,εn)(Tx).\begin{aligned} \left(\varepsilon_1, \varepsilon_2, \cdots, \varepsilon_n\right) \boldsymbol{x} & =\left[\left(\varepsilon_1, \varepsilon_2, \cdots, \varepsilon_n\right) T\right] \boldsymbol{x'} =\left(\varepsilon_1, \varepsilon_2, \cdots, \varepsilon_n\right)(T \boldsymbol{x'}) . \end{aligned}

由于 ε1,ε2,,εn\varepsilon_1, \varepsilon_2, \cdots, \varepsilon_n 是一组基,线性无关,它们的两个线性组合相等时,对应系数相等,故得

x=Tx\boxed{ \boldsymbol{x}=T \boldsymbol{x'} }

把上面公式左乘以T1T^{-1}

x=T1x\boxed{ \boldsymbol{x'}=T^{-1} \boldsymbol{x} }

这就是我们所寻求的坐标变换公式

如何求解不同基下的过渡矩阵?通常使用单位坐标基进行转换。

取定 R3R ^3 中两组基 α1=(110)α2=(101),α3=(011)\alpha _1=\left(\begin{array}{l}1 \\ 1 \\ 0\end{array}\right) \alpha _2=\left(\begin{array}{l}1 \\ 0 \\ 1\end{array}\right), \alpha _3=\left(\begin{array}{l}0 \\ 1 \\ 1\end{array}\right)β1=(112),β2=(123),β3=(121)\beta _1=\left(\begin{array}{c}1 \\ 1 \\ -2\end{array}\right), \beta _2=\left(\begin{array}{l}1 \\ 2 \\ 3\end{array}\right), \beta _3=\left(\begin{array}{l}-1 \\ 2 \\ 1\end{array}\right), 求从基 α1,α2,α3\alpha _1, \alpha _2, \alpha _3 到基 β1,β2,β3\beta _1, \beta _2, \beta _3 的过渡矩阵 PP.

解 记矩阵 A=(α1,α2,α3)B=(β1,β2,β3)A =\left( \alpha _1, \alpha _2, \alpha _3\right) , B =\left( \beta _1, \beta _2, \beta _3\right) ,则从自然基 e1,e2,e3e _1, e _2, e _3 到基 α1,α2,α3\alpha _1, \alpha _2, \alpha _3 的过渡矩阵就是 AA , 从基 e1,e2,e3e _1, e _2, e _3 到基 β1,β2,β3\beta _1, \beta _2, \beta _3 的过渡矩阵就是 BB. 于是有:

(β1,β2,β3)=(e1,e2,e3)B...\left( \beta _1, \beta _2, \beta _3\right)=\left( e _1, e _2, e _3\right) B ...①

(α1,α2,α3)=(e1,e2,e3)A...\left( \alpha _1, \alpha _2, \alpha _3\right)=\left( e _1, e _2, e _3\right) A ...②

由②得 (α1,α2,α3)A1=(e1,e2,e3)...\left( \alpha _1, \alpha _2, \alpha _3\right) A^{-1}=\left( e _1, e _2, e _3\right) ...③

将③带入① 有

(β1,β2,β3)=(e1,e2,e3)B=(α1,α2,α3)A1B\left( \beta _1, \beta _2, \beta _3\right)=\left( e _1, e _2, e _3\right) B =\left( \alpha _1, \alpha _2, \alpha _3\right) A ^{-1} B.

P=A1BP=A^{-1} B , 则矩阵 PP 就是从基 α1,α2,α3\alpha_1, \alpha_2, \alpha_3 到基 β1,β2,β3\beta_1, \beta_2, \beta_3 的过渡矩阵.

通过上面推导,可以看到求过渡矩阵的方法:给定两个矩阵A,B,把这2个矩阵组成一个新矩阵 AB, 然后对新矩阵进行初等行变换,把A化成单位阵E, 则右侧就是过渡矩阵P,具体请参考 逆矩阵解方程组

即: 把矩阵(A,B)(A,B)中的AA变成EE,则BB即变成了A1BA^{-1}B

(AB)=(110111101122011231)(100200010111001122),(\boldsymbol{A} \mid \boldsymbol{B})=\left(\begin{array}{ccc|ccc} 1 & 1 & 0 & 1 & 1 & -1 \\ 1 & 0 & 1 & 1 & 2 & 2 \\ 0 & 1 & 1 & -2 & 3 & 1 \end{array}\right) \rightarrow\left(\begin{array}{ccc|ccc} 1 & 0 & 0 & 2 & 0 & 0 \\ 0 & 1 & 0 & -1 & 1 & -1 \\ 0 & 0 & 1 & -1 & 2 & 2 \end{array}\right),

因此,

P=A1B=(200111122)\boldsymbol{P}=\boldsymbol{A}^{-1} \boldsymbol{B}=\left(\begin{array}{ccc} 2 & 0 & 0 \\ -1 & 1 & -1 \\ -1 & 2 & 2 \end{array}\right)

上面这个结论要记住

已知向量αR3\alpha \in R^3 在基

α1=(110),α2=(101),α3=(011) 下的坐标是 (824), 求 α 在基 β=(112),β2=(123),β=(121) 下的坐标. \alpha _1=\left(\begin{array}{l} 1 \\ 1 \\ 0 \end{array}\right), \alpha _2=\left(\begin{array}{l} 1 \\ 0 \\ 1 \end{array}\right), \alpha _3=\left(\begin{array}{l} 0 \\ 1 \\ 1 \end{array}\right) \text { 下的坐标是 } \left(\begin{array}{l} 8 \\ -2 \\ 4 \end{array}\right) \text {, 求 } \alpha \text { 在基 } \beta =\left(\begin{array}{c} 1 \\ 1 \\ -2 \end{array}\right), \beta _2=\left(\begin{array}{l} 1 \\ -2 \\ 3 \end{array}\right), \beta =\left(\begin{array}{c} -1 \\ 2 \\ 1 \end{array}\right) \text { 下的坐标. }

解:设 α\alpha 在基 β1,β2,β3\beta _1, \beta _2, \beta _3 下的坐标为 (y1,y2,y3)T\left(y_1, y_2, y_3\right)^{ T } ,在上一个例题例已经算出,从基 α1,α2,α3\alpha _1, \alpha _2, \alpha _3 到基 β1,β2,β3\beta _1, \beta _2, \beta _3 的过渡矩阵为 P=(200111122)P=\left(\begin{array}{ccc}2 & 0 & 0 \\ -1 & 1 & -1 \\ -1 & 2 & 2\end{array}\right) , 易求得 逆矩阵 P1=(1200381214181214)P^{-1}=\left(\begin{array}{ccc}\frac{1}{2} & 0 & 0 \\ \frac{3}{8} & \frac{1}{2} & \frac{1}{4} \\ -\frac{1}{8} & -\frac{1}{2} & \frac{1}{4}\end{array}\right),

于是 (y1y2y3)=P1(x1x2x3)=(1200381214181214)(824)=(431).\begin{array}{l}\left(\begin{array}{l}y_1 \\ y_2 \\ y_3\end{array}\right)= P ^{-1}\left(\begin{array}{l}x_1 \\ x_2 \\ x_3\end{array}\right)=\left(\begin{array}{ccc}\frac{1}{2} & 0 & 0 \\ \frac{3}{8} & \frac{1}{2} & \frac{1}{4} \\ -\frac{1}{8} & -\frac{1}{2} & \frac{1}{4}\end{array}\right)\left(\begin{array}{c}8 \\ -2 \\ 4\end{array}\right)=\left(\begin{array}{l}4 \\ 3 \\ 1\end{array}\right) .\end{array}

上面这个例子还可以解释,我在静止地面上看一架飞机的坐标为 (8,2,4)(8,-2,4) , 然后我坐在汽车上(注意参照物变了)再看这架飞机的坐标变成(4,3,1)(4,3,1)

K3K^3 中给定两组基

ε1=(1,0,1),ε2=(2,1,1),ε3=(1,1,1);η1=(0,1,1),η2=(1,1,0),η3=(1,2,1),\begin{array}{lll} \varepsilon_1=(1,0,-1), & \varepsilon_2=(2,1,1), & \varepsilon_3=(1,1,1) ; \\ \eta_1=(0,1,1), & \eta_2=(-1,1,0), & \eta_3=(1,2,1), \end{array}

求它们之间的过渡矩阵 TT 。 解 分别以 ε1,ε2,ε3\varepsilon_1, \varepsilon_2, \varepsilon_3η1,η2,η3\eta_1, \eta_2, \eta_3 作列向量组排成两个矩阵 AABB

A=[121011111],B=[011112101].A=\left[\begin{array}{rrr} 1 & 2 & 1 \\ 0 & 1 & 1 \\ -1 & 1 & 1 \end{array}\right], \quad B=\left[\begin{array}{rrr} 0 & -1 & 1 \\ 1 & 1 & 2 \\ 1 & 0 & 1 \end{array}\right] .

做初等行变换如下:

(AB)=[121011011112111101][121011011112032112][121011011112001244]\begin{aligned} (A B) & =\left[\begin{array}{rrr:rrr} 1 & 2 & 1 & 0 & -1 & 1 \\ 0 & 1 & 1 & 1 & 1 & 2 \\ -1 & 1 & 1 & 1 & 0 & 1 \end{array}\right] \\ & \rightarrow\left[\begin{array}{rrr:rrr} 1 & 2 & 1 & 0 & -1 & 1 \\ 0 & 1 & 1 & 1 & 1 & 2 \\ 0 & 3 & 2 & 1 & -1 & 2 \end{array}\right] \\ & \rightarrow\left[\begin{array}{rrrrrr} 1 & 2 & 1 & 0 & -1 & 1 \\ 0 & 1 & 1 & 1 & 1 & 2 \\ 0 & 0 & -1 & -2 & -4 & -4 \end{array}\right] \end{aligned}
 于是 [120253010132001244][100011010132001244].T=[011132244].\begin{aligned} &\text { 于是 }\\ &\begin{gathered} \rightarrow\left[\begin{array}{lll:rrr} 1 & 2 & 0 & -2 & -5 & -3 \\ 0 & 1 & 0 & -1 & -3 & -2 \\ 0 & 0 & 1 & 2 & 4 & 4 \end{array}\right] \\ \rightarrow\left[\begin{array}{lll:rrr} 1 & 0 & 0 & 0 & 1 & 1 \\ 0 & 1 & 0 & -1 & -3 & -2 \\ 0 & 0 & 1 & 2 & 4 & 4 \end{array}\right] . \\ T=\left[\begin{array}{rrr} 0 & 1 & 1 \\ -1 & -3 & -2 \\ 2 & 4 & 4 \end{array}\right] . \end{gathered} \end{aligned}

P[x]4P[x]_4 中取两个基为 p0=1,p1=x,p2=x2,p3=x3,p4=x4p_0=1, p_1=x, p_2=x^2, p_3=x^3, p_4=x^4 ,及 q0=1,q1=1+x,q2=(1+x)2,q3=(1+x)3,q4=(1+x)4q_0=1, q_1=1+x, q_2=(1+x)^2, q_3=(1+x)^3, q_4=(1+x)^4 ,求从基 p0,p1,p2,p3,p4p_0, p_1, p_2, p_3, p_4 到基 q0,q1,q2,q3,q4q_0, q_1, q_2, q_3, q_4 的过渡矩阵,以及任一不超过 4 次的多项式 p=a0+a1x+a2x2+a3x3+a4x4p=a_0+a_1 x+a_2 x^2+a_3 x^3+a_4 x^4 在这两组基下的坐标和坐标变换公式.

解:解 将 q0,q1,q2,q3,q4q_0, q_1, q_2, q_3, q_4p0,p1,p2,p3,p4p_0, p_1, p_2, p_3, p_4 表示,有

(1,1+x,(1+x)2,(1+x)3,(1+x)4)=(1,x,x2,x3,x4)(1111101234001360001400001)\left(1,1+x,(1+x)^2,(1+x)^3,(1+x)^4\right)=\left(1, x, x^2, x^3, x^4\right)\left(\begin{array}{ccccc} 1 & 1 & 1 & 1 & 1 \\ 0 & 1 & 2 & 3 & 4 \\ 0 & 0 & 1 & 3 & 6 \\ 0 & 0 & 0 & 1 & 4 \\ 0 & 0 & 0 & 0 & 1 \end{array}\right)

因此,从基 p0,p1,p2,p3,p4p_0, p_1, p_2, p_3, p_4 到基 q0,q1,q2,q3,q4q_0, q_1, q_2, q_3, q_4 的过渡矩阵为

P=(1111101234001360001400001)P =\left(\begin{array}{lllll} 1 & 1 & 1 & 1 & 1 \\ 0 & 1 & 2 & 3 & 4 \\ 0 & 0 & 1 & 3 & 6 \\ 0 & 0 & 0 & 1 & 4 \\ 0 & 0 & 0 & 0 & 1 \end{array}\right)

设任一不超过 4 次的多项式 p=a0+a1x+a2x2+a3x3+a4x4p=a_0+a_1 x+a_2 x^2+a_3 x^3+a_4 x^4 在基 q0,q1,q2,q3,q4q_0, q_1, q_2, q_3, q_4 下的坐标为

(y1,y2,y3,y4,y5)T\left(y_1, y_2, y_3, y_4, y_5\right)^{\mathrm{T}} \text {, }

由上面知,这个多项式在基 p0,p1,p2,p3,p4p_0, p_1, p_2, p_3, p_4 下的坐标是 (y1,y2,y3,y4,y5)T\left(y_1, y_2, y_3, y_4, y_5\right)^{\mathrm{T}} , 从而有坐标变换公式

(a0a1a2a3a4)=P(y1y2y3y4y5) 或 (y1y2y3y4y5)=P1(a0a1a2a3a4)\left(\begin{array}{l} a_0 \\ a_1 \\ a_2 \\ a_3 \\ a_4 \end{array}\right)=\boldsymbol{P}\left(\begin{array}{l} y_1 \\ y_2 \\ y_3 \\ y_4 \\ y_5 \end{array}\right) \text { 或 }\left(\begin{array}{l} y_1 \\ y_2 \\ y_3 \\ y_4 \\ y_5 \end{array}\right)=\boldsymbol{P}^{-1}\left(\begin{array}{l} a_0 \\ a_1 \\ a_2 \\ a_3 \\ a_4 \end{array}\right) \text {. }
 用矩阵的初等行变换求 P1 ,把矩阵 (P,E) 中的 P 变成 E ,则 E 即变成 P1. 计算如下 \text { 用矩阵的初等行变换求 } P^{-1} \text { ,把矩阵 }(P, E) \text { 中的 } P \text { 变成 } E \text { ,则 } E \text { 即变成 } P^{-1} \text {. 计算如下 }

图片

17._基变换与坐标变换_过渡矩阵 - 线性代数 | OpenTech