22._线性变换的矩阵表示式_相似矩阵

线性变换的矩阵表示式

线性变换是一个很抽象的概念,如何将它具体化呢? 我们发现,如果给定线性空间 VnV_n 的 一个基 α1,α2,,αn\alpha_1, \alpha_2, \cdots, \alpha_n 则对 VnV_n 中任意向量 α1\boldsymbol{\alpha}_1

α=k1α1+k2α2++knαn,\alpha=k_1 \alpha_1+k_2 \alpha_2+\cdots+k_n \alpha_n,

由线性变换的性质得:

T(α)=k1T(α1)+k2T(α2)++knT(αn).T(\boldsymbol{\alpha})=k_1 T\left(\boldsymbol{\alpha}_1\right)+k_2 T\left(\boldsymbol{\alpha}_2\right)+\cdots+k_n T\left(\boldsymbol{\alpha}_n\right) .

于是 α\boldsymbol{\alpha}TT 下的像就由基的像 T(α1),T(α2),,T(αn)T\left(\boldsymbol{\alpha}_1\right), T\left(\boldsymbol{\alpha}_2\right), \cdots, T\left(\boldsymbol{\alpha}_n\right) 所唯一确定. 而 T(α)V(i=1,2,,n)T(\boldsymbol{\alpha}) \in V(i=1,2, \cdots, n), 所以 T(αi)V(i=1,2,,n)T\left(\boldsymbol{\alpha}_i\right) \in V(i=1,2, \cdots, n) 也可由基 α1,α2,,αn\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n 来线性表示,即有

{T(α1)=a11α1+a21α2++an1αn,T(α2)=a12α1+a22α2++an2αn,T(αn)=a1nα1+a2nα2++annαn.\left\{\begin{array}{l} T\left(\boldsymbol{\alpha}_1\right)=a_{11} \boldsymbol{\alpha}_1+a_{21} \boldsymbol{\alpha}_2+\cdots+a_{n 1} \boldsymbol{\alpha}_n, \\ T\left(\boldsymbol{\alpha}_2\right)=a_{12} \boldsymbol{\alpha}_1+a_{22} \boldsymbol{\alpha}_2+\cdots+a_{n 2} \boldsymbol{\alpha}_n, \\ \cdots \quad \cdots \quad \cdots \quad \cdots \\ T\left(\boldsymbol{\alpha}_n\right)=a_{1 n} \boldsymbol{\alpha}_1+a_{2 n} \boldsymbol{\alpha}_2+\cdots+a_{n n} \boldsymbol{\alpha}_n . \end{array}\right.

由上式得: T(α1,α2,,αn)=(T(α1),T(α2),,T(αn))=(α1,α2,,αn)AT\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n\right)=\left(T\left(\boldsymbol{\alpha}_1\right), T\left(\boldsymbol{\alpha}_2\right), \cdots, T\left(\boldsymbol{\alpha}_n\right)\right)=\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n\right) \boldsymbol{A} 其中

A=(a11a12a1na21a22a2nan1an2ann)\boldsymbol{A}=\left(\begin{array}{cccc} a_{11} & a_{12} & \cdots & a_{1 n} \\ a_{21} & a_{22} & \cdots & a_{2 n} \\ \vdots & \vdots & & \vdots \\ a_{n 1} & a_{n 2} & \cdots & a_{n n} \end{array}\right)

矩阵 AA 称为线性变换 TT 在基 α1,α2,,αn\alpha_1, \alpha_2, \cdots, \alpha_n 下的矩阵. 显然,矩阵 A\boldsymbol{A} 由基的像 T(α1),T(α2),,T(αn)T\left(\boldsymbol{\alpha}_1\right), T\left(\boldsymbol{\alpha}_2\right), \cdots, T\left(\boldsymbol{\alpha}_n\right) 唯一确定. 反之,如果给定一个矩阵 A\boldsymbol{A} 作为某个线性变换 TT 在基 α1,α2,,αn\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n 下的矩阵,也就是给出了 这个基在变换下的像,根据变换 TT 保持线性关系的特性, 我们来推导变换 TT 必须满足的关系式. VnV_n 中的任意向量记为 α=i=1nxiαl\alpha=\sum_{i=1}^n x_i \alpha_l

Tα=T(i=1nxiαi)=i=1nxiT(αi)=(T(α1),T(α2),,T(αn))(x1x2xn)=(α1,α2,,αn)A(x1x2xn)T \boldsymbol{\alpha}=T\left(\sum_{i=1}^n x_i \boldsymbol{\alpha}_i\right)=\sum_{i=1}^n x_i T\left(\boldsymbol{\alpha}_i\right)=\left(T\left(\boldsymbol{\alpha}_1\right), T\left(\boldsymbol{\alpha}_2\right), \cdots, T\left(\boldsymbol{\alpha}_n\right)\right)\left(\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right)=\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n\right) \boldsymbol{A}\left(\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right) \text {, }

T((α1,α2,,αn)(x1x2xn))=(α1,α2,,αn)A(x1x2xn)T\left(\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n\right)\left(\begin{array}{c}x_1 \\ x_2 \\ \vdots \\ x_n\end{array}\right)\right)=\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n\right) \boldsymbol{A}\left(\begin{array}{c}x_1 \\ x_2 \\ \vdots \\ x_n\end{array}\right).

定理1

定理 1 设线性变换 TT 在基 α1,α2,,αn\alpha _1, \alpha _2, \cdots, \alpha _n 下的矩阵是 AA ,向量 α\alphaT(α)T( \alpha ) 在基 α1,α2,,αn\alpha _1, \alpha _2, \cdots, \alpha _n 下的坐标分别为 (x1x2xn)\left(\begin{array}{c}x_1 \\ x_2 \\ \vdots \\ x_n\end{array}\right)(y1y2yn)\left(\begin{array}{c}y_1 \\ y_2 \\ \vdots \\ y_n\end{array}\right)

则有

(y1y2yn)=A(x1x2xn).\left(\begin{array}{c} y_1 \\ y_2 \\ \vdots \\ y_n \end{array}\right)= A \left(\begin{array}{c} x_1 \\ x_2 \\ \vdots \\ x_n \end{array}\right) .

按坐标表示,有

T(α)=Aα.T( \alpha )= A \alpha .

P[x]3P[x]_3 中取基 p1=1,p2=x,p3=x2,p4=x3p_1=1, p_2=x, p_3=x^2, p_4=x^3 求微分运算 DD 的矩阵.

{Dp1=0=0p1+0p2+0p3+0p4Dp2=1=1p1+0p2+0p3+0p4Dp3=2x=0p1+2p2+0p3+0p4Dp4=3x2=0p1+0p2+3p3+0p4\left\{\begin{array}{l} D p_1=0=0 p_1+0 p_2+0 p_3+0 p_4 \\ D p_2=1=1 p_1+0 p_2+0 p_3+0 p_4 \\ D p_3=2 x=0 p_1+2 p_2+0 p_3+0 p_4 \\ D p_4=3 x^2=0 p_1+0 p_2+3 p_3+0 p_4 \end{array}\right.

所以 DD 在这组基下的矩阵为

A=(0100002000030000)A =\left(\begin{array}{llll} 0 & 1 & 0 & 0 \\ 0 & 0 & 2 & 0 \\ 0 & 0 & 0 & 3 \\ 0 & 0 & 0 & 0 \end{array}\right)

R3R^3 上线性变换 TT 定义为 T(x1x2x3)=(2x1x2x2+x32x1)T\left(\begin{array}{l}x_1 \\ x_2 \\ x_3\end{array}\right)=\left(\begin{array}{c}2 x_1-x_2 \\ x_2+x_3 \\ 2 x_1\end{array}\right), 分别求 TT 在基

e1=(100),e2=(010),e3=(001) 与基 α1=(100),α2=(110),α3=(111) 下的矩阵. \boldsymbol{e}_1=\left(\begin{array}{l} 1 \\ 0 \\ 0 \end{array}\right), \boldsymbol{e}_2=\left(\begin{array}{l} 0 \\ 1 \\ 0 \end{array}\right), \boldsymbol{e}_3=\left(\begin{array}{l} 0 \\ 0 \\ 1 \end{array}\right) \text { 与基 } \boldsymbol{\alpha}_1=\left(\begin{array}{l} 1 \\ 0 \\ 0 \end{array}\right), \boldsymbol{\alpha}_2=\left(\begin{array}{l} 1 \\ 1 \\ 0 \end{array}\right), \boldsymbol{\alpha}_3=\left(\begin{array}{l} 1 \\ 1 \\ 1 \end{array}\right) \text { 下的矩阵. }
T(100)=(202)=2α12α2+2α3=(α1,α2,α3)(222),T(110)=(112)=0α1α2+2α3=(α1,α2,α3)(012),T(111)=(122)=α1+0α2+2α3=(α1,α2,α3)(102),\begin{aligned} & T\left(\begin{array}{l} 1 \\ 0 \\ 0 \end{array}\right)=\left(\begin{array}{l} 2 \\ 0 \\ 2 \end{array}\right)=2 \boldsymbol{\alpha}_1-2 \boldsymbol{\alpha}_2+2 \boldsymbol{\alpha}_3=\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \boldsymbol{\alpha}_3\right)\left(\begin{array}{c} 2 \\ -2 \\ 2 \end{array}\right), \\ & T\left(\begin{array}{l} 1 \\ 1 \\ 0 \end{array}\right)=\left(\begin{array}{l} 1 \\ 1 \\ 2 \end{array}\right)=0 \boldsymbol{\alpha}_1-\boldsymbol{\alpha}_2+2 \boldsymbol{\alpha}_3=\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \boldsymbol{\alpha}_3\right)\left(\begin{array}{c} 0 \\ -1 \\ 2 \end{array}\right), \\ & T\left(\begin{array}{l} 1 \\ 1 \\ 1 \end{array}\right)=\left(\begin{array}{l} 1 \\ 2 \\ 2 \end{array}\right)=-\boldsymbol{\alpha}_1+0 \boldsymbol{\alpha}_2+2 \boldsymbol{\alpha}_3=\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \boldsymbol{\alpha}_3\right)\left(\begin{array}{c} -1 \\ 0 \\ 2 \end{array}\right), \end{aligned}
 可得 T(α1,α2,α3)=(α1,α2,α3)(201210222)\text { 可得 } T\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \boldsymbol{\alpha}_3\right)=\left(\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \boldsymbol{\alpha}_3\right)\left(\begin{array}{ccc} 2 & 0 & -1 \\ -2 & -1 & 0 \\ 2 & 2 & 2 \end{array}\right) \text {, }

TT 在基 α1,α2,α3\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \boldsymbol{\alpha}_3 下的矩阵为

B=(201210222).\boldsymbol{B}=\left(\begin{array}{ccc} 2 & 0 & -1 \\ -2 & -1 & 0 \\ 2 & 2 & 2 \end{array}\right) .

可见,同一个线性变换在不同的基下有不同的矩阵.

已知线性空间 R3\mathbb{R}^3 的线性变换 σ\sigma 把基

ε1=(1,0,1)T,ε2=(0,1,0)T,ε3=(0,0,1)T\boldsymbol{\varepsilon}_1=(1,0,1)^{\mathrm{T}}, \boldsymbol{\varepsilon}_2=(0,1,0)^{\mathrm{T}}, \boldsymbol{\varepsilon}_3=(0,0,1)^{\mathrm{T}}

变为

η1=(1,0,2)T,η2=(1,2,1)T,η3=(1,0,0)T\boldsymbol{\eta}_1=(1,0,2)^{\mathrm{T}}, \boldsymbol{\eta}_2=(-1,2,-1)^{\mathrm{T}}, \boldsymbol{\eta}_3=(1,0,0)^{\mathrm{T}} \text {, }

试求 σ\sigma 在基 ε1,ε2,ε3\varepsilon_1, \varepsilon_2, \varepsilon_3 下的矩阵。 解法一:可用观察法将基的像分别表示为基的线性组合。由于 R3\mathbb{R}^3 中基 ε1,ε2,ε3\boldsymbol{\varepsilon}_1, \boldsymbol{\varepsilon}_2, \boldsymbol{\varepsilon}_3 在线性变换 σ\sigma 下的像分别为

σ(ε1)=(1,0,2)T=ε1+ε3,σ(ε2)=(1,2,1)T=ε1+2ε2,σ(ε3)=(1,0,0)T=ε1ε3,\begin{aligned} & \sigma\left(\varepsilon_1\right)=(1,0,2)^{\mathrm{T}}=\varepsilon_1+\varepsilon_3, \\ & \sigma\left(\varepsilon_2\right)=(-1,2,-1)^{\mathrm{T}}=-\varepsilon_1+2 \varepsilon_2, \\ & \sigma\left(\varepsilon_3\right)=(1,0,0)^{\mathrm{T}}=\varepsilon_1-\varepsilon_3, \end{aligned}

σ(ε1,ε2,ε3)=(ε1,ε2,ε3)(111020101)\sigma\left(\varepsilon_1, \varepsilon_2, \varepsilon_3\right)=\left(\varepsilon_1, \varepsilon_2, \varepsilon_3\right)\left(\begin{array}{rrr} 1 & -1 & 1 \\ 0 & 2 & 0 \\ 1 & 0 & -1 \end{array}\right)

σ\sigma 在基 ε1,ε2,ε3\varepsilon_1, \varepsilon_2, \varepsilon_3 下的矩阵为

A=(111020101)A=\left(\begin{array}{rrr} 1 & -1 & 1 \\ 0 & 2 & 0 \\ 1 & 0 & -1 \end{array}\right)

解法二:若不易看出基的像表示为基的线性组合的系数时,常常用解方程组的方法求出。为此设基 ε1,ε2,ε3\varepsilon_1, \varepsilon_2, \varepsilon_3 在线性变换 σ\sigma 下的像分别为

σ(ε1)=x11ε1+x21ε2+x31ε3,σ(ε2)=x12ε1+x22ε2+x32ε3,σ(ε3)=x13ε1+x23ε2+x33ε3,\begin{aligned} & \sigma\left(\boldsymbol{\varepsilon}_1\right)=x_{11} \boldsymbol{\varepsilon}_1+x_{21} \boldsymbol{\varepsilon}_2+x_{31} \boldsymbol{\varepsilon}_3, \\ & \sigma\left(\boldsymbol{\varepsilon}_2\right)=x_{12} \boldsymbol{\varepsilon}_1+x_{22} \boldsymbol{\varepsilon}_2+x_{32} \boldsymbol{\varepsilon}_3, \\ & \sigma\left(\boldsymbol{\varepsilon}_3\right)=x_{13} \boldsymbol{\varepsilon}_1+x_{23} \boldsymbol{\varepsilon}_2+x_{33} \boldsymbol{\varepsilon}_3, \end{aligned}

εi,ηj\boldsymbol{\varepsilon}_i, \boldsymbol{\eta}_j 的分量代人上式,解之得

x11=x13=x31=1,x12=x33=1,x21=x23=x32=0,x22=2.x_{11}=x_{13}=x_{31}=1, x_{12}=x_{33}=-1, x_{21}=x_{23}=x_{32}=0, x_{22}=2 .

σ(ε1)=(1,0,2)T=ε1+ε3,σ(ε2)=(1,2,1)T=ε1+2ε2,σ(ε3)=(1,0,0)T=ε1ε3,\begin{aligned} & \sigma\left(\varepsilon_1\right)=(1,0,2)^{\mathrm{T}}=\varepsilon_1+\varepsilon_3, \\ & \sigma\left(\varepsilon_2\right)=(-1,2,-1)^{\mathrm{T}}=-\varepsilon_1+2 \varepsilon_2, \\ & \sigma\left(\varepsilon_3\right)=(1,0,0)^{\mathrm{T}}=\varepsilon_1-\varepsilon_3, \end{aligned}

从而

(σ(ε1),σ(ε2),σ(ε3))=(ε1,ε2,ε3)(111020101),\left(\sigma\left(\varepsilon_1\right), \sigma\left(\varepsilon_2\right), \sigma\left(\varepsilon_3\right)\right)=\left(\varepsilon_1, \varepsilon_2, \varepsilon_3\right)\left(\begin{array}{rrr} 1 & -1 & 1 \\ 0 & 2 & 0 \\ 1 & 0 & -1 \end{array}\right),

σ\sigma 在基 ε1,ε2,ε3\varepsilon_1, \varepsilon_2, \varepsilon_3 下的矩阵为

A=(111020101)A=\left(\begin{array}{rrr} 1 & -1 & 1 \\ 0 & 2 & 0 \\ 1 & 0 & -1 \end{array}\right)

(ε1,ε2)\left(\varepsilon_1, \varepsilon_2\right) 为平面上的一直角坐标系,线性变换 σ\sigma 是平面上的向量对第一和第三象限分角线的垂直投影,求线性变换 σ\sigma 在基 ε1,ε2\varepsilon_1, \varepsilon_2 下的矩阵。

解:由线性变换 σ\sigma 的定义可知

σ(ε1)=σ(ε2)=12ε1+12ε2,\sigma\left(\varepsilon_1\right)=\sigma\left(\varepsilon_2\right)=\frac{1}{2} \varepsilon_1+\frac{1}{2} \varepsilon_2,

故线性变换 σ\sigma 在基 ε1,ε2\varepsilon_1, \varepsilon_2 下的矩阵为

A=(12121212)A=\left(\begin{array}{ll} \frac{1}{2} & \frac{1}{2} \\ \frac{1}{2} & \frac{1}{2} \end{array}\right)

线性变换在不同基下矩阵间的关系

设线性空间 VnV_n 中取定两个基 α1,α2,,αn\alpha _1, \alpha _2, \cdots, \alpha _nβ1,β2,,βn\beta _1, \beta _2, \cdots, \beta _n ,由基 α1,α2,,αn\alpha _1, \alpha _2, \cdots, \alpha _n 到基 β1,β2,,βn\beta _1, \beta _2, \cdots, \beta _n 的过渡矩阵为 P, VnP , ~ V_n 中的线性变换 TT 在这两个基下的矩阵依次为 AABB ,那么 B=P1APB = P ^{-1} A P

证明 按定理的假设,有

(β1,β2,,βn)=(α1,α2,,αn)P,\left( \beta _1, \beta _2, \cdots, \beta _n\right)=\left( \alpha _1, \alpha _2, \cdots, \alpha _n\right) P ,

PP 可逆,及

T(α1,α2,,αn)=(α1,α2,,αn)A,T(β1,β2,,βn)=(β1,β2,,βn)B,T\left( \alpha _1, \alpha _2, \cdots, \alpha _n\right)=\left( \alpha _1, \alpha _2, \cdots, \alpha _n\right) A , T\left( \beta _1, \beta _2, \cdots, \beta _n\right)=\left( \beta _1, \beta _2, \cdots, \beta _n\right) B ,

于是

(β1,β2,,βn)B=T(β1,β2,,βn)=T[(α1,α2,,αn)P]=[T(α1,α2,,αn)]P=(α1,α2,,αn)AP=(β1,β2,,βn)P1AP\left( \beta _1, \beta _2, \cdots, \beta _n\right) B =T\left( \beta _1, \beta _2, \cdots, \beta _n\right)=T\left[\left( \alpha _1, \alpha _2, \cdots, \alpha _n\right) P \right]=\left[T\left( \alpha _1, \alpha _2, \cdots, \alpha _n\right)\right] P =\left( \alpha _1, \alpha _2, \cdots, \alpha _n\right) A P =\left( \beta _1, \beta _2, \cdots, \beta _n\right) P ^{-1} A P

因为 β1,β2,,βn\beta _1, \beta _2, \cdots, \beta _n 线性无关,所以 B=P1APB = P ^{-1} A P

这定理表明 BBAA 相似,且两个基之间的过渡矩阵 PP 就是相似变换矩阵

R3R^3 上线性变换 TT 在基 e1=(100),e2=(010),e3=(001)e_1=\left(\begin{array}{l}1 \\ 0 \\ 0\end{array}\right), e_2=\left(\begin{array}{l}0 \\ 1 \\ 0\end{array}\right), e_3=\left(\begin{array}{l}0 \\ 0 \\ 1\end{array}\right) 下的矩阵为 A=(122212221)A=\left(\begin{array}{lll}1 & 2 & 2 \\ 2 & 1 & 2 \\ 2 & 2 & 1\end{array}\right) ,求 TT 在基 α1=(110),α2=(011),α3=(102)\alpha _1=\left(\begin{array}{l}1 \\ 1 \\ 0\end{array}\right), \alpha _2=\left(\begin{array}{l}0 \\ 1 \\ 1\end{array}\right), \alpha _3=\left(\begin{array}{c}1 \\ 0 \\ -2\end{array}\right) 下的矩阵.

解: 为了求出 TT 在基 α1,α2,α3\alpha_1, \alpha_2, \alpha_3 下的矩阵,必须先求出从基 e1,e2,e3e_1, e_2, e_3 到基 α1,α2,α3\alpha_1, \alpha_2, \alpha_3 的过渡矩阵 PP

(α1,α2,α3)=(e1,e2,e3)P\left( \alpha _1, \alpha _2, \alpha _3\right)=\left( e _1, e _2, e _3\right) P 易知 P=(101110012),P1=(211221111)\quad P =\left(\begin{array}{ccc}1 & 0 & 1 \\ 1 & 1 & 0 \\ 0 & 1 & -2\end{array}\right), \quad P ^{-1}=\left(\begin{array}{ccc}2 & -1 & 1 \\ -2 & 2 & -1 \\ -1 & 1 & -1\end{array}\right)TT 在基 α1,α2,α3\alpha _1, \alpha _2, \alpha _3 下的矩阵为 B=P1AP=(211221111)(122212221)(101110012)=(784452441)\quad B = P ^{-1} A P =\left(\begin{array}{ccc}2 & -1 & 1 \\ -2 & 2 & -1 \\ -1 & 1 & -1\end{array}\right)\left(\begin{array}{ccc}1 & 2 & 2 \\ 2 & 1 & 2 \\ 2 & 2 & 1\end{array}\right)\left(\begin{array}{ccc}1 & 0 & 1 \\ 1 & 1 & 0 \\ 0 & 1 & -2\end{array}\right)=\left(\begin{array}{ccc}7 & 8 & -4 \\ -4 & -5 & 2 \\ -4 & -4 & 1\end{array}\right)

定义

线性变换的像空间 T(Vn)T\left(V_n\right) 的维数,称为线性变换 TT 的秩. 显然,若 A\boldsymbol{A}TT 的矩阵,则 TT 的秩就是 R(A)R(\boldsymbol{A}). 若 TT 的秩为 rr ,则 TT 的核 STS_T 的维 数为 nrn-r.