1.0_导引

1.0 导引

在本章以及后面各章中,先引入该章要讨论的主要问题,并用例子说明它们是如何从理论上或应用中产生的。

1.0.1 基变换和相似性 每个可逆矩阵是基变换矩阵,而每个基变换矩阵是可逆矩阵[见(0.10)节]。因此,如果 B\mathcal{B} 是向量空间 VV 的一个给定的基, TTVV 的一个给定的线性变换,且 A=[T]A = _{\bullet}[T]_{\bullet}TTB\mathcal{B} 基表示,那么, TT 的所有可能基表示的集合是

{x1[I]x2[T]x3[I]x4:B1V的 基}={S1AS:SMn(F)是 可 逆 矩 阵}.\begin{array}{l} \{x _ {1} [ I ] x _ {2} [ T ] x _ {3} [ I ] x _ {4}: \mathcal {B} _ {1} \text {是} V \text {的 基} \} \\ = \{S ^ {- 1} A S: S \in M _ {n} (\mathbf {F}) \text {是 可 逆 矩 阵} \}. \\ \end{array}

这正是与给定的矩阵 AA 相似的所有矩阵的集合。因此,相似的,而不是恒等的诸矩阵正好是同一个线性变换的不同的基表示。

人们自然希望相似的矩阵会有许多共同的性质——至少是基于线性变换的那些固有性质——这是线性代数的重要论题。一个矩阵只是某个线性变换的所有可能表示中的一个,从关于一个矩阵的问题去探讨关于该线性变换某些固有性质的问题,这样处理问题往往很见效。

相似概念是本章的主要概念.

1.0.2 约束极值和特征值 本章第二个主要概念是特征向量和特征值的概念。我们将看到,使 AxAxxx 的一个倍数的非零向量 xx 在研究一般矩阵或线性变换的结构中起着重要的作用,而这样的向量出现在求具有一个几何约束条件的实对称二次型的极大值(或极小值)的基本问题中,即:

假定 xRn,xTx=1x \in \mathbf{R}^n, x^T x = 1 ,求 xTΛxx^T \Lambda x 的极大值,

其中 AT=AMn(R)A^T = A \in M_n(\mathbf{R}) 是给定的。这样一个约束最优问题的传统研究引出了 Lagrange 函数 L=xTΛxλxTxL = x^T \Lambda x - \lambda x^T x 。于是,它有一个极值的必要条件是

0=L=2(Axλx)=0.0 = \nabla L = 2 (A x - \lambda x) = 0.

因此,如果满足 xtx=1x^t x = 1 的向量 xRnx \in \mathbb{R}^n (因而 x0x \neq 0 )是 xtAxx^t A x 的一个极值点,它必定满足方程 Ax=λxA x = \lambda x ,因而 AxA xrr 的倍数。这一对 λ,r\lambda, r 称为一个特征值、特征向量偶。

习题

  1. 解释(1.0.2)中的约束极值问题为什么一定有一个解,并证明每个实对称矩阵至少有一个实特征值。提示:应用Weierstrass定理(附录E)于连续函数 f(x)=x3Axf(x) = x^{3}Ax

  2. AMn(R)A \in M_{n}(\mathbf{R}) 是实对称矩阵 (AT=A)(A^{T} = A) 。证明,在 xTx=1x^{T}x = 1 的条件下, xTAxx^{T}Ax 的极大值问题的解是 AA 的最大特征值。