5.0_导引

5.0 导引

考虑 Cn\mathbf{C}^n 中的若干个向量或者 MnM_{n} 中的若干个矩阵,说有些向量或矩阵“小”,而说另一些向量或矩阵“大”,这是什么意思?在什么情况下可以说两个向量“很接近”或者“离得很远”?

在二维及三维实向量空间中,“大小”问题与“接近”问题通常涉及到Euclid距离。向量 zRnz \in \mathbb{R}^n 的Euclid长度是 (zTz)1/2(zIz)1/2(z^{\mathrm{T}}z)^{1/2} - (z^{\mathrm{I}}z)^{1/2} ,按该度量标准如果这个非负实数较小,就说 zz 是“小向量”。此外,说向量 xxyy 离得“很近”,是指差 z=xyz = x - y 的Euclid长度是一个很小的非负实数。

矩阵可以看成高维空间中的向量,那么矩阵的“大小”指的是什么?关于无限维空间中的向量的“大小”指的是什么?关于复向量呢?除了用Euclid长度以外,还有没有度量实向量“大小”的其他有效方法?

要回答这些问题,一个办法是研究矩阵与向量的范数或大小的度量。范数可以看作Euclid长度的推广。当然,研究范数并不仅仅是为了作一下数学推广而已。为了恰当地表达象矩阵幂级数这样一些概念,范数是必不可少的,并且在分析和评价关于数值计算的各种算法中,它也是必需的。此外,已被采用的各种不同的范数大体上可适用于各种场合,所以,研究所有范数所共有的一些性质,而不是把注意力集中到任何个别的范数上,这样做是可取的。

下述各例从几个方面说明引进范数的必要性.

5.0.1 例(收敛性)如果 xx 是复数,且 x<1|x| < 1 ,我们知道,

(1x)11+x+x2x3+.(1 - x) ^ {1} - 1 + x + x ^ {2} \mid x ^ {3} + \dots .

它给出计算方阵 IAI - A 的逆的公式

(IA)1=IAA+A3+,(I - A) ^ {1} = I \cdot | A | A ^ {\prime} + A ^ {3} + \dots ,

然而,什么时候这个公式才能成立呢?可以证明,这只要矩阵 AA 的范数小于1就行了,并且这对于任何范数也是如此!同样,利用范数可以证明,许多其他可以用来定义一个矩阵的矩阵值函数的幂级数是收敛的,因而其定义是有意义的,例如,

eAk=01k!Ake ^ {A} \equiv \sum_ {k = 0} ^ {\infty} \frac {1}{k !} A ^ {k}

就是这样,为了按所要求的精确度计算一个特殊的函数值,范数也可以用来确定幂级数中所需要的项数,关于分析解方程组的迭代法的收敛性问题,也可以作类似的论述。

5.0.2 例(精确性)设 ff 是一个实变量的实值可微函数,我们知道,如果已知 f(x)f(x)x=x0x = x_0 的值,则 ff 在其附近 x=x0+hx = x_0 + h 的值可以用一阶导数

f(x0+h)f(x0)h=ΔfΔxf(x0)\frac {f \left(x _ {0} + h\right) - f \left(x _ {0}\right)}{h} = \frac {\Delta f}{\Delta x} \sim f ^ {\prime} \left(x _ {0}\right)

来估计。因此,在计算 ffx0x_0 的值时,如果实际上算出 ff 在附近 x=x0+hx = x_0 + h 的值,那么,就有

一种估计相对误差的方法.

关于矩阵计算也会出现同样的问题。假定想计算 A1A^{-1} (或 AA 的其他函数),但是 AA 的各元是通过实验、通过其他数据的分析、或者是从先验的计算得来的,并且不确切地知道这些数。这时可以把 AA 看成一个“真”的 A0A_{0} 再加上一个误差 EE ,并且在计算 A1=(A1+E)1A^{-1} = (A_{1} + E)^{-1} 而不是计算 A01A_{0}^{-1} 时,我们想(用 EE 的“大小”)估计可能的“相对误差”,知道 A1A^{-1}A01A_{0}^{-1} 之间的相差程度与知道 A1A^{-1} 的精确值可能是同样重要的,而范数为处理这类问题提供了一个系统的方法。

5.0.3 例(界)对于与矩阵相关联的一些重要的量(例如特征值)的界常常要涉及范数,当矩阵产生扰动时,这些量的可能变化范围也要涉及范数。