5.1 向量范数和内积的定义性质
我们先考虑向量空间上的范数。由于 Mn 是向量空间,要做的一切也将适用于矩阵范数。
一个函数如果是范数,它需要具备哪些性质。为了说明这个问题,对熟知的(实或复)纯量的绝对值概念进行抽象。当然,一个值得注意的差别是,绝对值函数是实变量或复变量的实值函数,而我们要求范数是描述一个向量的多元实值函数。 Cn 上的这样一个函数是Euclid长度 (z∗z)1/2 ,但是还有另一些函数也具有Euclid长度的某些基本性质,并且在某些场合可能是更为合适的度量,它们可能提供另外的信息,或者在某些内容中使用起来可能更为方便。
在整个这一章中,只考虑实或复向量空间.所有的主要结果对这两个域都成立,不过在每一个结果中,它必须与所采用的那个域相一致.我们常用域 F (一开始就视 F=R 或 C )叙述各个结果,之后,在余下的论述中涉及的是同一个域 F
5.1.1 定义 设 V 是域 F(R 或 C) 上的向量空间。函数 ∥⋅∥:V→R 称为向量范数,是指对所有 x,y∈V 有以下性质:
(1) ∥x∥⩾0 , 非负性;
(1a) ∥x∥=0 当且仅当 x=0 , 正定性;
(2) ∥cx∥=∣c∣∥x∥ 对所有纯量 c∈F 成立,齐次性;
(3) ∥x+y∥⩽∥x∥+∥y∥ , 三角不等式.
这四条公理是大家所熟悉的平面上的Euclid长度的几个性质.Euclid长度还具有另外一些性质,这些性质与这四条公理是独立无关的[例如,平行四边形恒等式(5.1.8)],因为它们对于一般的理论并不是必不可少的,所以没有把它作为公理.
一个函数如果满足公理(1),(2),(3)但不一定满足(1a),就称之为向量半范数。半范数在允许某些非零向量有零长度方面推广了范数概念。
5.1.2 引理 如果 ∥⋅∥ 是 V 上的向量半范数,则
∣∣x∣∣−∣y∣∣⩽∣x−y∣ 对所有 x,y∈V 成立.
证明:因为 y=x+(y−x) ,由三角不等式和齐次性公理(2),有
∥y∥⩽∥x∥+∥y−x∥=∥x∥+∥x−y∥. 由此可知
∥y∥−∥x∥⩽∥x−y∥. 又因为 x=y+(x−y) ,所以再由三角不等式有
∥x∥⩽∥y∥+∥x−y∥, 因而
∥x∥−∥y∥⩽∥x−y∥. 因此我们证明了 ±(∥x∥−∥y∥)⩽∥x−y∥ ,它等价于引理的论断。
与 Cn 上Euclid长度相关的概念是通常的Euclid内积 y∗x (有时叫做“点积”),它有一些性质与两个向量间的“夹角”有关:如果 y∗x=0 ,那么 x 与 y 正交.正象对向量范数所做的那样,可以抽象出Euclid内积的几个本质特征,并且用它们作为一般内积理论的公理.
5.1.3 定义 设 V 是域 F(R 或 C) 上的向量空间,函数 ⟨⋅,⋅⟩:V×V→F 是一个内积,是指对所有 x,y,z∈V ,有
(1) ⟨x,x⟩⩾0 非负性;
(1a) ⟨x,x⟩=0 当且仅当 x=0 , 正定性;
(2) ⟨x+y,z⟩=⟨x,z⟩+⟨y,z⟩, 可加性;
(3) ⟨cx,y⟩=c⟨x,y⟩ 对所有纯量 c∈F 成立,齐次性;
(4) ⟨x,y⟩=⟨y⋅x⟩ , Hermite 性.
练习 证明 Euclid 内积 ⟨x,y⟩=y∗x ;满足关于内积的所有上述四个公理。
练习 设 D=diag(d1,d2,…,dn) ,考虑函数 (x,y)≡y⋆Dx , ⟨⋅,⋅⟩ 满足关于内积的哪几条公理? D 在什么条件下 ⟨⋅,⋅⟩ 才是内积?
练习 由定义(5.1.3)的四条公理推导内积的下述性质:
(a) ⟨x,cy⟩=cˉ⟨x,y⟩ ;
(b) ⟨x,y+z⟩=⟨x,y⟩+⟨x,z⟩ ;
(c) ⟨ax+by,cw+dz⟩=acˉ⟨x,w⟩+bcˉ⟨y,w⟩+daˉd⟨x,z⟩+bd⟨y,z⟩
(d) ⟨x,y⟩=0 对所有 y∈V 成立,当且仅当 x=0
(e) ⟨x,⟨x,y⟩y⟩=∣⟨x,y⟩∣2 .
所有内积都共有的重要性质是Cauchy-Schwarz不等式.
5.1.4 定理 (Cauchy-Schwarz 不等式) 如果 ⟨⋅,⋅⟩ 是域 F(R 或 C ) 上的向量空间 V 上的内积, 则
∣⟨x,y⟩∣2⩽⟨x,x⟩⟨y,y⟩ 对所有 x,y∈F 成立。等式成立当且仅当 x 与 y 线性相关,即对某个 a∈F 有 x=ay 或 y=ax .
证明:设 x,y∈V 是给定的。如果 y=0 ,则结论显然成立,所以可以假定 y=0 。设 t∈R ,考虑 p(t)≡⟨x+ty,x+ty⟩=⟨x,x⟩+t⟨y,x⟩+t⟨x,y⟩+t2⟨y,y⟩=⟨x,x⟩+2tRe⟨x,y⟩+t2⟨y,y⟩ ,它是实系数二次多项式。由公理(5.1.3(1))得知,对所有实数 t , p(t)≥0 ,因而 p(t) 不能有实的单根。因此, p(t) 的判别式一定是非正的,即
(2Re⟨x,y⟩)2−4⟨y,y⟩⟨x,x⟩⩽0, 因而
(Re⟨x,y⟩)2⩽⟨x,x⟩⟨y,y⟩.(5.1.5) 因为这个不等式对任一对向量都成立,所以当用 ⟨x,y⟩y 代替 y 时它也一定成立。于是还有不等式
(Re⟨x,⟨x,y⟩y⟩)2⩽⟨x,x⟩⟨y,y⟩∣⟨x,y⟩∣2. 但是, Re⟨x,⟨x,y⟩y⟩=Re⟨x,y⟩⟨x,y⟩=Re∣⟨x,y⟩∣2=∣⟨x,y⟩∣2 ,因此
∣⟨x,y⟩∣2⩽⟨x,x⟩⟨y,y⟩⋅⟨x,y⟩∣2.(5.1.6) 如果 (x,y)=0 ,则定理的结论是显然的;否则可以用数 ∣x,y∣2 除(5.1.6)两边得到所要证的不等式。因为公理(1a),所以仅当 x+ty=0 对某个 t 成立时 p(t) 才有一个实(二重)根。因此,在判别条件(5.1.5)中等式能够成立,当且仅当 x 和 y 线性相关。
5.1.7 推论 如果 ⟨⋅,⋅⟩ 是 V 上的向量内积,则 ∥x∥≡(⟨x,x⟩)1/2 是 V 上的向量范数。
练习 证明(5.1.7). 提示: 只有一角不等式的验证不明显. 计算 ∥x+y∥2 , 然后利用 Cauchy-Schwarz 不等式.
如果 ∥⋅∥ 是适合 ∥x∥=⟨x,x⟩1/2 的向量范数,其中 ⟨⋅,⋅⟩ 为某个内积,就称该向量范数可由内积(即 ⟨⋅,⋅⟩ )诱导。
习题
设 ϵi 表示 Cn 中的第 i 个单位坐标向量且假定 ∥⋅∥ 是 Cn 上的一个向量半范数,证明
∥x∥⩽i=1∑n∣xi∣∥ei∣. 如果 ∥⋅∥ 是 V 上的一个向量半范数,证明 Vn={v∈V:∥v∥=0} 是 V 的一个子空间(称为关于 ∥⋅∥ 的零空间).(a) 如果 V1 是 V 的适合 Vn∩V1={0} 的任一子空间,证明 ∥⋅∥ 是 V1 的一个向量范数.(b) 考虑用
x∼y当 且 仅 当∥x−y∥=0 定义的关系 x∼y 。证明, ∼ 是 V 上的一个等价关系,而这个等价关系的诸陪集具有形式 x^={x+y∈V:y∈V0} ,并且这些陪集的集合以一种自然的方式构成一个向量空间。证明,函数 ∥x^∥={∥x∥:x∈x^} 是有意义的,并且是诸陪集组成的向量空间上的一个向量范数。(c)说明与每个向量半范数有关的自然范数为什么存在。(d) ∥x∥=0 是半范数吗?(e)给出一个不是范数的非平凡半范数的例子。
证明,如果定义两个非零向量间的夹角是介于0与 π/2 之间的值
cos−1((⟨x,r⟩⟨y,y⟩)1/2∣⟨x,y⟩∣), 则这个夹角概念对任何内积都是有意义的.
证明,如(5.1.7)中由内积诱导的向量范数一定满足平行四边形恒等式
21(∥x+y∥2+∥x−y∥2)=∥x∥2+∥y∥2.(5.1.8) 为什么这个恒等式得此名称?事实上,等式(5.1.8)是一个给定的范数可由内积诱导的必要充分条件。见习题10。
考虑定义在 Cn 上的函数 ∥x∥∞=max1≤i,j≤n∣xi∣ 。证明 ∥⋅∥∞ 是不能由任何内积导出的向量范数。
如果 ∥⋅∥ 是由内积 (⋅,⋅) 诱导的向量范数,证明
Re⟨x,y⟩=41(∥x+y∥2−∥x−y∥2).(5.1.9) 称这个等式为极化恒等式,同时证明
Re⟨x,y⟩=21(∥x+y∥2∥x∥2∥y∥2). 证明, Cn 上的 l1 范数 ∥x∥≡∣x1∣+⋯+∣xn∣ 适合公理(5.1.1),但不适合极化等恒式(5.1.9). 因此,它不是由任何内积导出的.
如果 ∥⋅∥ 是由一个内积诱导的 V 上的向量范数,则
∣x+y∣∥x−y∥⩽∣x∣2+∣y∣2 对所有 x,y∈V 成立. 什么时候等式成立? 这个不等式对所有向量范数都成立吗? 给出这个不等式的几何解释.
设 x 和 y 是 V 中给定的向量, V 有一个由内积 ⟨⋅,⋅⟩ 诱导的范数 ∥⋅∥ ,并且假定 y 是非零的。证明,使 ∥x−αy∥ 的值达到极小的纯量 α0 是 α0=⟨x,y⟩/∥y∥2 ,并且 x−α0y 与 y 正交。
不难证明(但也有一些技巧),平行四边形恒等式(5.1.8)是一个给定的范数可由内积诱导的充分条件。首先考虑 R 上的一个向量空间。设 ∥⋅∥ 是 V 上一个给定的范数。(a)定义
⟨x,y⟩=2∥x+y∥2∥x∥2−∥y∥2.(5.1.10) 证明,用这种方法定义的 ⟨⋅,⋅⟩ 满足(5.1.3)中的公理(1),(1a)和(4),且 ⟨x,x⟩=∥x∥2 。(b)利用(5.1.8)证明
4⟨x,y⟩+4⟨z,y⟩=2∥x+y∥2+2∥z⋅y∥22∥x∥2−2∥z∥2−4∥y∥2=∥x+2y+z∥2−∥x+z∥2−4∥y∥2=4⟨x+z,y⟩, 由此得出,它也满足(5.1.3)中的可加性公理(2). (c)利用可加性公理证明, ⟨nx,y⟩=n⟨x,y⟩ 且 m⟨m−1nx,y⟩=⟨nx,y⟩=n⟨x,y⟩ ,其中 m 和 n 是非负整数.利用(5.1.8)以及(5.1.10)证明 ⟨−x,y⟩=−⟨x,y⟩ ,由此得出 ⟨at,y⟩=a⟨x,y⟩ ,其中 a∈R 是有理数.(d)设 p(t)=t2∥x∥2+2t⟨x,y⟩+∥y∥2 , t∈R ,然后证明,若 t 为有理数,则 p(t)=∥tx+y∥2 ,由 p(t) 的连续性推出,对所有 t∈R , p(t)⩾0 。根据 p(t) 的判别式一定是非正的事实推出 Cauchy-Schwarz 不等式 ∣⟨x,y⟩∣2⩽∥x∥2∥y∥2 。(e)现在设 a∈R 是给定的,证明
∣⟨ax,y⟩−a⟨x,y⟩∣−∣⟨(a−b)x,y⟩+(b−a)⟨x,y⟩∣⩽∣⟨(a−b)x,y⟩∣+∣(b−a)⟨x,y⟩∣⩽2∣a−b∣∥x∥∥y∥ 对任何有理数 b 成立,并且可以使上界任意地小。由此得出(5.1.10)满足(5.1.3)中的齐次性公理(3)。这就证明了 ⟨⋅,⋅⟩ 是 V 上的一个内积。
细心的读者会注意到,在上述论证中关于范数 ∥⋅∥ 的三角不等式[(5.1.1)中的公理(3)]没有用到。因此,(5.1.1)中的公理(1),(1a)和(2)连同(5.1.8)蕴涵以下事实:函数 ∥⋅∥ 是由内
积诱导的,因而它是-个范数,并且一定满足三角不等式.(f)若 V 是一个复向量空间,定义
⟨x,y⟩=2∥x+y∥2−∥x∥2−∥y∥2+2i(∥x+iy∥2−∥x∥2−∥y∥2). ⟨x,y⟩ 的实部是 V 看作 R 上一个向量空间时的内积。利用这一事实和(5.1.8)证明 ⟨⋅,⋅⟩ 是 V 看作 C 上一个向量空间时的内积。
进一步阅读 平行四边形恒等式是一个给定的范数可由内积诱导的必要充分条件,这个结果的最早证明似乎应该属于P. Jordan和J. Von Neumann,他们的文章是"On Inner Products in Linear Metric Spaces,"Ann. Math. 36(2)(1935),719-723.习题10中所给出的这个结果的证明参考了下述文章:D.Fearnley-Sander and J.S.V.Symons,“Apollonius and Inner Products,"Amer.Math.Monthly81(1974),990-993.