1.3 向量范数与矩阵范数
1.3.1 向量范数
定义1.13 (向量范数) 若函数 f:Rn→R (或 f:Cn→R ) 满足
(1) f(x)≥0,∀x∈Rn (或 Cn ), 等号当且仅当 x=0 时成立;
(2) f(αx)=∣α∣⋅f(x),∀x∈Rn (或 Cn ), α∈R (或 C );
(3) f(x+y)≤f(x)+f(y),∀x,y∈Rn (或 Cn
则称 f(x) 为 Rn (或 Cn ) 上的范数 (norm), 通常记作 ∥x∥ .
如果 f 只满足 f(x)≥0 , 以及 (2) 和 (3), 则称为半范数 (seminorm).
例1.14 Rn 和 Cn 上常见的向量范数:
1-范数: ∥x∥1=∣x1∣+∣x2∣+⋯+∣xn∣
2-范数: ∥x∥2=∣x1∣2+∣x2∣2+⋯+∣xn∣2 ;
∞ -范数: ∥x∥∞=max1≤i≤n∣xi∣ ;
p -范数: ∥x∥p=(∑i=1n∣xi∣p)1/p , p≥1 .
容易验证, 1-范数、2-范数和 ∞ -范数就是 p -范数在 p=1,2,∞ 的特殊情形.
Δp -范数也称为Holder范数[150]或 ℓp 范数
定理1.32(范数的连续性)设 ∥⋅∥ 是 Rn (或 Cn )上的一个向量范数, 则 f(x)≜∥x∥ 是 Rn (或 Cn )上的连续函数. (留作课外自习,利用范数的三角不等式)
定义1.14 (范数的等价性) 设 ∥⋅∥α 与 ∥⋅∥β 是 Rn (或 Cn ) 上的两个向量范数, 若存在正常数 c1,c2 , 使得
c1∥x∥α≤∥x∥β≤c2∥x∥α 对任意 x∈Rn (或 Cn ) 都成立, 则称 ∥⋅∥α 与 ∥⋅∥β 是等价的.
定理1.33 Rn (或 Cn ) 上的所有向量范数都是等价的, 特别地, 有
∥x∥2≤∥x∥1≤n∥x∥2, ∥x∥∞≤∥x∥1≤n∥x∥∞, ∥x∥∞≤∥x∥2≤n∥x∥∞. (板书, 以 Rn 为例, 只证明等价性, 三个不等式留作练习)
证明. 只需证明任意向量范数 ∥⋅∥ 都与 ∥x∥∞ 等价即可, 即存在正常数 c1,c2 使得
c1∥x∥∞≤∥x∥≤c2∥x∥∞,∀x∈Rn. 考虑函数 f(x)≜∥x∥ ,则 f(x) 连续且非负.定义集合
S≜{x∈Rn:∥x∥∞=1}, 则 S 是 Rn 中的有界闭集, 所以 f(x) 在 S 上存在最小值和最大值, 分别记为 c1 和 c2 . 由于 f(x)=0 当且仅当 x=0 , 所以 c1 和 c2 都大于 0.
对任意非零向量 x∈Rn , 有 ∥x∥∞x∈S , 所以
c1≤f(∥x∥∞x)≤c2,即c1≤∥x∥∞∥x∥≤c2. 所以结论成立.

更一般地, 根据 Jensen 不等式 [73]:
(i=1∑nxip)1/p>(i=1∑nxiq)1/q,xi>0,0<p<q, 我们有
∥x∥p≥∥x∥q,∀1≤p≤q. Jensen不等式:
(i=1∑nxip)1/p>(i=1∑nxiq)1/q,xi>0,0<p<q. 证明. 直接计算可得
(∑i=1nxip)1/p(∑i=1nxiq)1/q=(∑i=1n(∑j=1nxjp)q/pxiq)1/q=(∑i=1n(∑j=1nxjpxip)q/p)1/q<(∑i=1n∑j=1nxjpxip)1/q=1. 
事实上, 有限维赋范线性空间上的所有范数都是等价的 [154].
定理 1.34 (Cauchy-Schwarz 不等式) 设 (⋅,⋅) 是 Rn (或 Cn ) 上的内积, 则对任意 x,y∈Cn (或 Rn ), 有
∣(x,y)∣2≤(x,x)⋅(y,y)或∣(x,y)∣≤∥x∥⋅∥y∥, 且等号成立的充要条件是 x 与 y 线性相关, 其中 ∥⋅∥ 为内积导出范数, 即 ∥x∥=(x,x)
(板书)
证明. 若 y=0 ,则结论显然成立
假设 y=0 ,则对任意 α∈C 有
0≤(x−αy,x−αy)=(x,x)−αˉ(x,y)−α((y,x)−αˉ(y,y)). 由于 y=0 , 所以 (y,y)>0 . 取 αˉ=(y,y)(y,x) , 代入上式可得
0≤(x,x)−(y,y)(y,x)(x,y). 由于 (y,x)=(x,y) ,所以上式即为
∣(x,y)∣2≤(x,x)⋅(y,y). 下面考虑等号成立的条件
充分性. 如果 x 与 y 线性相关, 则通过直接验证即可知等号成立.
必要性. 假设等号成立. 如果 y=0 , 则显然 x 与 y 线性相关. 现假定 y=0 . 取 α=(y,y)(x,y) , 则
(x−αy,x−αy)=(x,x)−(y,y)∣(x,y)∣2=0, 即 x−αy=0 所以 x 与 y 线性相关
注记:Cauchy-Schwarz 不等式在有的文献中也称为 Cauchy-Bunyakovski 不等式或 Cauchy-Schwarz-Bunyakovski 不等式 [105]. 中学数学中的 Cauchy 不等式
(a1b1+a2b2+⋯+anbn)2≤(a12+a22+⋯+an2)(b12+b22+⋯+bn2),(ai,bi∈R) 是 Cauchy-Schwarz 不等式的特例.
更一般地, 我们有下面的Holder不等式
定理1.35 (Holder不等式) 设 (⋅,⋅) 是 Rn (或 Cn ) 上的标准内积, 则对任意 x,y∈Cn (或 Rn ), 有
∣(x,y)∣≤∥x∥p⋅∥y∥q, 其中 p,q>0 ,且 p1+q1=1.
(留作课外自习)
内积导出范数
设 S 是内积空间, 对任意 x∈S , 定义
∥x∥≜(x,x)21,(1.6) 则可以验证, ∥x∥ 是 S 上的范数. 这就是由内积导出的范数
A 任意一个内积都可以导出一个相应的范数.
例1.15 Rn 上由标准内积导出的范数为
∥x∥=(x,x)21=(i=1∑nxi2)21. 这就是2-范数
例1.16 (极化恒等式) 设 ∥⋅∥ 是 Rn 上由内积 (⋅,⋅) 导出的范数, 则有
(x,y)=41(∥x+y∥2−∥x−y∥2). 证明. 由题意可知
∥x+y∥2=(x+y,x+y)=(x,x)+2(x,y)+(y,y), ∥x−y∥2=(x−y,x−y)=(x,x)−2(x,y)+(y,y). 两式相减即可得结论成立.

1.3.2 矩阵范数
定义1.15 (矩阵范数) 若函数 f:Rm×n→R (或 f:Cm×n→R ) 满足
(1) f(A)≥0,∀A∈Rm×n (或 Cm×n )且等号当且仅当 A=0 时成立;
(2) f(αA)=∣α∣f(A),∀A∈Rm×n (或 Cm×n) , α∈R (或 C ;
(3) f(A+B)≤f(A)+f(B),∀A,B∈Rm×n (或 Cm×n)
则称 f(X) 为 Rm×n (或 Cm×n ) 上的矩阵范数, 通常记作 ∥X∥ .
设 f 是 Rn×n (或 Cn×n ) 上的矩阵范数, 如果 f 还满足
(4) f(AB)≤f(A)f(B),∀A,B∈Rn×n (或 Cn×n 1
则称 f 是相容的矩阵范数
注记
在本讲义中, 如果不加特别指出, 所使用的矩阵范数都是指相容的矩阵范数.
设 ∥⋅∥ 是 Rm×n (或 Cm×n ) 上的矩阵范数, 若对任意 A∈Rm×n (或 Cm×n ) 和任意 x∈Rn (或 Cn ), 有
∥Ax∥α≤∥A∥∥x∥β, 则称矩阵范数 ∥⋅∥ 与向量范数 ∥⋅∥α 和 ∥⋅∥β 相容, 这里的 ∥⋅∥α 和 ∥⋅∥β 分别为 Rm 和 Rn (或 Cm 和 Cn ) 上的向量范数.
一类常用的矩阵范数是由向量范数导出的算子范数
引理1.36(算子范数)设 ∥⋅∥ 是 Rn (或 Cn )上的向量范数,则
∥A∥≜x∈Rn,x=0sup∥x∥∥Ax∥=∥x∥=1max∥Ax∥ 是 Rn×n (或 Cn×n ) 上的矩阵范数, 称为算子范数, 有时也称为诱导范数或导出范数. (板书)
相应地, 可以定义 Rm×n (或 Cm×n ) 上的算子范数, 此时涉及 Rm 和 Rn (或 Cm 和 Cn ) 上的向量范数.
例1.17 设 A∈Rn×n (或 Cn×n ), 常见的矩阵范数有:
∥A∥p=x=0sup∥x∥p∥Ax∥p,p≥1. ∥A∥F=i=1∑nj=1∑n∣aij∣2; (留作课外自习, 验证满足 4 条性质)
引理1.37 可以证明:
(1) 矩阵 1-范数 (列范数): ∥A∥1=max1≤j≤n(∑i=1n∣aij∣) ;
(2) 矩阵 ∞ -范数 (行范数): ∥A∥∞=max1≤i≤n(∑j=1n∣aij∣) ;
(3) 矩阵 2-范数: ∥A∥2=ρ(A∗A) ;
(4) 矩阵 F -范数: ∥A∥F=tr(A∗A)
(板书, 以 ∞ -范数和 2-范数为例, 其他留作练习)
计算2-范数时需要求谱半径,因此通常比计算1-范数和 ∞ -范数更困难.但在某些情况下可以用下面的范数等价性来估计一个矩阵的2-范数
定理1.38 (矩阵范数的等价性) Rn×n (或 Cn×n ) 上的所有范数都是等价的, 特别地, 有
n1∥A∥1≤∥A∥2≤n∥A∥1,n1∥A∥∞≤∥A∥2≤n∥A∥∞. (留作练习)
矩阵范数的更多性质
设 A∈Rn×n (或 Cn×n) , x∈Rn (或 Cn
(1) 对任意矩阵范数 ∥⋅∥ ,有 ∥Ak∥≤∥A∥k
(2) 对任意算子范数 ∥⋅∥ , 有 ∥Ax∥≤∥A∥⋅∥x∥,∥AB∥≤∥A∥⋅∥B∥ ;
(3) ∥Ax∥2≤∥A∥F⋅∥x∥2,∥AB∥F≤∥A∥F⋅∥B∥F;
(4) F -范数不是算子范数;
(5) ∥⋅∥2 和 ∥⋅∥F 是酉不变范数, 即对任意酉矩阵 (或正交矩阵) U,V , 有
∥UA∥2=∥AV∥2=∥UAV∥2=∥A∥2, ∥UA∥F=∥AV∥F=∥UAV∥F=∥A∥F (6) ∥A∗∥2=∥A∥2,∥A∗∥1=∥A∥∞
(7) 若 A 是正规矩阵, 则 ∥A∥2=ρ(A) .
(留作课外自习)
在数据处理和机器学习等学科中经常会用到下面的范数:
∥x∥0≜x中 非 零 元 素 的 个 数 ,x∈Rn(或Cn). 需要指出的是, 上式定义的 ℓ0 范数并不满足向量范数定义中的条件 (2). 该范数主要用于衡量向量的稀疏性, 是压缩感知和稀疏优化中的研究对象.
∥A∥∗≜∑σi,其 中σi为A的 所 有 奇 异 值,A∈Rm×n(或Cm×n). (关于矩阵奇异值的定义见3.12)根据奇异值的性质,核范数也可以定义为
∥A∥∗≜tr(ATA). 矩阵直和
设 Ai∈Rni×ni (或 Cni×ni , i=1,2,…,k ,定义直和
i=1⨁kAi=A1⊕A2⊕⋯⊕Ak≜A1A2⋱Ak, 即以 Ai 为对角块的块对角矩阵. 可以验证
i=1⨁kAip=1≤i≤kmax∥Ai∥p,p=1,2,∞.(1.7) 1.3.3 谱半径与范数
定理1.39(谱半径与范数的关系)设 A∈Rn×n (或 Cn×n ,则
(1) 对任意算子范数, 有 ρ(A)≤∥A∥ ;
(2) 反之, 对任意 ε>0 , 都存在一个算子范数 ∥⋅∥ε , 使得 ∥A∥ε≤ρ(A)+ε , 其中范数 ∥⋅∥ε 依赖于 A 和 ε . 所以, 若 ρ(A)<1 , 则存在算子范数 ∥⋅∥ε , 使得 ∥A∥ε<1 . (板书)
证明.(1)设 λ 是 A 的一个特征值,对应的特征向量为 x=0 ,则由 Ax=λx 可得
∣λ∣⋅∥x∥=∥λx∥=∥Ax∥≤∥A∥⋅∥x∥. 故 ∣λ∣≤∥A∥ .所以
ρ(A)=λ∈σ(A)max∣λ∣≤∥A∥. (2) 用构造法证明. 设 A 的 Jordan 标准型为 J , 即
S−1AS=J=i=1⨁pJi,其 中Ji=λi1⋱⋱⋱1λi. 令 D=diag(1,ε,ε2,…,εn−1) , 则
(SD)−1A(SD)=D−1JD=i=1⨁pJiε,其 中Jiε=λiε⋱⋱⋱ελi. 定义 ∥x∥ε≜∥(SD)−1x∥∞ 可以证明 ∥⋅∥ε 构成一个向量范数(见习题1.6).由此可构造算子范数
∥A∥ε≜supx=0∥x∥ε∥Ax∥ε=supx=0∥(SD)−1x∥∞∥(SD)−1Ax∥∞=supy=0∥y∥∞∥(SD)−1A(SD)y∥∞=⨁i=1kJiε∞=max1≤i≤p∥Jiε∥∞≤max1≤i≤p{∣λi∣}+ε=ρ(A)+ε. 
事实上, 定理 1.39 中的结论 (1) 对任意矩阵范数都成立, 见习题 1.10.
除此之外,我们还有下面的性质
推论1.40 设 A∈Rn×n (或 Cn×n ), 则 ∥A∥22≤∥A∥1∥A∥∞ , 且
1≤i,j≤nmax{∣aij∣}≤∥A∥2≤n1≤i,j≤nmax{∣aij∣}. (留作练习)
1.3.4 最佳逼近与正交投影
下面是关于正交投影变换的一个常用性质, 可以直接通过 2-范数的定义证明.
定理1.41 设 P∈Rn×n (或 Cn×n ) 是正交投影矩阵, 则 ∥P∥2=1 , 且对 ∀x∈Rn (或 Cn ), 有
∥x∥22=∥Px∥22+∥(I−P)x∥22. 正交投影可用于描述最佳逼近问题的解
定理1.42 设 S 是 Rn (或 Cn ) 的子空间, z∈Rn (或 Cn ) 是一个给定的向量, 则最佳逼近问题
x∈Smin∥x−z∥2 的唯一解为
x∗=PSz. 即 S 中距离 z 最近 (在2-范数意义下)的向量是 z 在 S 中的正交投影. (留作练习)
上述定理中的2-范数可以推广到一般的能量范数
推论1.43设 A∈Rn×n (或 Cn×n )对称正定(或Hermite正定), S 是 Rn (或 Cn )的子空间,给定 z∈Rn (或 Cn ),则 x∗ 是最佳逼近问题
x∈Smin∥x−z∥A 的解的充要条件是
x∗∈S且A(x∗−z)⊥S. 此处能量范数 ∥⋅∥A 的定义为: ∥x−z∥A≜(x−z)∗A(x−z). (留作练习)