附录B 凸集和凸函数
设 V 是含有实数的一个域上的向量空间. V 的一组选定的元素 v1,…,vk∈V 的一个凸组合是其系数非负且和为1的线性组合:
α1v1+⋯+αkvk;α1,…,αk⩾0,i=1∑kαi−1. V 的子集 K 称为凸集,是指从 K 中任意选定一组元素所作成的任一凸组合仍在 K 中。等价地, K 是凸集,是指 K 中各个点偶的所有凸组合仍在 K 中。几何上,这可以解释为连结 K 的任意两点的线段必定在 K 中;即 K 没有“凹”或“洞”。一个凸集 K 称为凸锥,是指每当 α>0 和 x∈K ,就有 αx∈K (等价地, K 中元素的正线性组合仍在 K 中)。直接验证可知,两个凸集(相应地,凸锥)的集和及交仍为一个凸集(相应地,凸锥)。
一个闭凸集 K 的一个端点是这样一个点 z∈K ,它只能用一种平凡的方式写成 K 中点的一个凸组合,也就是说, z=αx+(1−α)y , 0<α<1 , x,y∈K ,蕴涵 x=y=z 。一个闭凸集可能有有限个端点(例如,一个多面体),也可能有无限多个端点(例如,一个闭圆盘),还可能无端点(例如, R2 中的闭上半平面)。然面,一个紧凸集总有端点。 V 中点的一个集合 S 的凸包,记作 Co(S) ,就是选择 S 的所有点组作成的所有凸组合的集合。或等价地,它是包含 S 的(所有凸集的交)最小凸集。Krein-Milman 定理是说,一个紧凸集是它的端点的凸包,我们说一个紧凸集是有限生成的,是指它有有限多个端点,这些端点称为该凸集的生成元。
现在假定 V 是具有一个给定范数的实或复向量空间,分离超平面定理是说,对于两个不相交的凸集 K1⊆V 和 K2⊆V ,存在 V 中的一个超平面 H ,使得 K1 位于由 H 确定的两个闭半空间中的一个内,而 K2 位于另一个内;即 H 分离 K1 和 K2 . V 中的一个超平面 H 正好是 V 的一个一维子空间的正交补的一个平移: H={x∈V:⟨x−p,q⟩=0} ,其中, q∈V 是给定的向量, q=0 . 超平面 H 确定两个开半空间: H′={x∈V:⟨x−p,q⟩>0} , H′={x∈V:⟨x−p,q⟩<0} . 集合 H0+=H+∪H 和 H0−=H∪H 是由 H 所确定的两个闭半空间.因此,分离意味着对某两个向量 p,q 有 K1⊆H0+ 和 K2⊆H0 . 对两个凸集附加某些条件就会有各种强化的分离结论.例如,如果 K1 和 K2 的闭包不相交,那么分离可以取得更为精确;即 K1⊆H+ , K2⊆H .任一有界集 S⊂V 的凸包的闭包可以通过取包含 S 的所有闭半空间的交面得到.
在 V 是具有复内积 ⟨⋅,⋅⟩ 的向量空间 Cn 的情形,也可以类似地定义超平面和半空间,只是必须把 Cn 和 R2n 等同起来,且必须用下述实内积 Re⟨⋅,⋅⟩ 代替 ⟨⋅,⋅⟩ 。将 x+iy∈Cn 等同于 [xy]∈R2n ,还应注意到,根据复内积的共轭线性性质, Re⟨x1+iy1,x2+iy2⟩=⟨x1,x2⟩+⟨y1,y2⟩ 。于是 ⟨x1,x2⟩+⟨y1,y2⟩ 是 [x1y1] 和 [x2y2] 的(实)内积,而且 R2n 中定义的超平面和半空间在 Cn 中有相应的几何解释。
我们说定义在一个凸集 K⊆V 上的实值函数 f 是凸函数,指的是对所有 0<α<1 和所有 x,y∈K,y=x ,有
f(αx+(1−α)y)⩽αf(x)+(1−α)f(y).(*) 如果上述不等式总是严格的,那么 f 称为严格凸函数。如果对所有 0<α<1 和所有 x,y∈K , y=x ,上述不等式是反向的,那么 f 称为凹函数(或严格凹函数,如果反问不等式总是严格的)。等价地,一个凹函数(相应地,严格凹函数)正是一个凸函数(相应地,严格凸函数)的负值。几何上,连结任意两个函数值的弦位于一个凸函数(相应地,凹函数)的图象的上方(相应地,下方)。一个线性函数既是凸的,也是凹的。在 V=Rn 和 K 是开集的情形,Hessian 矩阵为
H(x)≡[∂xi∂xj∂2f(x)], 它是 Mn(R) 中的对称矩阵,对于一个凸函数 f , H(x) 在 κ 中几乎处处存在,并且在使 H(x) 存在的 κ 中的各个点,它一定是半正定的.在严格凸的情形,它是正定的.反过来,一个函数,如果它的Hessian矩阵在整个凸集上是半正定(相应地,正定)的,那么该函数是凸(相应地,严格凸)的.类似地,负定性对应凹性.
凸函数和凹函数的最优化有一些好的性质。在紧凸集上,凸函数(相应地,凹函数)的极大值(相应地,极小值)在一个端点达到。另一方面,在一个凸集上,由那些达到一个凸函数(相应地,凹函数)的极小值(相应地,极大值)的点组成的集合是凸的,并且任一局部极小值(相应地,极大值)是全局极小值(相应地,极大值)。例如,一个严格凸函数至多在凸集的一个点达到极小值。且一个临界点一定是极小值点。
实数的凸组合满足某些简单而又常用的不等式.如果 x1,…,xk 是给定的实数,那么
1⩽i,kminxi⩽i=1∑kaixi⩽1⩽i,kmaxxi 对任意凸组合 α1,α2,…,αk⩾0 和 α1+⋯+αk−1 成立.
研究定义在一个区间上的某些简单的单变量凸函数 f(⋅) 可诱导出各种各样的经典不等式. 我们可以用归纳法证明, 定义在区间上的关于两个点的不等式 (⋆) 可以推出关于 n 个点的不等式
f(i=1∑naixi)⩽i=1∑naif(xi),n=2,3,…,∗(*) 只要 α1⩾0,α1+⋯+αn=1 ,且所有 xi 都在区间内.
应用 (∗∗) 于区间 (0,∞) 上的严格凸函数 f(x)=−logx ,便导出加权算术—几何平均值不等式
i=1∑nαixi⩾i=1∏nxiσi,xi⩾0, 当所有 αi=1/n 时,它就是算术一几何平均值不等式
n1i=1∑nxi⩾(i=1∏nxi)1n,xi⩾0, 等式成立,当且仅当所有 xi 都相等.
把 (∗∗) 应用于定义在区间 (0,∞) 上的 f(x)=xp , p>1 ,便导出 Hölder 不等式
i=1∑nxiyi⩽(i=1∑nxip)1,p(i=1∑nyiq)1,q, 其中 xi,yi>0,p>1 ,且 1/p+1/q=1 。等式成立,当且仅当向量 [xip] 和 [yiq] 相关。如果取 p=q=2 ,我们便得到 Cauchy-Schwarz 不等式的另一种形式
i=1∑nxiyi⩽(i=1∑nxi2)1/2(i=1∑nyi2)1/2. 等式成立,当且仅当向量 [xi] 和 [yi] 是相关的。我们可以从Holder不等式推出Minkowski不等式
[i=1∑n(xi+yi)p]1/p⩽(i=1∑nxip)1/p+(i−1∑nyip)1/p, 其中 xi,yi>0 且 p⩾1 。等式成立,当且仅当向量 [xi] 和 [yi] 是相关的。
进一步阅读 关于凸集与几何的其他资料可参看[Val]. 关于凸函数与不等式的其他资料可参看[Boa]和[BB].
535