4.0 导引
4.0.1 例 如果 f:D→R 是某个域 D⊂Rn 上的二次连续可微函数,实矩阵
H(r)=[hij(x)]=[∂x1∂2f(x)∂xj∂xj]∈Mn 称为 f 的Hessian矩阵.它是 x 的函数,因为可以用它来确定一个临界点是否为相对极大值点或极小值点,所以它在最优化理论中起着重要的作用[(见7.0)]
目前,使我们特别感兴趣的 H=H(x) 性质来源于混合偏导数相等的重要事实;这就是对所有 ι,j=1,2,…,n 有
∂xi∂xj∂2f=∂xj∂xi∂2f. 用Hessian矩阵 H=[hij] 来表示,这意味着,对所有 i,j=1,2,…,n ,有 hij=hji ;即 H=HT 。设矩阵 A∈Mn ,如果有 A=AT ,就称它是对称矩阵。因此,一个二次连续可微的实值函数的Hessian矩阵总是实对称矩阵。
4.0.2 例 作为第二个例子,设 A=[aij]∈Mn 是某个具有实或复元素的矩阵,考虑由 A 产生的 Rn 或 Cn 上的二次型:
Q(x)=x1Ax=∑r,j=1naijxixj=∑r,j=1n21(ar+aj)x,x,=x1[21(A+Ar)]x. 于是, A 和 21(A+A⊺) 引出同一个二次型,且后一个矩阵是对称的.因此,为了研究实的或复的二次型,只要研究由对称矩阵产生的那些二次型就可以了.例如,在物理中,作为物体的惯性表达式,自然会遇到实二次型.
4.0.3 例 作为第三个例子,考虑用
Lf(x)≡i,j=1∑naij(x)∂xi∂xj∂2f(x)(4.0.4) 定义的二阶线性偏微分算子 L 。假定系数 aij(x) 和函数 f(x) 都是定义在同一个区域 D⊂Rn 上的,且 f 在 D 上应当是二次可微的。可以用一种自然的方式把算子 L 与一个矩阵联系起来,矩阵 A=[aij(x)] 不一定是对称的,但是,因为 f 的混合偏导数相等,因而有
Lf=i,j=1∑naij(x)∂xi∂xj∂2f=i,j=1∑n21[aij(x)∂xi∂xj∂2f+aij(x)∂xi∂xj∂2f] =i,j=1∑n21[aij(x)+aμ(x)]∂xi∂xj∂2f. 因此,对称矩阵 21(A+A†) 与矩阵 Λ 产生同一个算子 L ,并且为了研究形如(4.0.4)的实的或复的线性偏微分算子,只要考虑对称系数矩阵就够了。
4.0.5 例 考虑无向图 Γ ;即 Γ 由集合 N 和集合 E 组成,其中 N 是“结点”的集合 {P1,P2,…,Pn} , E 是无序结点偶(称为“边”)的集合 E={{Pi1,Pi1},{Pi2,Pi2},…} 。图 Γ 可以简洁地用它的所谓邻接矩阵 A=[aij] 来描述,这里
aij={1,0,如 果{Pi,Pj}∈E,否 则. 因为 Γ 是无向图,所以 A 是实对称矩阵:即 AT=A
4.0.6 例 设 A=[an]∈Mn 是实矩阵,考虑实双线性型
Q(x,y)=yTAx=i,j=1∑naijyixj,x,y∈Rn,(4.0.7) 当 A=I 时,它简化为普通内积。如果希望对所有 x,y ,有 Q(x,y)−Q(y,x) ,那么它必需而且只需对所有 i,j=1,⋯,n ,有 aij=aji 。为了证明这一点,只需注意到,如果 x=ej 和 y=ei ,那么 Q(ej,ei)=aij 且 Q(ei,ej)=aji 。因此,实对称双线性型自然与实对称矩阵相对应。
现在设 A=[an]∈Mn 是实的或复的矩阵,考虑复形式
H(x,y)=y′Λx=i,j=1∑naijyˉixj,x,y∈Cn,(4.0.8) 同(4.0.7)一样,当 A=1 时,它简化为普遍内积。这种形式不再是双线性的,但是它对第一变元是线性的,而对第二变元是“共轭线性”的 (H(ax,by)=abˉH(x,y)) ,这正好与复Euclid内积相同。有人称这种形式为半双线性的。如果希望像内积一样有 H(x,y)=H(y,x) ,那么,与前述情形相同的论证说明,它必需而且只需有 aij=aˉji ;即 A=AT≡A∗ 。要注意的是,如果 A 是实矩阵,那么 A∗=AT 。
使 A=A∗ 的 A∈Mn 的矩阵类在许多方面是实对称矩阵类到 Mn(C) 的自然推广。这样的矩阵称为Hermite矩阵;要注意的是,实Hermite矩阵就是实对称矩阵。非实的复对称矩阵类没有实对称矩阵类那么多重要性质。在本章,我们将研究复Hermite矩阵和复对称矩阵,并且要特别指出在实对称情形成立的那些性质。