4.0_导引

4.0 导引

4.0.1 例 如果 f:DRf: D \to \mathbf{R} 是某个域 DRnD \subset \mathbb{R}^n 上的二次连续可微函数,实矩阵

H(r)=[hij(x)]=[2f(x)x1xjxj]MnH (r) = \left[ h _ {i j} (x) \right] = \left[ \frac {\partial^ {2} f (x)}{\partial x _ {1}} \frac {\partial x _ {j}}{\partial x _ {j}} \right] \in M _ {n}

称为 ff 的Hessian矩阵.它是 x\pmb{x} 的函数,因为可以用它来确定一个临界点是否为相对极大值点或极小值点,所以它在最优化理论中起着重要的作用[(见7.0)]

目前,使我们特别感兴趣的 H=H(x)H = H(x) 性质来源于混合偏导数相等的重要事实;这就是对所有 ι,j=1,2,,n\iota, j = 1, 2, \dots, n

2fxixj=2fxjxi.\frac {\partial^ {2} f}{\partial x _ {i} \partial x _ {j}} = \frac {\partial^ {2} f}{\partial x _ {j} \partial x _ {i}}.

用Hessian矩阵 H=[hij]H = \left[h_{ij}\right] 来表示,这意味着,对所有 i,j=1,2,,ni, j = 1, 2, \dots, n ,有 hij=hjih_{ij} = h_{ji} ;即 H=HTH = H^T 。设矩阵 AMnA \in M_n ,如果有 A=ATA = A^T ,就称它是对称矩阵。因此,一个二次连续可微的实值函数的Hessian矩阵总是实对称矩阵。

4.0.2 例 作为第二个例子,设 A=[aij]MnA = [a_{ij}] \in M_n 是某个具有实或复元素的矩阵,考虑由 AA 产生的 Rn\mathbf{R}^nCn\mathbf{C}^n 上的二次型:

Q(x)=x1Ax=r,j=1naijxixj=r,j=1n12(ar+aj)x,x,=x1[12(A+Ar)]x.\begin{array}{l} Q (x) = x ^ {1} A x = \sum_ {r, j = 1} ^ {n} a _ {i j} x _ {i} x _ {j} \\ = \sum_ {r, j = 1} ^ {n} \frac {1}{2} \left(a _ {r} + a _ {j}\right) x, x, \\ = x ^ {1} \left[ \frac {1}{2} (A + A ^ {r}) \right] x. \\ \end{array}

于是, AA12(A+A)\frac{1}{2} (A + A^{\intercal}) 引出同一个二次型,且后一个矩阵是对称的.因此,为了研究实的或复的二次型,只要研究由对称矩阵产生的那些二次型就可以了.例如,在物理中,作为物体的惯性表达式,自然会遇到实二次型.

4.0.3 例 作为第三个例子,考虑用

Lf(x)i,j=1naij(x)2f(x)xixj(4.0.4)L f (x) \equiv \sum_ {i, j = 1} ^ {n} a _ {i j} (x) \frac {\partial^ {2} f (x)}{\partial x _ {i} \partial x _ {j}} \tag {4.0.4}

定义的二阶线性偏微分算子 LL 。假定系数 aij(x)a_{ij}(x) 和函数 f(x)f(x) 都是定义在同一个区域 DRnD \subset \mathbb{R}^n 上的,且 ffDD 上应当是二次可微的。可以用一种自然的方式把算子 LL 与一个矩阵联系起来,矩阵 A=[aij(x)]A = [a_{ij}(x)] 不一定是对称的,但是,因为 ff 的混合偏导数相等,因而有

Lf=i,j=1naij(x)2fxixj=i,j=1n12[aij(x)2fxixj+aij(x)2fxixj]L f = \sum_ {i, j = 1} ^ {n} a _ {i j} (x) \frac {\partial^ {2} f}{\partial x _ {i} \partial x _ {j}} = \sum_ {i, j = 1} ^ {n} \frac {1}{2} \left[ a _ {i j} (x) \frac {\partial^ {2} f}{\partial x _ {i} \partial x _ {j}} + a _ {i j} (x) \frac {\partial^ {2} f}{\partial x _ {i} \partial x _ {j}} \right]
=i,j=1n12[aij(x)+aμ(x)]2fxixj.= \sum_ {i, j = 1} ^ {n} \frac {1}{2} \left[ a _ {i j} (x) + a _ {\mu} (x) \right] \frac {\partial^ {2} f}{\partial x _ {i} \partial x _ {j}}.

因此,对称矩阵 12(A+A)\frac{1}{2} (A + A^{\dagger}) 与矩阵 Λ\Lambda 产生同一个算子 LL ,并且为了研究形如(4.0.4)的实的或复的线性偏微分算子,只要考虑对称系数矩阵就够了。

4.0.5 例 考虑无向图 Γ\Gamma ;即 Γ\Gamma 由集合 NN 和集合 EE 组成,其中 NN 是“结点”的集合 {P1,P2,,Pn}\{P_{1}, P_{2}, \dots, P_{n}\}EE 是无序结点偶(称为“边”)的集合 E={{Pi1,Pi1},{Pi2,Pi2},}E = \{\{P_{i_{1}}, P_{i_{1}}\}, \{P_{i_{2}}, P_{i_{2}}\}, \dots\} 。图 Γ\Gamma 可以简洁地用它的所谓邻接矩阵 A=[aij]A = [a_{ij}] 来描述,这里

aij={1,如 果{Pi,Pj}E,0,否 则.a _ {i j} = \left\{ \begin{array}{l l} 1, & \text {如 果} \{P _ {i}, P _ {j} \} \in E, \\ 0, & \text {否 则}. \end{array} \right.

因为 Γ\pmb{\Gamma} 是无向图,所以 AA 是实对称矩阵:即 AT=AA^T = A

4.0.6 例 设 A=[an]MnA = [a_{n}] \in M_{n} 是实矩阵,考虑实双线性型

Q(x,y)=yTAx=i,j=1naijyixj,x,yRn,(4.0.7)Q (x, y) = y ^ {T} A x = \sum_ {i, j = 1} ^ {n} a _ {i j} y _ {i} x _ {j}, \quad x, y \in \mathbf {R} ^ {n}, \tag {4.0.7}

A=IA = I 时,它简化为普通内积。如果希望对所有 x,yx, y ,有 Q(x,y)Q(y,x)Q(x, y) - Q(y, x) ,那么它必需而且只需对所有 i,j=1,,ni, j = 1, \cdots, n ,有 aij=ajia_{ij} = a_{ji} 。为了证明这一点,只需注意到,如果 x=ejx = e_jy=eiy = e_i ,那么 Q(ej,ei)=aijQ(e_j, e_i) = a_{ij}Q(ei,ej)=ajiQ(e_i, e_j) = a_{ji} 。因此,实对称双线性型自然与实对称矩阵相对应。

现在设 A=[an]MnA = [a_{n}]\in M_{n} 是实的或复的矩阵,考虑复形式

H(x,y)=yΛx=i,j=1naijyˉixj,x,yCn,(4.0.8)H (x, y) = y ^ {\prime} \Lambda x = \sum_ {i, j = 1} ^ {n} a _ {i j} \bar {y} _ {i} x _ {j}, \quad x, y \in \mathbf {C} ^ {n}, \tag {4.0.8}

同(4.0.7)一样,当 A=1A = 1 时,它简化为普遍内积。这种形式不再是双线性的,但是它对第一变元是线性的,而对第二变元是“共轭线性”的 (H(ax,by)=abˉH(x,y))(H(ax, by) = a\bar{b} H(x, y)) ,这正好与复Euclid内积相同。有人称这种形式为半双线性的。如果希望像内积一样有 H(x,y)=H(y,x)H(x, y) = \overline{H(y, x)} ,那么,与前述情形相同的论证说明,它必需而且只需有 aij=aˉjia_{ij} = \bar{a}_{ji} ;即 A=ATAA = \overline{A}^T \equiv A^* 。要注意的是,如果 AA 是实矩阵,那么 A=ATA^* = A^T

使 A=AA = A^{*}AMnA \in M_{n} 的矩阵类在许多方面是实对称矩阵类到 Mn(C)M_{n}(\mathbf{C}) 的自然推广。这样的矩阵称为Hermite矩阵;要注意的是,实Hermite矩阵就是实对称矩阵。非实的复对称矩阵类没有实对称矩阵类那么多重要性质。在本章,我们将研究复Hermite矩阵和复对称矩阵,并且要特别指出在实对称情形成立的那些性质。

4.0_导引 - 矩阵分析 | OpenTech