7.5 Schur 乘积定理 一个特别简单(又形式自然)的矩阵“乘法”是按对应分量相乘,
7.5.1 定义 如果 A = [ a i j ] ∈ M m , n A = [a_{ij}] \in M_{m,n} A = [ a ij ] ∈ M m , n 和 B − ∣ b i j ∣ ∈ M m , n B - |b_{ij}| \in M_{m,n} B − ∣ b ij ∣ ∈ M m , n 是给定的矩阵,则 A A A 和 B B B 的 Hadamard 乘积是矩阵 A ∘ B = [ a i j b i j ] ∈ M m , n A \circ B = [a_{ij}b_{ij}] \in M_{m,n} A ∘ B = [ a ij b ij ] ∈ M m , n .
常常称Hadamard乘积为Schur乘积.像矩阵加法一样,Hadamard乘法是可交换的,因而它比普通矩阵乘法要简单得多.
Hadamard乘积自然可以从几种不同的观点产生出来。例如, f ( θ ) f(\theta) f ( θ ) 和 g ( θ ) g(\theta) g ( θ ) 是周期为 2 π 2\pi 2 π 的连续周期函数,又如果
u k = ∫ 0 2 π e i k θ f ( θ ) d θ 和 b k − ∫ 11 2 π e i k θ g ( θ ) d θ , u _ {k} = \int_ {0} ^ {2 \pi} e ^ {i k \theta} f (\theta) \mathrm {d} \theta \quad \text {和} \quad b _ {k} - \int_ {1 1} ^ {2 \pi} e ^ {i k \theta} g (\theta) \mathrm {d} \theta , u k = ∫ 0 2 π e ik θ f ( θ ) d θ 和 b k − ∫ 11 2 π e ik θ g ( θ ) d θ , k − 0 k - 0 k − 0 , ± 1 \pm 1 ± 1 , + 2 +2 + 2 ,…,则卷积
h ( θ ) = ∫ 0 2 π f ( θ − t ) g ( t ) d t h (\theta) = \int_ {0} ^ {2 \pi} f (\theta - t) g (t) d t h ( θ ) = ∫ 0 2 π f ( θ − t ) g ( t ) d t 有三角矩
c k = ∫ 0 π e i k θ h ( θ ) d θ , c _ {k} = \int_ {0} ^ {\pi} e ^ {i k \theta} h (\theta) d \theta , c k = ∫ 0 π e ik θ h ( θ ) d θ , 它适合恒等式 c k = a k b k c_{k} = a_{k}b_{k} c k = a k b k , k = 0 k = 0 k = 0 , ± 1 \pm 1 ± 1 , ± 2 \pm 2 ± 2 ,…。于是, h ( θ ) h(\theta) h ( θ ) 的三角矩的 Toeplitz 矩阵是 f ( θ ) f(\theta) f ( θ ) 和 g ( θ ) g(\theta) g ( θ ) 的三角矩的 Toeplitz 矩阵的 Hadamard 乘积:
[ a 1 , ] = [ a 1 , ] ∘ [ b 1 , ] . \left[ \begin{array}{l l} a _ {1}, \end{array} \right] = \left[ \begin{array}{l l} a _ {1}, \end{array} \right] \circ \left[ \begin{array}{l l} b _ {1}, \end{array} \right]. [ a 1 , ] = [ a 1 , ] ∘ [ b 1 , ] . 如果 f ( θ ) f(\theta) f ( θ ) 和 g ( θ ) g(\theta) g ( θ ) 都是非负实值函数,则卷积 h ( θ ) h(\theta) h ( θ ) 也是非负实值函数。因此,如(7.0.5)中所证明的那样,矩阵 [ a 1 , j ] [a_{1}, j] [ a 1 , j ] , [ b 1 , j ] [b_{1}, j] [ b 1 , j ] 以及 [ c i , j ] [c_{i}, j] [ c i , j ] 都是半正定矩阵。这是Schur乘积定理的一个实例,该定理是说:两个半正定矩阵的Hadamard乘积是半正定矩阵。
又如,考虑积分算子
K ( f ) = ∫ a b K ( x , y ) f ( y ) d y , K (f) = \int_ {a} ^ {b} K (x, y) f (y) d y, K ( f ) = ∫ a b K ( x , y ) f ( y ) d y , 其中,核 K ( x , y ) K(x, y) K ( x , y ) 是有限区间 [ a , b ] × [ a , b ] [a, b] \times [a, b] [ a , b ] × [ a , b ] 上的连续函数,且 f ∈ C [ a , b ] f \in C[a, b] f ∈ C [ a , b ] 。如果我们有第二个核 H ( x , y ) H(x, y) H ( x , y ) ,则可以考虑(逐点)乘积核 L ( x , y ) − K ( x , y ) H ( x , y ) L(x, y) - K(x, y)H(x, y) L ( x , y ) − K ( x , y ) H ( x , y ) 和相关联的积分算子
L ( f ) ≡ ∫ a b L ( x , y ) f ( y ) d y = ∫ a b K ( x , y ) H ( x , y ) f ( y ) d y . L (f) \equiv \int_ {a} ^ {b} L (x, y) f (y) d y = \int_ {a} ^ {b} K (x, y) H (x, y) f (y) d y. L ( f ) ≡ ∫ a b L ( x , y ) f ( y ) d y = ∫ a b K ( x , y ) H ( x , y ) f ( y ) d y . 线性映射 f → K ( f ) f \rightarrow K(f) f → K ( f ) 自然是矩阵向量乘法的极限(把积分看作有限Riemann和的逼近),并且积分算子的许多性质可以通过对矩阵的已知结果取适当的极限导出。从这个观点出发,积分核的(逐点)乘积导出一个积分算子,它是类似于矩阵的Hadamard乘积的自然的连续形式。
如果积分核 K ( x , y ) K(x, y) K ( x , y ) 有以下性质,
∫ a b ∫ a b K ( x , y ) f ( x ) f ˉ ( y ) d x d y ⩾ 0 \int_ {a} ^ {b} \int_ {a} ^ {b} K (x, y) f (x) \bar {f} (y) d x d y \geqslant 0 ∫ a b ∫ a b K ( x , y ) f ( x ) f ˉ ( y ) d x d y ⩾ 0 对所有 f ∈ C [ a , b ] f \in C[a, b] f ∈ C [ a , b ] 成立,则称 K ( x , y ) K(x, y) K ( x , y ) 为半正定核,一个经典结果(Mercer定理)是说,如果
K ( x , y ) K(x, y) K ( x , y ) 是有限区间 [ a , b ] [a, b] [ a , b ] 上的连续半正定核,则存在一组正实数 { λ i } \{\lambda_i\} { λ i } (称为“特征值”)和一组连续函数 { ϕ i ( x ) } \{\phi_i(x)\} { ϕ i ( x )} (称为“特征函数”)使得在 [ a , b ] × [ a , b ] [a, b] \times [a, b] [ a , b ] × [ a , b ] 上有
K ( x , y ) = ∑ i = 1 n ϕ i ( x ) ϕ ‾ i ( y ) λ i . K (x, y) = \sum_ {i = 1} ^ {n} \frac {\phi_ {i} (x) \overline {{\phi}} _ {i} (y)}{\lambda_ {i}}. K ( x , y ) = i = 1 ∑ n λ i ϕ i ( x ) ϕ i ( y ) . [456] 且该级数绝对一致收敛.
如果 K ( x , y ) K(x, y) K ( x , y ) 和 H ( x , y ) H(x, y) H ( x , y ) 是同一个有限区间 [ a , b ] [a, b] [ a , b ] 上的连续半正定核,则 H ( x , y ) H(x, y) H ( x , y ) 在 [ a , b ] × [ a , b ] [a, b] \times [a, b] [ a , b ] × [ a , b ] 上也有绝对一致收敛的表达式
H ( x , y ) = ∑ i = 1 ∞ ψ i ( x ) ψ i ( y ) μ i , H (x, y) = \sum_ {i = 1} ^ {\infty} \frac {\psi_ {i} (x) \psi_ {i} (y)}{\mu_ {i}}, H ( x , y ) = i = 1 ∑ ∞ μ i ψ i ( x ) ψ i ( y ) , 其中,所有的 μ i > 0 \mu_i > 0 μ i > 0 。根据相应级数的直接乘法,(逐点)乘积核 L ( x , y ) = K ( x , y ) H ( x , y ) L(x, y) = K(x, y)H(x, y) L ( x , y ) = K ( x , y ) H ( x , y ) 在 [ a , b ] × [ a , b ] [a, b] \times [a, b] [ a , b ] × [ a , b ] 上有表达式
L ( x , y ) = ∑ i , j = 1 ϕ i ( x ) ψ j ( x ) ϕ ˉ i ( y ) ψ ˉ j ( y ) λ i μ j , L (x, y) = \sum_ {i, j = 1} \frac {\phi_ {i} (x) \psi_ {j} (x) \bar {\phi} _ {i} (y) \bar {\psi} _ {j} (y)}{\lambda_ {i} \mu_ {j}}, L ( x , y ) = i , j = 1 ∑ λ i μ j ϕ i ( x ) ψ j ( x ) ϕ ˉ i ( y ) ψ ˉ j ( y ) , 它也绝对一致收敛。于是
∫ a b ∫ a b L ( x , y ) f ( x ) f ( y ) d x d y = ∑ i , j = 1 ′ 1 λ i μ j ∣ ∫ a b ϕ i ( x ) ϕ j ( x ) f ( x ) d x ∣ 2 ⩾ 0 , \int_ {a} ^ {b} \int_ {a} ^ {b} L (x, y) f (x) f (y) d x d y = \sum_ {i, j = 1} ^ {\prime} \frac {1}{\lambda_ {i} \mu_ {j}} \left| \int_ {a} ^ {b} \phi_ {i} (x) \phi_ {j} (x) f (x) d x \right| ^ {2} \geqslant 0, ∫ a b ∫ a b L ( x , y ) f ( x ) f ( y ) d x d y = i , j = 1 ∑ ′ λ i μ j 1 ∫ a b ϕ i ( x ) ϕ j ( x ) f ( x ) d x 2 ⩾ 0 , 因而 L ( x , y ) L(x, y) L ( x , y ) 也是半正定的。这是 Schur 乘积定理的另一个实例。
练习 证明,两个Hermite矩阵的Hadamard乘积总是Hermite矩阵,但是,两个Hermite矩阵的普通矩阵乘积是Hermite矩阵,当且仅当它们是可交换的。
练习 考察矩阵 A = [ 2 1 1 1 ] A = \begin{bmatrix} 2 & 1 \\ 1 & 1 \end{bmatrix} A = [ 2 1 1 1 ] 和 B = [ 2 1 1 3 ] B = \begin{bmatrix} 2 & 1 \\ 1 & 3 \end{bmatrix} B = [ 2 1 1 3 ] . 证明, A , B A, B A , B 和 A ∘ B A \circ B A ∘ B 是半正定矩阵,而普通的矩阵乘积 A B AB A B 不是半正定矩阵。但是可以证明 A B AB A B 的特征值是正的。
在这里引进 Hadamard 乘积的主要理由是,(不同于普通矩阵乘积)它使由诸半正定矩阵组成的锥不变,它还给出了半正定矩阵和非负实数间的另一种类似。我们从一个具有独立意义的论断开始。
任意矩阵可以表示成一些秩1矩阵的和,其中被加矩阵的个数等于该矩阵的秩,而对于半正定矩阵,被加矩阵也可以选为半正定矩阵。
7.5.2 定理 如果 A ∈ M n A \in M_{n} A ∈ M n 是秩 k k k 半正定矩阵,则 A A A 可写成形式
A = v 1 v 1 ∗ + v 2 v 2 ∗ + ⋯ + v k v k ∗ , A = v _ {1} v _ {1} ^ {*} + v _ {2} v _ {2} ^ {*} + \dots + v _ {k} v _ {k} ^ {*}, A = v 1 v 1 ∗ + v 2 v 2 ∗ + ⋯ + v k v k ∗ , 其中,每个 v i ∈ C n v_{i} \in \mathbb{C}^{n} v i ∈ C n ,且 { v 1 , … , v k } \{v_{1}, \dots, v_{k}\} { v 1 , … , v k } 是非零向量的正交组。
证明:利用谱定理将 A A A 写成 A = U Λ U ∗ A = U\Lambda U^{*} A = U Λ U ∗ ,且设 v i \pmb{v_{i}} v i 是 U U U 的第 ι ˙ \dot{\iota} ι ˙ 列的 λ 1 1 , 2 \lambda_1^{1,2} λ 1 1 , 2 倍.
我们的主要结果常常称为Schur乘积定理,
7.5.3 定理 如果 A , B ∈ M n A, B \in M_{n} A , B ∈ M n 是半正定矩阵,则 A ∘ B A \circ B A ∘ B 也是半正定矩阵。此外,如果 A A A 和 B B B 都是正定矩阵,则 A ∘ B A \circ B A ∘ B 也是正定矩阵。
证明:利用(7.5.2)记 A = v 1 v 1 ∗ + ⋯ + v k v k ∗ A = v_{1}v_{1}^{*} + \dots + v_{k}v_{k}^{*} A = v 1 v 1 ∗ + ⋯ + v k v k ∗ 和 B = w 1 w 1 ∗ + ⋯ + w m w m ∗ B = w_{1}w_{1}^{*} + \dots + w_{m}w_{m}^{*} B = w 1 w 1 ∗ + ⋯ + w m w m ∗ ,其中 k = rank A k = \operatorname{rank} A k = rank A 且 m = rank B m = \operatorname{rank} B m = rank B 。注意到
A ∘ B − ∑ i , j = 1 k , m u i j u i j ∗ , A \circ B - \sum_ {i, j = 1} ^ {k, m} u _ {i j} u _ {i j} ^ {*}, A ∘ B − i , j = 1 ∑ k , m u ij u ij ∗ , 其中 u i j = v i ∘ w j u_{ij} = v_{i} \circ w_{j} u ij = v i ∘ w j 。因为 A ∘ B A \circ B A ∘ B 是(秩1)半正定矩阵之和,所以 A ∘ B A \circ B A ∘ B 也是半正定矩阵。
如果 A A A 和 B B B 都是正定矩阵,则 k = m = n k = m = n k = m = n ,且向量组 { v i } \{v_i\} { v i } 和 { w i } \{w_i\} { w i } 都是 C n \mathbf{C}^n C n 的正交基。尚若 A ∘ B A \circ B A ∘ B 是奇异矩阵,则存在某个非零向量 x x x 使得 ( A ∘ B ) x = 0 (A \circ B)x = 0 ( A ∘ B ) x = 0 ,因而
x ∗ ( A ∘ B ) x = ∑ i , j = 1 k , m x ∗ ( u v u v ′ ) x = ∑ i , j = 1 k , m ∣ x ∗ u v ∣ 2 = 0. x ^ {*} (A \circ B) x = \sum_ {i, j = 1} ^ {k, m} x ^ {*} \left(u _ {v} u _ {v} ^ {\prime}\right) x = \sum_ {i, j = 1} ^ {k, m} | x ^ {*} u _ {v} | ^ {2} = 0. x ∗ ( A ∘ B ) x = i , j = 1 ∑ k , m x ∗ ( u v u v ′ ) x = i , j = 1 ∑ k , m ∣ x ∗ u v ∣ 2 = 0. 另一方面,每一项必须分别为零,因而
∣ x ∗ u i j ∣ 2 = ∣ x ∗ ( v , ∘ w j ) ∣ 2 = ∣ ( x ∘ v ˉ i ) ∗ w j ∣ 2 = 0 \left| x ^ {*} u _ {i j} \right| ^ {2} = \left| x ^ {*} (v, \circ w _ {j}) \right| ^ {2} = \left| (x \circ \bar {v} _ {i}) * w _ {j} \right| ^ {2} = 0 ∣ x ∗ u ij ∣ 2 = ∣ x ∗ ( v , ∘ w j ) ∣ 2 = ∣ ( x ∘ v ˉ i ) ∗ w j ∣ 2 = 0 对所有 i i i 和 j j j 成立。这说明,对每个 i i i ,向量 x ∘ v i x \circ v_{i} x ∘ v i 正交于所有向量 w 1 , w 2 , ⋯ , w n w_{1}, w_{2}, \cdots, w_{n} w 1 , w 2 , ⋯ , w n ,因此, x ∘ v ˉ i = 0 x \circ \bar{v}_{i} = 0 x ∘ v ˉ i = 0 对所有 i = 1 , 2 , ⋯ , n i = 1, 2, \cdots, n i = 1 , 2 , ⋯ , n 成立。特别是,这蕴涵 v i ∗ x = 0 v_{i}^{*} x = 0 v i ∗ x = 0 对所有 i = 1 , ⋯ i = 1, \cdots i = 1 , ⋯ 成立。因为这意味着 x x x 与基的所有元素正交,所以一定有 x = 0 x = 0 x = 0 。由此得出 A ∘ B A \circ B A ∘ B 一定是非奇异矩阵。
练习 设 A , B ∈ M n A, B \in M_{n} A , B ∈ M n . 试用(7.5.3)的证法证明,当 A A A 和 B B B 是半正定矩阵时,总有 rank A ∘ B ⩽ ( rank A ) ( rank B ) \operatorname{rank} A \circ B \leqslant (\operatorname{rank} A)(\operatorname{rank} B) rank A ∘ B ⩽ ( rank A ) ( rank B ) ,特别是证明,如果 ( rank A ) ( rank B ) < n (\operatorname{rank} A)(\operatorname{rank} B) < n ( rank A ) ( rank B ) < n ,则 A ∘ B A \circ B A ∘ B 一定是奇异矩阵.
练习 证明,当 A A A 和 B B B 是Hermite矩阵而不一定是半正定矩阵时,上述练习的论断仍然成立.
练习 考察矩阵 A = [ 0 0 0 1 ] A = \begin{bmatrix} 0 & 0 \\ 0 & 1 \end{bmatrix} A = [ 0 0 0 1 ] 和 B = [ 1 0 0 0 ] B = \begin{bmatrix} 1 & 0 \\ 0 & 0 \end{bmatrix} B = [ 1 0 0 0 ] ,说明,即使 A A A 和 B B B 都有正的秩, rank A ∘ B \operatorname{rank} A \circ B rank A ∘ B 也可能是零。
练习 证明,如果 A A A 是正定矩阵而 B B B 是负定矩阵,则 A ∘ B A \circ B A ∘ B 是负定矩阵。
7.5.4 推论(Fejer定理)设 A = [ a i j ] ∈ M n A = [a_{ij}] \in M_n A = [ a ij ] ∈ M n ,则 A A A 是半正定矩阵当且仅当
∑ i , j = 1 n a i j b i j ⩾ 0 \sum_ {i, j = 1} ^ {n} a _ {i j} b _ {i j} \geqslant 0 i , j = 1 ∑ n a ij b ij ⩾ 0 对所有半正定矩阵 B − [ b i j ] ∈ M n B - [b_{ij}] \in M_n B − [ b ij ] ∈ M n 成立.
证明:假定 A A A 和 B B B 是半正定矩阵,且设 x ∈ C n x \in \mathbb{C}^n x ∈ C n 是所有分量都等于1的向量,于是 A ∘ B A \circ B A ∘ B 是半正定矩阵,而且 Σ a i j b i j \Sigma a_{ij} b_{ij} Σ a ij b ij 正好是 x ∗ ( A ∘ B ) x x_{*}(A \circ B)x x ∗ ( A ∘ B ) x ,它肯定是非负的。反过来,如果当 B B B 是半正定矩阵时有 Σ a i j b i j ≥ 0 \Sigma a_{ij} b_{ij} \geq 0 Σ a ij b ij ≥ 0 ,此时对任意给定的向量 x ∈ C n x \in \mathbb{C}^n x ∈ C n 令 B = [ b i j ] ≡ [ x ‾ i x j ] B = [b_{ij}] \equiv [\overline{x}_i x_j] B = [ b ij ] ≡ [ x i x j ] ,于是 B B B 是半正定矩阵,且
∑ i , j n a i j b i j = ∑ i , j − 1 n a i j x ˉ , a j = x ∗ A x ⩾ 0. \sum_ {i, j} ^ {n} a _ {i j} b _ {i j} = \sum_ {i, j - 1} ^ {n} a _ {i j} \bar {x}, a _ {j} = x ^ {*} A x \geqslant 0. i , j ∑ n a ij b ij = i , j − 1 ∑ n a ij x ˉ , a j = x ∗ A x ⩾ 0. 因为 x ∈ C n x \in \mathbf{C}^n x ∈ C n 是任意的,由此得出 A A A 是半正定矩阵。
7.5.5 应用 设 D ⊂ R n D \subset \mathbb{R}^n D ⊂ R n 是有界开集,由
L u ≡ ∑ i , j = 1 n a i j ( x ) ⋅ ∂ 2 u ∂ x i ∂ x j + ∑ i n b i ( x ) ∂ u ∂ x i + c ( x ) u (7.5.6) L u \equiv \sum_ {i, j = 1} ^ {n} a _ {i j} (x) \cdot \frac {\partial^ {2} u}{\partial x _ {i} \partial x _ {j}} + \sum_ {i} ^ {n} b _ {i} (x) \frac {\partial u}{\partial x _ {i}} + c (x) u \tag {7.5.6} Lu ≡ i , j = 1 ∑ n a ij ( x ) ⋅ ∂ x i ∂ x j ∂ 2 u + i ∑ n b i ( x ) ∂ x i ∂ u + c ( x ) u ( 7.5.6 ) 给出的 C 2 ( D ) C^2 (D) C 2 ( D ) 上的二阶线性微分算子 L L L 称为在 D D D 中是椭圆型的,是指对所有的 x ∈ D x\in D x ∈ D ,矩阵 A ( x ) ≡ ⌈ a η ( x ) ⌉ A(x)\equiv \lceil a_{\eta}(x)\rceil A ( x ) ≡ ⌈ a η ( x )⌉ 是正定矩阵.假定存在某个 u ∈ C 2 ( D ) u\in C^2 (D) u ∈ C 2 ( D ) ,它在 D D D 的闭包上连续且在 D D D 中适合方
程 L u = 0 Lu = 0 Lu = 0 ,关于函数 u \pmb{u} u 在 D D D 中的局部极大和局部极小,我们能说些什么?假定 y ∈ D y\in D y ∈ D 是关于 u \pmb{u} u 的局部极小值点,于是对所有 i = 1 , 2 , … , n i = 1,2,\dots ,n i = 1 , 2 , … , n 有
∂ u ∂ x i ∣ y = 0 , \left. \frac {\partial u}{\partial x _ {i}} \right| _ {y} = 0, ∂ x i ∂ u y = 0 , 并且Hessian矩阵
[ ∂ 2 u ∂ x , ∂ x 1 ] \left[ \frac {\partial^ {2} u}{\partial x , \partial x _ {1}} \right] [ ∂ x , ∂ x 1 ∂ 2 u ] 在点 y y y 是正定的,因此,在点 y y y 有
L u ÷ 0 = ∑ i , j n a i , ∂ n u ∂ x i ∂ x j + c u , L u \div 0 = \sum_ {i, j} ^ {n} a _ {i}, \frac {\partial^ {n} u}{\partial x _ {i} \partial x _ {j}} + c u, Lu ÷ 0 = i , j ∑ n a i , ∂ x i ∂ x j ∂ n u + c u , 并且由Fejer定理(7.5.4)可知,含有二阶导数的和必须是非负的,因而项 c ( y ) u ( y ) c(y)u(y) c ( y ) u ( y ) 必须是非正的。特别是,如果 c ( y ) < 0 c(y) < 0 c ( y ) < 0 ,则不可能有 u ( y ) < 0 u(y) < 0 u ( y ) < 0 。同理可证,如果 c ( y ) < 0 c(y) < 0 c ( y ) < 0 , u ( y ) u(y) u ( y ) 不可能在相对极大值内点 y y y 为正。这些简单的结论就是下述重要原理的要点。
7.5.7 弱极小原理 设用(7.5.6)定义的算子 L L L 为 D D D 中的椭圆型算子,且假定在 D D D 中 c ( x ) < 0 c(x) < 0 c ( x ) < 0 。如果 u ∈ C 2 ( D ) u \in C^2(D) u ∈ C 2 ( D ) 在 D D D 中适合 L u ≡ 0 Lu \equiv 0 Lu ≡ 0 ,则 u u u 不能有负的相对极小值内点,或者不可能有正的相对极大值点。此外,如果 u u u 在 D D D 的闭包上连续且在 D D D 的边界上非负,则 u u u 在 D D D 中必定处处非负。
从极小原理可以推出偏微分方程的一个基本的唯一性定理:
7.5.8 Fejer 唯一性定理 假定用 (7.5.6) 定义的算子 L L L 是椭圆型的,设在 D D D 中 c ( x ) < 0 c(x) < 0 c ( x ) < 0 ,并且考虑下述边值问题:
在 D D D 中, L u = f Lu = f Lu = f , f f f 是已知函数;
在 ∂ D \partial D ∂ D 上, u = g u = g u = g , g \pmb{g} g 是已知函数;
在 D D D 中, u u u 二次连续可微;
在 D D D 的闭包上 u \pmb{u} u 连续.
则这个问题至多存在一个解.
证明:假如 u 1 u_{1} u 1 和 u 2 u_{2} u 2 是这个问题的两个解,则函数 v = u 1 − u 2 v = u_{1} - u_{2} v = u 1 − u 2 是同一类型问题的一个解,不过具有零边值条件且在 D D D 中 L v = 0 Lv = 0 Lv = 0 。由弱极小原理可知,在 D D D 中 v v v 必须非负,把同样的论证用于 v v v ,得知 v v v 在 D D D 中也必须非正,因而在 D D D 中 v = 0 v = 0 v = 0 □
练习说明弱极小原理和Fejer唯一性定理如何应用于 D ⊂ R n D \subset \mathbb{R}^n D ⊂ R n 中的偏微分方程 ∇ 2 u − λ u = 0 \nabla^2 u - \lambda u = 0 ∇ 2 u − λ u = 0 ,其中 λ \lambda λ 是正实参数.
Schur乘积定理的最后一个推论是容易证明的,如果 A = [ a i j ] ∈ M n A = [a_{ij}]\in M_n A = [ a ij ] ∈ M n 是半正定矩阵,那么 A ∘ A = a ‾ i j 2 ] A\circ A = \underline{a}_{ij}^2 ] A ∘ A = a ij 2 ] 也是半正定矩阵.由归纳法可知,对所有 k = 1 , 2 , … k = 1,2,\dots k = 1 , 2 , … ,所有正整数次Hadamard幂 [ a i j k ] [a_{ij}^{k}] [ a ij k ] 是半正定矩阵.因为半正定矩阵的任意非负线性组合是半正定矩阵(7.1.3),这蕴涵,只要所有 a i ⩾ 0 a_{i}\geqslant 0 a i ⩾ 0
a 1 I + a 1 A + a 2 A ∘ A + ⋯ + a m A ∘ ⋯ ∘ A ‾ = ⌊ a 1 + a 1 a n + a 2 a n 2 + ⋯ + a m a n m ⌋ = [ p ( a j ) ] \begin{array}{l} a _ {1} I + a _ {1} A + a _ {2} A \circ A + \dots + a _ {m} \overline {{A \circ \cdots \circ A}} = \lfloor a _ {1} + a _ {1} a _ {n} + a _ {2} a _ {n} ^ {2} + \dots + a _ {m} a _ {n} ^ {m} \rfloor \\ = [ p (a _ {j}) ] \\ \end{array} a 1 I + a 1 A + a 2 A ∘ A + ⋯ + a m A ∘ ⋯ ∘ A = ⌊ a 1 + a 1 a n + a 2 a n 2 + ⋯ + a m a n m ⌋ = [ p ( a j )] 就是半正定矩阵; p ( x ) = a 0 + a 1 x + ⋯ + a m x m p(x) = a_0 + a_1x + \dots +a_mx^m p ( x ) = a 0 + a 1 x + ⋯ + a m x m 是非负系数多项式,更一般地,如果
f ( z ) = ∑ k = 0 ′ a k z k f (z) = \sum_ {k = 0} ^ {\prime} a _ {k} z ^ {k} f ( z ) = k = 0 ∑ ′ a k z k 是解析函数,其中所有 a k ⩾ 0 a_{k} \geqslant 0 a k ⩾ 0 且收敛半径 R > 0 R > 0 R > 0 ,则经简单的极限证法可证,只要所有 ∣ a i j ∣ < R |a_{ij}| < R ∣ a ij ∣ < R , [ f ( a i j ) ] ∈ M n [f(a_{ij})] \in M_n [ f ( a ij )] ∈ M n 就是半正定矩阵。或许最简单的例子是 f ( z ) = e z f(z) = e^z f ( z ) = e z ,其幂级数对所有 z ∈ C z \in \mathbb{C} z ∈ C 都收敛,它的系数是 a k = 1 / k ! > 0 a_k = 1 / k! > 0 a k = 1/ k ! > 0 。根据这番证明,只要 A = [ a i j ] ∈ M n A = [a_{ij}] \in M_n A = [ a ij ] ∈ M n 是半正定矩阵, [ e a i j ] [e^{a_{ij}}] [ e a ij ] 就是半正定矩阵。这个结果还可以改进; A A A 的较弱条件足以保证以 A A A 的分量为指数的矩阵是半正定的。见[HJ]。
7.5.9 推论 设 A = [ a i j ] ∈ M n A = [a_{ij}] \in M_n A = [ a ij ] ∈ M n 是半正定矩阵, 则
(a) 对所有 k = 1 , 2 , ⋯ k = 1, 2, \cdots k = 1 , 2 , ⋯ ,矩阵 [ a i j k ] [a_{ij}^{k}] [ a ij k ] 是半正定矩阵.
(b)如果 f ( z ) = a 0 + a 1 z + a 2 z 2 + … f(z) = a_0 + a_1z + a_2z^2 + \dots f ( z ) = a 0 + a 1 z + a 2 z 2 + … 是具有非负系数的解析函数,且收敛半径 R > 0 R > 0 R > 0 ,则当所有 ∣ a ν ∣ < R |a_{\nu}| < R ∣ a ν ∣ < R 时,矩阵 [ f ( a ν ) ] [f(a_{\nu})] [ f ( a ν )] 是半正定矩阵.
习题 证明,如果 H ( A ) H(A) H ( A ) ( A A A 的 Hermite 部分)是正定矩阵,且 B B B 是正定矩阵,则 H ( A ∘ B ) H(A \circ B) H ( A ∘ B ) 是正定矩阵。
如果 A = [ a i j ] A = [a_{ij}] A = [ a ij ] 是半正定矩阵,证明矩阵 [ ∣ a i j ∣ 2 ] \left[|a_{ij}|^2\right] [ ∣ a ij ∣ 2 ] 也是半正定矩阵。提示:考虑 A ∘ A A \circ A A ∘ A 。
如果 A = [ a i j ] ∈ M n A = [a_{ij}] \in M_n A = [ a ij ] ∈ M n 是半正定矩阵,证明对所有 λ ∈ R \lambda \in \mathbb{R} λ ∈ R ,矩阵 [ e s λ i ] ′ [e^{s^{\lambda_i}}]' [ e s λ i ] ′ 是半正定的。
如果 A = [ a i j ] ∈ M n A = [a_{ij}] \in M_n A = [ a ij ] ∈ M n 是半正定矩阵,则正整数次 Hadamard 幂矩阵 A ( k ) A^{(k)} A ( k ) 和 Hadamard 绝对值平方矩阵 A ∘ A ‾ A \circ \overline{A} A ∘ A 恒为半正定矩阵。但是,关于 Hadamard 绝对值矩阵 ∣ A ∣ ≡ [ ∣ a i j ∣ ] |A| \equiv [|a_{ij}|] ∣ A ∣ ≡ [ ∣ a ij ∣ ] ,其结果又如何呢?(a)假定 A ∈ M n A \in M_n A ∈ M n 是正定矩阵。对 n = 1 , 2 , 3 n = 1, 2, 3 n = 1 , 2 , 3 ,利用行列式准则(7.2.5)直接证明 ∣ A ∣ |A| ∣ A ∣ 是正定矩阵。试用取极限的办法对半正定矩阵 A A A (仅当 n = 1 , 2 , 3 n = 1, 2, 3 n = 1 , 2 , 3 时)得到相应的结果。(b)利用 f ( x ) cos ( x ) f(x)\cos(x) f ( x ) cos ( x ) 是正定函数的事实[或把 cos ( x ) \cos(x) cos ( x ) 写成 cos ( x ) = ( e x + e − x ) / 2 \cos(x) = (e^x + e^{-x}) / 2 cos ( x ) = ( e x + e − x ) /2 然后计算二次型]证明,对 { x 1 , x 2 , … , x n } ⊂ R \{x_1, x_2, \dots, x_n\} \subset \mathbb{R} { x 1 , x 2 , … , x n } ⊂ R 的所有选择和所有 n − 1 , 2 , … n - 1, 2, \dots n − 1 , 2 , … ,矩阵 A = [ cos ( x i − x j ) ] A = [\cos(x_i - x_j)] A = [ cos ( x i − x j )] 是半正定矩阵。(c)设 n = 4 n = 4 n = 4 ,且设 x 1 = 0 x_1 = 0 x 1 = 0 , x 2 = π / 4 x_2 = \pi / 4 x 2 = π /4 , x 3 = π / 2 x_3 = \pi / 2 x 3 = π /2 ,和 x 4 = 3 π / 4 x_4 = 3\pi / 4 x 4 = 3 π /4 。在这种情形,直接计算(b)中的(一定是半正定的)矩阵 A A A ,并且得出它是 Toenitz 矩阵。计算 ∣ A ∣ |A| ∣ A ∣ 和 det ∣ A ∣ \det |A| det ∣ A ∣ ,且证明 ∣ A ∣ |A| ∣ A ∣ 不可能是半正定矩阵。
考虑习题 4 中的矩阵 ∣ A ∣ |A| ∣ A ∣ ,证明, B ≡ ∣ A ∣ B \equiv |A| B ≡ ∣ A ∣ 。 ∣ A ∣ |A| ∣ A ∣ 是半正定矩阵,而它的非负“Hadamard 方根”不是半正定矩阵。将这与普通方根 B 1 , 2 B^{1,2} B 1 , 2 的情形作一比较。
考虑用
A = [ 10 3 − 2 1 3 10 0 9 − 2 0 10 4 1 9 4 10 ] A = \left[ \begin{array}{c c c c} 1 0 & 3 & - 2 & 1 \\ 3 & 1 0 & 0 & 9 \\ - 2 & 0 & 1 0 & 4 \\ 1 & 9 & 4 & 1 0 \end{array} \right] A = 10 3 − 2 1 3 10 0 9 − 2 0 10 4 1 9 4 10 给出的矩阵 A ∈ M 1 A \in M_1 A ∈ M 1 ,证明 A A A 是半正定矩阵但 ∣ A ∣ |A| ∣ A ∣ 不是半正定矩阵。
设 K ( x , y ) K(x, y) K ( x , y ) 是有限区间 [ a , b ] [a, b] [ a , b ] 上的连续积分核。证明 K ( x , y ) K(x, y) K ( x , y ) 是半正定核当且仅当对点集 { x i } i = 1 n ⊂ [ a , b ] \{x_i\}_{i=1}^n \subset [a, b] { x i } i = 1 n ⊂ [ a , b ] 的所有选择和所有 n = 1 , 2 , ⋯ n = 1, 2, \cdots n = 1 , 2 , ⋯ ,矩阵 [ K ( x i , x j ) ] ∈ M n [K(x_i, x_j)] \in M_n [ K ( x i , x j )] ∈ M n 是半正定矩阵。提示:为了证明矩阵条件是充分的,考虑对积分的 Riemann 和逼近
461
∫ a b ∫ a b K ( x , y ) f ( x ) f ˉ ( y ) d x d y ≅ ∑ i , j = 1 n K ( x i , x j ) f ( x i ) f ˉ ( x j ) Δ x i Δ x j . \int_ {a} ^ {b} \int_ {a} ^ {b} K (x, y) f (x) \bar {f} (y) d x d y \cong \sum_ {i, j = 1} ^ {n} K (x _ {i}, x _ {j}) f (x _ {i}) \bar {f} (x _ {j}) \Delta x _ {i} \Delta x _ {j}. ∫ a b ∫ a b K ( x , y ) f ( x ) f ˉ ( y ) d x d y ≅ i , j = 1 ∑ n K ( x i , x j ) f ( x i ) f ˉ ( x j ) Δ x i Δ x j . 为了证明矩阵条件是必要的,考虑函数
462
f ( x ) ≡ ∑ i = 1 n a i δ i ( x − x i ) f (x) \equiv \sum_ {i = 1} ^ {n} a _ {i} \delta_ {i} (x - x _ {i}) f ( x ) ≡ i = 1 ∑ n a i δ i ( x − x i ) 其中 δ ε ( x ) \delta_{\varepsilon}(x) δ ε ( x ) 是“近似 δ \delta δ 函数”,它是连续的,和非负的,在区间 [ − ε , ε ] [- \varepsilon, \varepsilon] [ − ε , ε ] 外恒为零,且适合
∫ ∞ δ x ( x ) d x = 1 , \int^ {\infty} \delta_ {x} (x) d x = 1, ∫ ∞ δ x ( x ) d x = 1 , 然后让 ε → 0 \varepsilon \to 0 ε → 0
试用习题7和Schur乘积定理证明半正定积分核的(逐点)乘积是半正定的。这个证明方法是比较基本的,它不需要积分方程理论中的Mercer定理。
证明,函数 ϕ ∈ C ( R ) \phi \in C(\mathbb{R}) ϕ ∈ C ( R ) 是正定函数[(7.1)节习题8]当且仅当 K ( x , y ) ≡ ϕ ( x − y ) K(x, y) \equiv \phi(x - y) K ( x , y ) ≡ ϕ ( x − y ) 是半正定积分核。
证明,两个正定函数 ϕ 1 ( x ) , ϕ 2 ( x ) \phi_1(x), \phi_2(x) ϕ 1 ( x ) , ϕ 2 ( x ) 的积 ( ϕ 1 ϕ 2 ) ( x ) (\phi_1\phi_2)(x) ( ϕ 1 ϕ 2 ) ( x ) 是正定函数。
说明为什么所有函数
(a) sin ( T x ) T x = 1 2 T ∫ T T e u x d t , T > 0 , \frac{\sin(Tx)}{Tx} = \frac{1}{2T}\int_{T}^{T}e^{ux}\mathrm{d}t,\quad T > 0, T x s i n ( T x ) = 2 T 1 ∫ T T e ux d t , T > 0 ,
(b) e − r ′ ′ = 1 2 π ∫ − ∞ ∞ e − r ′ 2 e u 2 d t , e^{-r^{\prime \prime}} = \frac{1}{2\sqrt{\pi}}\int_{-\infty}^{\infty}e^{-r^{\prime 2}}e^{u_2}dt, e − r ′′ = 2 π 1 ∫ − ∞ ∞ e − r ′2 e u 2 d t ,
(c) e − ∣ x ∣ = 1 π ∫ − ∞ + ∞ e i t x 1 + t 2 d t , e^{-|x|} = \frac{1}{\pi}\int_{-\infty}^{+\infty}\frac{e^{itx}}{1 + t^2}\mathrm{d}t, e − ∣ x ∣ = π 1 ∫ − ∞ + ∞ 1 + t 2 e i t x d t ,
以及它们彼此间的所有乘积都是正定函数.
利用 11(c) 给出 (7.2) 节习题 12 中的矩阵是正定矩阵的另一个证明.
如果 A = [ a i j ] ∈ M n A = [a_{ij}] \in M_n A = [ a ij ] ∈ M n 是半正定矩阵,证明矩阵 [ a i j / ( i + j ) ] [a_{ij} / (i + j)] [ a ij / ( i + j )] 也是半正定矩阵。提示:(7.1)节习题17.
设 A ∈ M n A \in M_{n} A ∈ M n 是半正定矩阵。证明, x ∈ C n x \in \mathbb{C}^{n} x ∈ C n 适合 x ∗ A x = 0 x^{*}Ax = 0 x ∗ A x = 0 当且仅当 A x = 0 Ax = 0 A x = 0 。如果 A A A 仅仅是Hermite 矩阵,用例子说明可能有 x ∗ A x = 0 x^{*}Ax = 0 x ∗ A x = 0 而 A x ≠ 0 Ax \neq 0 A x = 0 。提示:将 A A A 写成 A = U Λ U ∗ A = U\Lambda U^{*} A = U Λ U ∗ ,于是 x ∗ A x = 0 x^{*}Ax = 0 x ∗ A x = 0 当且仅当 ∑ λ i ∣ z i ∣ 2 = 0 \sum \lambda_{i}|z_{i}|^{2} = 0 ∑ λ i ∣ z i ∣ 2 = 0 ,其中 z = U ∗ x z = U^{*}x z = U ∗ x 。 15.(顶点在原点0的)凸锥是这样一个凸集S,使得射线{λx:λ≥0}⊂S对所有x∈S都成立.凸锥S的一条射线{λx:λ≥0}是一条极射线,是指若对于0<α<1和y,z∈S有x=ay| (1-a)z仅当y和z都在该射线上,等价地,凸锥的一条射线是一条极射线,是指把它从该锥中删掉后所得到的锥还是凸的.证明,M中由半正定矩阵组成的凸锥中的射线{λA:λ≥0}是一条极射线当且仅当A的秩为1.于是定理(7.5.2)是说,每一个半正定矩阵是位于极射线上的诸矩阵的一个凸组合.提示:(a)如果x∈C"是非零的,且xx=A+(1-a)B对某个α∈ (0,1)以及半正定矩阵A,B∈M成立,设{x,,xn}∈C"是一个适合x*𝑥k=0(其中k= 2,…,n)的标准正交组.于是0=xkAxk=xkBxk,因而根据习题14每个xk在A和B的零空间中.由此得出,A和B的秩都是1,并且各自都是xx"的一个正纯量倍数.(b)如果A∈ M是半正定的,且其秩k≥2,利用定理(7.5.2)记A=B+C,其中B=vv”,v≠0,rank C>
1,且 C v = 0 C v = 0 C v = 0 。由此得出, C C C 不是 B B B 的一个纯量倍数,因而 A A A 不在极射线上。