5.1 Jacobi迭代法

该算法的基本思想是通过一系列的 Jacobi 旋转 $J_{k}$ , 将 $A$ 正交相似于一个对角矩阵, 即

A ^ {(0)} = A, \quad A ^ {(k + 1)} = J _ {k} A ^ {(k)} J _ {k} ^ {\mathsf {T}}, \quad k = 0, 1, \ldots ,

且 $A^{(k)}$ 收敛到一个对角矩阵,其中 $J_{k}$ 为Jacobi旋转,通常选取 $J_{k}$ 为Givens变换,即

J _ {k} = G \left(i _ {k}, j _ {k}, \theta_ {k}\right) = \left[ \begin{array}{c c c c c c c c c} 1 & & & & & & & & \\ & \ddots & & & & & & & \\ & & 1 & & & & & & \\ & & & \cos \theta_ {k} & & \sin \theta_ {k} & & & \\ & & & & \ddots & & & & \\ & & & - \sin \theta_ {k} & & \cos \theta_ {k} & & & \\ & & & & & & 1 & & \\ & & & & & & & \ddots & \\ & & & & & & & & 1 \end{array} \right]

易知, 在 $A^{(k)}$ 两边分别左乘 $J_{k}$ 和右乘 $J_{k}^{\mathsf{T}}$ 时, 只会修改 $A^{(k)}$ 的第 $i_{k}$ 和第 $j_{k}$ 行, 以及第 $i_{k}$ 和第 $j_{k}$ 列.

由于 $A^{(k)}$ 是对称矩阵, 由下面的引理可知, 通过选取适当的 $\theta_{k}$ , 可以将 $A^{(k)}(i_k,j_k)$ 和 $A^{(k)}(j_k,i_k)$ 同时化为0.

引理5.1设 $A\in \mathbb{R}^{2\times 2}$ 是对称矩阵,则存在Givens变换 $G\in \mathbb{R}^{2\times 2}$ ，使得 $GAG^{\top}$ 为对角矩阵

(板书)

证明. 设

A = \left[ \begin{array}{c c} a & b \\ b & c \end{array} \right], \quad G = \left[ \begin{array}{c c} \cos \theta & \sin \theta \\ - \sin \theta & \cos \theta \end{array} \right],

则

\begin{array}{l} G A G ^ {\mathsf {T}} = \left[ \begin{array}{l l} \cos \theta & \sin \theta \\ - \sin \theta & \cos \theta \end{array} \right] \left[ \begin{array}{l l} a & b \\ b & c \end{array} \right] \left[ \begin{array}{l l} \cos \theta & \sin \theta \\ - \sin \theta & \cos \theta \end{array} \right] ^ {\mathsf {T}} \\ = \left[ \begin{array}{l l} a \cos^ {2} \theta + c \sin^ {2} \theta + b \sin 2 \theta & \frac {1}{2} (c - a) \sin 2 \theta + b \cos 2 \theta \\ \frac {1}{2} (c - a) \sin 2 \theta + b \cos 2 \theta & a \sin^ {2} \theta + c \cos^ {2} \theta - b \sin 2 \theta \end{array} \right] \\ \end{array}

令 $\frac{1}{2} (c - a)\sin 2\theta +b\cos 2\theta = 0$ ，可得

\frac {a - c}{2 b} = \cot 2 \theta = \frac {1 - \tan^ {2} \theta}{2 \tan \theta}.

解得

\tan \theta = \frac {\operatorname {s i g n} (\tau)}{| \tau | + \sqrt {1 + \tau^ {2}}}, \qquad \tau = \frac {a - c}{2 b}.

故引理结论成立.

为了使得 $A^{(k)}$ 收敛到一个对角矩阵, 其非对角线元素必须趋向于 0. 记 $\operatorname{off}(A)$ 为所有非对角线元素的平方和, 即

\operatorname {o f f} (A) = \sum_ {i \neq j} a _ {i j} ^ {2} = \| A \| _ {F} ^ {2} - \sum_ {i = 1} ^ {n} a _ {i i} ^ {2},

我们的目标就是使得 $\operatorname{off}(A)$ 尽快趋于 0.

引理5.2 设 $A = [a_{ij}] \in \mathbb{R}^{n \times n}$ 是对称矩阵, $\hat{A} = [\hat{a}_{ij}] = JAJ^{\top}, J = G(i,j,\theta)$ , 其中 $\theta$ 的选取使得 $\hat{a}_{ij} = \hat{a}_{ji} = 0$ , 则

\mathrm {o f f} (\hat {A}) = \mathrm {o f f} (A) - 2 a _ {i j} ^ {2}, \quad i \neq j.

(板书)

证明. 记 $A = [a_{1}, a_{2}, \ldots, a_{n}]$ . 令 $\tilde{A} = JA = [\tilde{a}_{ij}]_{n \times n}$ . 由于 $J$ 是正交阵, 故

\| J a _ {k} \| _ {2} = \| a _ {k} \| _ {2}, \quad k = 1, 2, \dots , n.

又 $J$ 左乘 $a_{k}$ 时, 只影响其第 $i$ 和第 $j$ 个元素的值, 故由 $\| Ja_i\|_2 = \| a_i\|_2$ 和 $\| Ja_j\|_2 = \| a_j\|_2$ 可得

\tilde {a} _ {i i} ^ {2} + \tilde {a} _ {j i} ^ {2} = a _ {i i} ^ {2} + a _ {j i} ^ {2}, \quad \tilde {a} _ {i j} ^ {2} + \tilde {a} _ {j j} ^ {2} = a _ {i j} ^ {2} + a _ {j j} ^ {2}. \tag {5.1}

同理, 由 $\hat{A} = \tilde{A} J^{\mathsf{T}}$ 可得

\hat {a} _ {i i} ^ {2} + \hat {a} _ {i j} ^ {2} = \tilde {a} _ {i i} ^ {2} + \tilde {a} _ {i j} ^ {2}, \quad \hat {a} _ {j i} ^ {2} + \hat {a} _ {j j} ^ {2} = \tilde {a} _ {j i} ^ {2} + \tilde {a} _ {j j} ^ {2}. \tag {5.2}

又 $\hat{a}_{ij} = \hat{a}_{ji} = 0$ ，故

\hat {a} _ {i i} ^ {2} + \hat {a} _ {j j} ^ {2} = a _ {i i} ^ {2} + a _ {j j} ^ {2} + a _ {i j} ^ {2} + a _ {j i} ^ {2} = a _ {i i} ^ {2} + a _ {j j} ^ {2} + 2 a _ {i j} ^ {2}.

由于 $JAJ^{\mathsf{T}}$ 只影响 $A$ 的第 $i,j$ 行和第 $i,j$ 列, 故对角线元素中只有 $a_{ii}$ 和 $a_{jj}$ 受影响. 所以

\sum_ {k = 1} ^ {n} \hat {a} _ {k k} ^ {2} = \sum_ {k = 1} ^ {n} a _ {k k} ^ {2} + 2 a _ {i j} ^ {2},

故

\mathrm {o f f} (\hat {A}) = \| \hat {A} \| _ {2} ^ {2} - \sum_ {k = 1} ^ {n} \hat {a} _ {k k} ^ {2} = \| A \| _ {2} ^ {2} - \sum_ {k = 1} ^ {n} a _ {k k} ^ {2} - 2 a _ {i j} ^ {2} = \mathrm {o f f} (A) - 2 a _ {i j} ^ {2},

即引理结论成立.

由此可知, $\operatorname{off}(A^{(k)})$ 总是不断减小的. 下面给出 Jacobi 迭代算法

算法5.1.Jacobi迭代算法

1: Given a symmetric matrix $A \in \mathbb{R}^{n \times n}$
2: if eigenvectors are desired then
3: set $J = I$ and $flag = 1$
4: end if
5: while not converge do
6: choose an index pair $(i,j)$ such that $a_{ij} \neq 0$
7: $\tau = (a_{ii} - a_{jj}) / (2a_{ij})$
8: $t = \operatorname{sign}(\tau) / (|\tau| + \sqrt{1 + \tau^2})$ $\%$ 计算 $\tan \theta$
9: $c = 1 / \sqrt{1 + t^2}, \quad s = ct$ % 计算 $\cos \theta$ 和 $\sin \theta$
10: $A = G(i,j,\theta)AG(i,j,\theta)^{\mathsf{T}}$
11: if $flag = 1$ then
12: $J = G(i,j,\theta)J$

13: end if
14: end while

该算法涉及到 $a_{ij}$ 的选取问题, 一种直观的选取方法就是使得 $a_{ij}$ 为所有非对角线元素中绝对值最大的一个, 这就是经典 Jacobi 迭代算法.

算法5.2.经典Jacobi迭代算法

1: Given a symmetric matrix $A \in \mathbb{R}^{n \times n}$
2: if eigenvectors are desired then
3: set $J = I$ and $flag = 1$
4: end if
5: while $\operatorname{off}(A) > \operatorname{tol}$ do
6: choose $(i,j)$ such that $|a_{ij}| = \max_{k\neq l}|a_{kl}|$ % 选取绝对值最大的元素
7: $\tau = (a_{ii} - a_{jj}) / (2a_{ij})$
8: $t = \mathrm{sign}(\tau) / (|\tau| + \sqrt{1 + \tau^2})$
9: $c = 1 / \sqrt{1 + t^2}, \quad s = ct$ % 计算 $\cos \theta$ 和 $\sin \theta$
10: $A = G(i,j,\theta)AG(i,j,\theta)^{\mathsf{T}}$
11: if $flag = 1$ then
12: $J = G(i,j,\theta)J$
13: end if
14: end while

可以证明,经典Jacobi算法至少是线性收敛的

定理5.3 对于经典Jacobi算法5.2,有

\mathrm {o f f} (A ^ {(k + 1)}) \leq \left(1 - \frac {1}{N}\right) \mathrm {o f f} (A ^ {(k)}), \quad N = \frac {n (n - 1)}{2}.

故 $k$ 步迭代后，有

\operatorname {o f f} (A ^ {(k)}) \leq \left(1 - \frac {1}{N}\right) ^ {k} \operatorname {o f f} (A ^ {(0)}) = \left(1 - \frac {1}{N}\right) ^ {k} \operatorname {o f f} (A).

(板书)

证明. 由于在经典 Jacobi 算法 5.2 中, $|a_{ij}| = \max_{k \neq l} |a_{kl}|$ , 故 $\operatorname{off}(A^{(k)}) \leq n(n + 1) \left(a_{ij}^{(k)}\right)^2$ , 即

2 \left(a _ {i j} ^ {(k)}\right) ^ {2} \geq \frac {1}{N} \mathrm {o f f} (A ^ {(k)}), \quad N = \frac {n (n - 1)}{2}.

所以由引理5.2可知

\operatorname {o f f} (A ^ {(k + 1)}) = \operatorname {o f f} (A ^ {(k)}) - \left(a _ {i j} ^ {(k)}\right) ^ {2} \leq \left(1 - \frac {1}{N}\right) \operatorname {o f f} (A ^ {(k)}).

事实上, 经典 Jacobi 算法最终是 (渐进) 二次收敛的 [30, 100]

定理5.4经典Jacobi算法5.2是 $N$ 步(渐进)二次收敛的，即对足够大的 $k$ ，有

\operatorname {o f f} \left(A ^ {(k + N)}\right) = O \left(\operatorname {o f f} ^ {2} \left(A ^ {(k)}\right)\right).

由于在经典 Jacobi 算法中, 每一步都要寻找绝对值最大的非对角元, 比较费时, 因此实用性较差. 我们可以通过逐行扫描来选取 $(i,j)$ , 这就是循环 Jacobi 迭代算法.

算法5.3. 循环Jacobi迭代算法(逐行扫描)
1: Given a symmetric matrix $A \in \mathbb{R}^{n \times n}$
2: if eigenvectors are desired then
3: set $J = I$ and $flag = 1$
4: end if
5: while off $(A) > tol$ do
6: for $i = 1$ to $n - 1$ do
7: for $j = i + 1$ to $n$ do
8: if $a_{ij} \neq 0$ then
9: $\tau = (a_{ii} - a_{jj}) / (2a_{ij})$
10: $t = \mathrm{sign}(\tau) / (|\tau| + \sqrt{1 + \tau^2})$
11: $c = 1 / \sqrt{1 + t^2}$
12: $s = c \cdot t$
13: $A = G(i, j, \theta)^{\mathrm{T}} AG(i, j, \theta)$
14: if flag = 1 then
15: $J = J \cdot G(i, j, \theta)$
16: end if
17: end if
18: end for
19: end for
20: end while

循环 Jacobi 也具有 (渐进) 二次收敛性 [135, page 270].

Jacobi迭代法的优缺点

优点：能够达到很高的计算精度 (特别是小特征值); 同时非常适合并行计算.
缺点: 计算速度较慢; 矩阵稀疏性得不到充分的利用.

5.1_Jacobi_迭代法

5.1 Jacobi迭代法

算法5.1.Jacobi迭代算法

算法5.2.经典Jacobi迭代算法

Jacobi迭代法的优缺点