7.2 GMRES方法

7.2.1 算法描述

GMRES 方法是目前求解非对称线性方程组的最常用算法之一. 在该算法中, “最佳近似解”的判别方法为“使得 $\| r_m\| _2 = \| b - Ax^{(m)}\| _2$ 最小”, 即

x ^ {(m)} = \arg \min _ {x \in x ^ {(0)} + \mathcal {K} _ {m}} \| b - A x \| _ {2}. \tag {7.6}

下面我们就根据这个最优性条件来推导出GMRES方法

设迭代初始向量为 $x^{(0)}$ ，则对任意向量 $x\in x^{(0)} + \mathcal{K}_m$ ，可设 $x = x^{(0)} + V_{m}y$ ,其中 $y\in \mathbb{R}^m$ .于是有

\begin{array}{l} r = b - A x \\ = b - A \left(x ^ {(0)} - V _ {m} y\right) \\ = r _ {0} - A V _ {m} y \\ = \beta v _ {1} - V _ {m + 1} H _ {m + 1, m} y \\ = V _ {m + 1} \left(\beta e _ {1} - H _ {m + 1, m} y\right), \\ \end{array}

这里 $\beta = \| r_0\| _2$ 由于 $V_{m + 1}$ 列正交,所以

\| r \| _ {2} = \| V _ {m + 1} (\beta e _ {1} - H _ {m + 1, m} y) \| _ {2} = \| \beta e _ {1} - H _ {m + 1, m} y \| _ {2}.

于是最优性条件 (7.6) 就等价于

y ^ {(m)} = \arg \min _ {y \in \mathbb {R} ^ {m}} \| \beta e _ {1} - H _ {m + 1, m} y \| _ {2}. \tag {7.7}

这是一个最小二乘问题. 由于 $H_{m+1,m}$ 是一个上 Hessenberg 矩阵, 且通常 $m$ 不是很大, 所以我们可以用基于 Givens 变换的 QR 分解来求解. 下面就是 GMRES 方法的基本框架.

算法7.4.GMRES方法基本框架

1: 选取初值 $x^{(0)}$ , 停机标准 $\varepsilon > 0$ , 以及最大迭代步数 IterMax

2: $r_0 = b - Ax^{(0)},\beta = \| r_0\| _2$
3: $v_{1} = r_{0} / \beta$
4: for $j = 1$ to IterMax do
5: $w = Av_{j}$
6: for $i = 1$ to $j$ do % Arnoldi 过程
7: $h_{i,j} = (v_i, w)$
8: $w = w - h_{i,j}v_i$
9: end for
10: $h_{j + 1,j} = \| w\| _2$
11: if $h_{j + 1,j} = 0$ then
12: $m = j,$ break
13: end if

14: $v_{j + 1} = w / h_{j + 1,j}$
15: relres = ||rj||2/β %相对残量
16: if relres $< \varepsilon$ then % 检测是否收敛
17: $m = j,$ break
18: end if
19: end for
20: 解最小二乘问题 (7.7), 得到 $y^{(m)}$
21: $x^{(m)} = x^{(0)} + V_m y^{(m)}$

7.2.2 具体实施细节

需要解决的问题有：

(1) 如何计算残量 $r_j \triangleq b - Ax^{(j)}$ 的范数?
(2) 如何求解最小二乘问题 (7.7)?

这两个问题可以同时处理. 首先采用 QR 分解来求解最小二乘问题. 设 $H_{m+1,m}$ 的 QR 分解为

H _ {m + 1, m} = Q _ {m + 1} ^ {\top} R _ {m + 1, m},

其中 $Q_{m + 1}\in \mathbb{R}^{(m + 1)\times (m + 1)}$ 是正交矩阵, $R_{m + 1,m}\in \mathbb{R}^{(m + 1)\times m}$ 是上三角矩阵. 则

\| \beta e _ {1} - H _ {m + 1, m} y \| _ {2} = \| \beta Q _ {m + 1} e _ {1} - R _ {m + 1, m} y \| _ {2} = \left\| \beta q _ {1} - \left[ \begin{array}{c} R _ {m} \\ 0 \end{array} \right] y \right\| _ {2}, \tag {7.8}

其中 $R_{m}\in \mathbb{R}^{m\times m}$ 是非奇异上三角矩阵(这里假定 $H_{m + 1,m}$ 不可约).所以问题(7.7)的解为

y ^ {(m)} = \beta R _ {m} ^ {- 1} q _ {1} (1: m),

且

\| r _ {m} \| _ {2} = \| b - A x ^ {(m)} \| _ {2} = \| \beta e _ {1} - H _ {m + 1, m} y ^ {(m)} \| _ {2} = \beta \cdot | q _ {1} (m + 1) |,

其中 $q_{1}(m + 1)$ 表示 $q_{1}$ 的第 $m + 1$ 个分量

$H_{m + 1,m}$ 的QR分解的递推计算方法

由于 $H_{m + 1,m}$ 是上Hessenberg矩阵，因此我们采用Givens变换

(1) 当 $m = 1$ 时, $H_{21} = \begin{bmatrix} h_{11} \\ h_{21} \end{bmatrix}$ , 构造 Givens 变换 $G_{1}$ 使得

G _ {1} H _ {2 1} = {\left[ \begin{array}{l} {*} \\ 0 \end{array} \right]} = R _ {2 1}, \quad \text {即} \quad H _ {2 1} = G _ {1} ^ {\mathsf {T}} R _ {2 1}.

(2) 假定存在 $G_{1}, G_{2}, \ldots, G_{m-1}$ , 使得

\left(G _ {m - 1} \dots G _ {2} G _ {1}\right) H _ {m, m - 1} = R _ {m, m - 1},

即

H _ {m, m - 1} = \left(G _ {m - 1} \dots G _ {2} G _ {1}\right) ^ {\mathsf {T}} R _ {m, m - 1} \triangleq Q _ {m} ^ {\mathsf {T}} R _ {m, m - 1}.

为了书写方便, 这里假定 $G_{i}$ 的维数自动扩张, 以满足矩阵乘积的需要.

(3) 考虑 $H_{m+1,m}$ 的 QR 分解. 易知

H _ {m + 1, m} = \left[ \begin{array}{c c} {{H _ {m, m - 1}}} & {{h _ {m}}} \\ {{0}} & {{h _ {m + 1, m}}} \end{array} \right], \quad \text {其 中} \quad h _ {m} = [ h _ {1 m}, h _ {2 m}, \ldots , h _ {m m} ] ^ {\mathsf {T}}.

所以有

\left[ \begin{array}{c c} Q _ {m} & 0 \\ 0 & 1 \end{array} \right] H _ {m + 1, m} = \left[ \begin{array}{c c} R _ {m, m - 1} & Q _ {m} h _ {m} \\ 0 & h _ {m + 1, m} \end{array} \right] = \left[ \begin{array}{c c} R _ {m - 1} & \tilde {h} _ {m - 1} \\ 0 & \hat {h} _ {m m} \\ 0 & h _ {m + 1, m} \end{array} \right],

其中 $\tilde{h}_{m-1}$ 是 $Q_{m}h_{m}$ 的前 $m-1$ 个元素组成的向量, $\hat{h}_{mm}$ 是 $Q_{m}h_{m}$ 的最后一个元素. 构造Givens变换 $G_{m}$ :

G _ {m} = \left[ \begin{array}{c c c} I _ {m - 1} & 0 & 0 \\ 0 & c _ {m} & s _ {m} \\ 0 & - s _ {m} & c _ {m} \end{array} \right] \in \mathbb {R} ^ {(m + 1) \times (m + 1)},

其中

c _ {m} = \frac {\hat {h} _ {m , m}}{\tilde {h} _ {m , m}}, s _ {m} = \frac {h _ {m + 1 , m}}{\tilde {h} _ {m , m}}, \tilde {h} _ {m, m} = \sqrt {\hat {h} _ {m , m} ^ {2} + h _ {m + 1 , m} ^ {2}}.

令

Q _ {m + 1} = G _ {m} \left[ \begin{array}{c c} Q _ {m} & 0 \\ 0 & 1 \end{array} \right],

则

Q _ {m + 1} H _ {m + 1, m} = G _ {m} \left[ \begin{array}{c c} R _ {m - 1} & \tilde {h} _ {m - 1} \\ 0 & \hat {h} _ {m, m} \\ 0 & h _ {m + 1, m} \end{array} \right] = \left[ \begin{array}{c c} R _ {m - 1} & \tilde {h} _ {m - 1} \\ 0 & \tilde {h} _ {m, m} \\ 0 & 0 \end{array} \right] \triangleq R _ {m + 1, m}.

所以可得 $H_{m + 1,m}$ 的QR分解 $H_{m + 1,m} = Q_{m + 1}^{\mathsf{T}}R_{m + 1,m}$

由 $H_{m,m - 1}$ 的QR分解到 $H_{m + 1,m}$ 的QR分解，我们需要

(1) 计算 $Q_{m}h_{m}$ ，即将之前的 $m - 1$ 个Givens变换作用到 $H_{m + 1,m}$ 的最后一列的前 $m$ 个元素上，所以我们需要保留所有的Givens变换；
(2) 残量计算: $\| r_{m}\|_{2} = |\beta q_{1}(m + 1)| = |\beta Q_{m + 1}(m + 1,1)|$ , 即

G _ {m} G _ {m - 1} \dots G _ {2} G _ {1} (\beta e _ {1})

的最后一个分量的绝对值. 由于在计算 $r_{m-1}$ 时就已经计算出 $G_{m-1} \cdots G_2 G_1(\beta e_1)$ , 因此这里只需做一次 Givens 变换即可;

(3) $y^{(m)}$ 的计算：当相对残量满足精度要求时，需要计算 $y^{(m)} = R_m^{-1}q_1(1:m)$ ，而 $q_{1}$ 即为 $G_{m}G_{m - 1}\dots G_{2}G_{1}(\beta e_{1})$

算法7.5.实用GMRES方法

2 0: \quad \left[ \begin{array}{c} h _ {i j} \\ h _ {i + 1, j} \end{array} \right] = \left[ \begin{array}{c c} c _ {i} & s _ {i} \\ - s _ {i} & c _ {i} \end{array} \right] \left[ \begin{array}{c} h _ {i j} \\ h _ {i + 1, j} \end{array} \right]

2 5: \quad \tau = h _ {j j} / h _ {j + 1, j}, s _ {j} = 1 / \sqrt {1 + \tau^ {2}}, c _ {j} = s _ {j} \tau

1: 选取初值 $x^{(0)}$ , 停机标准 $\varepsilon > 0$ , 以及最大迭代步数 IterMax
2: $r_0 = b - Ax^{(0)},\beta = \| r_0\| _2$
3: if $\beta / \| b \|_2 < \varepsilon$ then
4: 停止计算, 输出近似解 $x^{(0)}$
5: end if
6: $v_{1} = r_{0} / \beta$
7: $\xi = \beta e_{1}$
8: for $j = 1$ to IterMax do
9: $w = Av_{j}$
10: for $i = 1$ to $j$ do $\%$ Arnoldi过程
11: $h_{i,j} = (v_i,w)$
12: $w = w - h_{i,j}v_{i}$
13: end for
14: $h_{j + 1,j} = \| w\| _2$
15: if $h_{j+1,j} = 0$ then % 迭代中断
16: $m = j$ , break
17: end if
18: $v_{j + 1} = w / h_{j + 1,j}$
19: $\mathbf{for}i = 1$ to $j - 1$ do $\%$ 计算 $G_{j - 1}\dots G_2G_1H_{j + 1,j}(1:j,j)$
21: end for
22: if $|h_{jj}| > |h_{j+1,j}|$ then % 构造 Givens 变换 $G_j$
23: $\tau = h_{j + 1,j} / h_{jj},c_{j} = 1 / \sqrt{1 + \tau^{2}},s_{j} = c_{j}\tau$
24: else
26: end if
27: $h_{jj} = c_j h_{jj} + s_j h_{j+1,j}$ $\%$ 计算 $G_j H_{j+1,j}(1:j,j)$
28: $h_{j + 1,j} = 0$
$\left[ \begin{array}{l}\xi_{j}\\ \xi_{j + 1} \end{array} \right] = \left[ \begin{array}{ll}c_{j} & s_{j}\\ -s_{j} & c_{j} \end{array} \right]\left[ \begin{array}{l}\xi_{j}\\ 0 \end{array} \right]$ % 计算 $G_{j}(\beta G_{j - 1}\dots G_{2}G_{1}e_{1})$
30: relres = |ξj+1|/β %相对残量
31: if relres $< \varepsilon$ then

32: $m = j,$ break
33: end if
34: end for
35: $m = j$
36: $y^{(m)} = H(1:m, 1:m) \backslash \xi(1:m)$ $\%$ 求最小二乘问题的解, 回代求解
37: $x^{(m)} = x^{(0)} + V_m y^{(m)}$
38: if relres $< \varepsilon$ then
39: 输出近似解 $x$ 及相关信息
40: else
41: 输出算法失败信息
42: end if

7.2.3 GMRES 方法的中断

在上面的GMRES方法中，当执行到某一步时有 $h_{k + 1,k} = 0$ ，则算法会中断（breakdown).如果出现这种中断，则我们就找到了精确解.

定理7.4 设 $A \in \mathbb{R}^{n \times n}$ 非奇异且 $r_0 \neq 0$ . 若 $h_{i+1,i} \neq 0, i = 1,2,\ldots,k-1$ , 则 $h_{k+1,k} = 0$ 当且仅当 $x^{(k)}$ 是方程组的精确解. (不考虑舍入误差) (板书)

证明. 设 $h_{k+1,k} = 0$ , 则有

A V _ {k} = V _ {k} H _ {k}, \quad y ^ {(k)} = H _ {k} ^ {- 1} (\beta e _ {1}).

所以

\begin{array}{l} \| r _ {k} \| _ {2} = \| b - A x ^ {(k)} \| _ {2} = \| b - A \left(x ^ {(0)} + V _ {k} y ^ {(k)}\right) \| _ {2} \\ = \| r _ {0} - V _ {k} H _ {k} y ^ {(k)} \| _ {2} = \| \beta v _ {1} - V _ {k} (\beta e _ {1}) \| _ {2} = 0. \\ \end{array}

反之，设 $x^{(k)}$ 是精确解，则

0 = b - A x ^ {(k)} = r _ {0} - V _ {k + 1} H _ {k + 1, k} y ^ {(k)} = V _ {k + 1} \left(\beta e _ {1} - H _ {k + 1, k} y ^ {(k)}\right).

反证法, 假设 $h_{k+1,k} \neq 0$ , 则 $v_{k+1} \neq 0$ . 因此 $V_{k+1}$ 单位列正交, 故列满秩, 所以由上式可知

\beta e _ {1} - H _ {k + 1, k} y ^ {(k)} = 0.

由于 $H_{k + 1,k}$ 是上Hessenberg矩阵，且 $h_{i + 1,i}\neq 0,i = 1,2,\ldots ,k.$ 通过向后回代求解可得 $y^{(k)} = 0$ 于是 $\beta = 0.$ 这与 $r_0\neq 0$ 矛盾.所以 $h_{k + 1,k} = 0$

7.2.4 带重启的GMRES方法

由于随着迭代步数的增加, GMRES 方法的每一步所需的运算量和存储量都会越来越大. 因此当迭代步数很大时, GMRES 方法就不太实用. 通常的解决方法就是重启, 即事先设定一个重启迭代步数 $k$ , 如 $k = 20$ 或 50 等等, 当 GMRES 达到这个迭代步数时仍不收敛, 则计算出方程组在 $x^{(0)} + \mathcal{K}_k$ 中的最佳近似解 $x^{(k)}$ , 然后令 $x^{(0)} = x^{(k)}$ , 并重新开始新的 GMRES 迭代. 不断重复该过程, 直到收敛为止.

算法7.6.GMRES $(k)$ ：带重启的GMRES方法
1: 设定重启步数 $k \ (\ll n)$
2: 选取初值 $x^{(0)}$ , 停机标准 $\varepsilon > 0$ , 以及最大迭代
3: $r_0 = b - Ax^{(0)}, \beta = \| r_0\|_2$
4: if $\beta / \| b \|_2 < \varepsilon$ then
5: 停止计算, 输出近似解 $x = x^{(0)}$
6: end if
7: for iter=1 to ceil(IterMax/k) do % 外循环
8: $v_1 = r_0 / \beta$
9: $\xi = \beta e_1$
10: for $j = 1$ to $k$ do
11: 调用 GMRES 循环
12: end for
13: $m = j$
14: $y^{(m)} = H(1:m, 1:m) \backslash \xi(1:m)$
15: $x^{(m)} = x^{(0)} + V_m y^{(m)}$
16: if relres < $\varepsilon$ then
17: break
18: end if
19: $x^{(0)} = x^{(m)}$ % 重启 GMRES
20: $r_0 = b - Ax^{(0)}, \beta = \| r_0\|_2$
21: end for
22: if relres < $\varepsilon$ then
23: 输出近似解 $x^{(m)}$ 及相关信息
24: else
25: 输出算法失败信息
26: end if

带重启的GMRES方法需要注意的问题：

(1) 如何选取合适的重启步数 $k$ ? 一般只能依靠经验来选取;
(2) 不带重启的 GMRES 方法能保证算法的收敛性, 但带重启的 GMRES 方法却无法保证, 有时可能出现停滞现象 (stagnation).

7.2_GMRES_方法