Appendix: Numerical stability

From the BP equations, the key quantity that affects the numerical stability is \(\frac{\partial\mathcal{L}}{\partial\boldsymbol{\mathsf{H}}_t}\) (7). Suppose \(\boldsymbol{\mathsf{W}}\) has a diagonalization[1] \(\boldsymbol{\mathsf{W}} = \boldsymbol{\mathsf{Q}}\boldsymbol{\Lambda} \boldsymbol{\mathsf{Q}}^{-1}\) where \(\boldsymbol{\Lambda} = \text{diag}(\lambda_1, \ldots, \lambda_h)\) with \(|\lambda_1| > \ldots > |\lambda_h|\), then

\[ \boldsymbol{\mathsf{W}}^\kappa = \boldsymbol{\mathsf{Q}}\boldsymbol{\Lambda}^\kappa \boldsymbol{\mathsf{Q}}^{-1}. \]

Hence, the principal eigenvalue \(\lambda_1 \in \mathbb{C}\) dominates:

\[\begin{split} \boldsymbol{\mathsf{W}}^\kappa = \lambda_1^\kappa\; \boldsymbol{\mathsf{Q}} \left[ \begin{array}{llll} 1 & & & \\ & \left(\frac{\lambda_2}{\lambda_1}\right)^\kappa & & \\ & & \ddots & \\ & & & \left(\frac{\lambda_h}{\lambda_1}\right)^\kappa \end{array} \right] \boldsymbol{\mathsf{Q}}^{-1} \to \; \lambda_1^\kappa\; \boldsymbol{\mathsf{Q}}\left[\begin{array}{llll} 1 & & & \\ & 0 & & \\ & & \ddots & \\ & & & 0 \end{array}\right] \boldsymbol{\mathsf{Q}}^{-1} \end{split}\]

import numpy as np
np.random.seed(10)

eps = 1e-5
norms = {
    1.0 - eps: [],
    1.0 + eps: []
}

for c in norms.keys():

    # Rescale principal eigenvalue of A ~ N(0, 1)
    W = np.random.rand(10, 10)
    λ = np.linalg.norm(np.linalg.eig(W).eigenvalues[0])
    W = W / λ * c

    N = 18
    for i in range(N):
        norms[c].append(np.linalg.norm(W))
        W = W @ W

../../../_images/a7f0d7b2d4ae566e96c37604ed5ceb53f2b6a0d666acf4bf5df844d734aba29e.svg