## Preamble / required packages
import numpy as np
np.random.seed(0)

## Import local plotting functions and in-notebook display functions
import matplotlib.pyplot as plt
from IPython.display import Image, display
%matplotlib inline

import warnings
## Comment this out to activate warnings
warnings.filterwarnings('ignore')


# plt.style.use("dark_background")

sol.y.T[-1]

array([ -6.32487285, -10.52680883,  15.44965793])

def lorenz(t, X):
    """Lorenz system."""
    x, y, z = X
    return np.array([10 * (y - x), x * (28 - z) - y, x * y - (8 / 3) * z])


from scipy.integrate import solve_ivp

## Initial conditions
X0 = np.array([-6.32, -10.53,  15.4])

## Time vector
t = np.linspace(0, 100, 5000)

## Numerically the system with scipy's built-in solver
sol = solve_ivp(lorenz, [min(t), max(t)], X0, t_eval=t, method="Radau")
X = np.copy(sol.y.T)

plt.figure(figsize=(8, 3))
plt.plot(sol.y.T)
plt.xlabel("Time")
plt.ylabel("State variables x(t), y(t), z(t)")

plt.figure(figsize=(7, 7))
plt.plot(sol.y[0], sol.y[2], "-")
plt.xlabel("x(t)")
plt.ylabel("z(t)")

Text(0, 0.5, 'z(t)')

class TimeSeriesForecaster:
    """A base class for time series forecasting models."""

    def __init__(self, lookback=1):
        self.lookback = lookback
        self.regressor = None
    
    def _convert_to_regression(self, X, p=1):
        """
        Given a time series, construct a regression dataset to pass to a supervised 
        learning model.

        Args:
            X (np.ndarray): A time series of shape (T, 1) or (T, D) for univariate or
                multivariate time series.
            p (int): The number of lags to include in the regression dataset.

        Returns:
            Xreg (np.ndarray): A regression dataset of shape (T - p, p) or (T - p, p * D)
                for univariate or multivariate time series.
            yreg (np.ndarray): The target values for the regression dataset, of shape
                (T - p, 1).
        
        """
        Xreg, yreg = [], []
        for i in range(p, len(X)):
            Xreg.append(X[i - p:i])
            yreg.append(X[i])
        return np.array(Xreg), np.array(yreg)
    
    def fit(self, X):
        X, y = self._convert_to_regression(X, p=self.lookback)
        print(X.shape, y.shape)
        self.regressor.fit(X, y)
        self.context = X[-1][None, :]
        print(self.context.shape)

    def step(self):
        """Predict one step into the future."""
        return self.regressor.predict(self.context)


from sklearn.linear_model import RidgeCV
class LinearForecaster(TimeSeriesForecaster):
    """A simple linear regression forecaster."""

    def __init__(self, lookback=1):
        super().__init__(lookback)
        self.regressor = RidgeCV()

# Split data
X_train, X_test = X[:4000], X[4000:]

## Instantiate the forecaster
linear_forecaster = LinearForecaster(lookback=10)

## Fit the forecaster
linear_forecaster.fit(X_train[:, 0])

## Predict the next 100 steps
y_pred = linear_forecaster.step()


print("True next timepoint: ", X[4000, 0])
print("Predicted next timepoint: ", y_pred[0])

(3990, 10) (3990,)
(1, 10)
True next timepoint:  -1.508741790092486
Predicted next timepoint:  -1.4736051158915169

class AutoRegressiveForecaster(TimeSeriesForecaster):
    """An autoregressive forecaster."""

    def __init__(self, *args, **kwargs):
        super().__init__(*args, **kwargs)

    def predict(self, horizon):
        """Use autoregressive model to predict future values."""
        preds = []
        for _ in range(horizon):
            pred = self.step()
            preds.append(pred)
            self.context = np.concatenate([self.context[0, 1:], pred])[None, :]
        return np.array(preds)

class LinearAutoRegressiveForecaster(AutoRegressiveForecaster):
    """An autoregressive forecaster using linear regression."""

    def __init__(self, lookback=1):
        super().__init__(lookback)
        self.regressor = RidgeCV()

## Instantiate the forecaster
model = LinearAutoRegressiveForecaster(lookback=20)

## Fit the forecaster
model.fit(X_train[:, 0])

## Predict the next 100 steps
y_pred = model.predict(100)

plt.figure(figsize=(8, 3))
plt.plot(X_test[:100, 0], label="True")
plt.plot(y_pred[:, 0], label="Predicted")
plt.legend(frameon=False)
plt.xlabel("Time")
plt.ylabel("$x(t)$, $\hat{x}(t)$")

(3980, 20) (3980,)
(1, 20)

Text(0, 0.5, '$x(t)$, $\\hat{x}(t)$')

def mse_horizoned(y_true, y_pred):
    """Mean squared error for a horizon of predictions."""
    all_mse = list()
    for i in range(1, y_true.shape[0]):
        all_mse.append(np.mean((y_true[:i] - y_pred[:i]) ** 2))
    return all_mse

## Compute the MSE for each horizon
mse = mse_horizoned(X_test[:len(y_pred), 0], y_pred[:, 0])
plt.figure(figsize=(8, 3))
plt.semilogy(mse)
plt.xlabel("Horizon")
plt.ylabel("Mean Squared Error")

Text(0, 0.5, 'Mean Squared Error')

from sklearn.ensemble import RandomForestRegressor

class RandomForestForecaster(AutoRegressiveForecaster):
    """A random forest forecaster."""

    def __init__(self, lookback=1):
        super().__init__(lookback)
        self.regressor = RandomForestRegressor(n_estimators=100)

model = RandomForestForecaster(lookback=20)
model.fit(X_train[:, 0])
y_pred = model.predict(100)

plt.figure(figsize=(8, 3))
plt.plot(X_test[:100, 0], label="True")
plt.plot(y_pred[:, 0], label="Predicted")
plt.legend(frameon=False)
plt.xlabel("Time")
plt.ylabel("$x(t)$, $\hat{x}(t)$")

mse = mse_horizoned(X_test[:len(y_pred), 0], y_pred[:, 0])
plt.figure(figsize=(8, 3))
plt.semilogy(mse)
plt.xlabel("Horizon")
plt.ylabel("Mean Squared Error")

(3980, 20) (3980,)
(1, 20)

Text(0, 0.5, 'Mean Squared Error')

from sklearn.neural_network import MLPRegressor

class MLPForecaster(AutoRegressiveForecaster):
    """A multi-layer perceptron forecaster."""

    def __init__(self, lookback=1):
        super().__init__(lookback)
        self.regressor = MLPRegressor(hidden_layer_sizes=(100, 100), max_iter=1000)

model = MLPForecaster(lookback=20)
model.fit(X_train[:, 0])
y_pred = model.predict(100)

plt.figure(figsize=(8, 3))
plt.plot(X_test[:100, 0], label="True")
plt.plot(y_pred[:, 0], label="Predicted")
plt.legend(frameon=False)
plt.xlabel("Time")
plt.ylabel("$x(t)$, $\hat{x}(t)$")

mse = mse_horizoned(X_test[:len(y_pred), 0], y_pred[:, 0])
plt.figure(figsize=(8, 3))
plt.semilogy(mse)
plt.xlabel("Horizon")
plt.ylabel("Mean Squared Error")

(3980, 20) (3980,)
(1, 20)

Text(0, 0.5, 'Mean Squared Error')

from sklearn.linear_model import Ridge
from sklearn.preprocessing import PolynomialFeatures
from sklearn.pipeline import Pipeline

class ReservoirForecaster(AutoRegressiveForecaster):
    """
    A Reservoir Computer forecaster using deterministic polynomial featurization.

    Parameters:
        lookback (int): Number of lagged time steps to use as input features.
        max_power (int): Maximum degree of polynomial features.
    """

    def __init__(self, lookback=1, max_power=2):
        super().__init__(lookback=lookback)
        self.max_power = max_power
        # Define a pipeline with PolynomialFeatures and Ridge regression
        self.regressor = Pipeline([
            ('preprocessor', PolynomialFeatures(degree=self.max_power, include_bias=False)),
            ('ridge', RidgeCV())
        ])
        self.preprocessor = self.regressor.named_steps['preprocessor']
        
model = ReservoirForecaster(lookback=3, max_power=4)
model.fit(X_train[:, 0])
y_pred = model.predict(100)

plt.figure(figsize=(8, 3))
plt.plot(X_test[:len(y_pred), 0], label="True")
plt.plot(y_pred[:, 0], label="Predicted")


mse = mse_horizoned(X_test[:len(y_pred), 0], y_pred[:, 0])
plt.figure(figsize=(8, 3))
plt.semilogy(mse)
plt.xlabel("Horizon")
plt.ylabel("Mean Squared Error")

(3997, 3) (3997,)
(1, 3)

Text(0, 0.5, 'Mean Squared Error')

Forecasting chaotic time series¶

Forecasting as a supervised learning problem¶

Autoregressive models enable long-horizon forecasting¶

Scoring forecast models with horizoned error functions¶

Can we do any better with a neural network?¶

Next-generation reservoir computers¶