Die ARIMA und ETS Modelle eröffnen Prognosen basierend auf vergangenen Beobachtungen der Zielvariable. Da in der Fallstudie neben den Zeitreihen der Zielvariablen weitere Daten verfügbar sind, wird in diesem Abschnitt der Ansatz der „dynamischen Regression“ vorgestellt, der eine Integration dieser Information in die Prognosemodelle eröffnet.

Modelle der multivariaten linearen Regression beschreiben den Zusammenha ng zwischen Regressoren xk,t und abhängiger Zielvariable yt in folgender Form:

(3.4.1) yt = β1×1,t + ⋯ + βk xk,t + ϵ𝑡

Für die Störungsgrößen ϵt wird in den klassischen Regressionsmodellen angenommen, dass diese identisch verteilt sind mit E(ϵt ) = 0 und eine konstante Varianz Var(ϵt ) = σ2 aufweisen.Zudem wird Unabhängigkeit der Störgrößen angenommen.

In den dynamisch regressiven Modellen wird die zweite Annahme aufgegeben, da autokorrelierte Störgrößen zugelassen werden.75 Für die Zeitreihe der Störterme ϵt wird angenommen, dass diese einem (stationären) Arima Modell76 folgen, wobei die Bedingung E(ϵt ) = 0 bestehen bleibt.

Gleichung (3.4.1) wird demnach angepasst zu:

(3.4.2) 𝑦𝑡 = 𝛽1𝑥1,𝑡 + ⋯ + 𝛽k𝑥k,𝑡 + 𝜂𝑡 , 𝑤𝑜𝑏𝑒𝑖 𝜂𝑡 𝑒𝑖𝑛𝑒𝑚 𝐴𝑅𝐼𝑀𝐴(𝑝, 𝑑 , 𝑞) 𝑃𝑟𝑜𝑧𝑒𝑠𝑠77 𝑓𝑜𝑙𝑔𝑡

Folgt 𝜂𝑡 zum Beispiel einem ARIMA(0,1,0) Modell ergibt sich:

(3.4.3) ∇ηt = ϵt , wobei ∇: = (1 − B)

Mit algebraischen Umformungen ergibt sich aus den obigen beiden Gleichungen:

(3.4.4) ∇𝑦𝑡 = Σ (βi ∇xi,t) 𝑘 𝑖=1 + ϵ𝑡

Daraus ist ersichtlich, dass die Differenzoperation ∇ auf alle Variablen yt ,xi,t des statistischen Modells angewendet wird. Nach diesen Operationen kann wiederum die klassische lineare Regression aus Gleichung (3.4.1) angewendet werden. Die Koeffizienten des Modells können somit durch Minimierung der ϵt 2 mit der „Ordinary Least Square“78 (OLS) Methode geschätzt werden. Würde fälschlicher Weise die Summe der quadrierten ηt minimiert werden, führte dies zu unerwünschten Konsequenzen in der Schätzung der Parameter:

1. Die Schätzer der Koeffizienten β̂i sind nicht länger die besten Schätzungen, da Informationen (enthaltene Autokorrelation in den ηt) in der Kalkulation nicht berücksichtigt wurde.

2. Statistische Testverfahren (z.B. t-Test und F-test) sind ungültig.

3. Informationskriterien (AIC, AICc, BIC) sind nicht länger gute Indikatoren für die Wahl des besten Prognosemodells.

Erweitert man das vorangegangene Beispiel und nimmt an, dass 𝜂𝑡 einem ARIMA(1,1,1) Modell folgt, ergibt sich wiederum:

(3.4.5) ∇𝑦𝑡 = Σ (βi ∇xi ,t ) 𝑘 𝑖 =1 + ∇𝜂𝑡 , 𝑤𝑜𝑏𝑒𝑖 (1 − Φ1𝐵)∇𝜂𝑡 = (1 − Θ1𝐵)𝜖𝑡

Setzt man ∇𝑦𝑡 = 𝑦𝑡 ′ , ∇xi ,t = x′i ,t und ∇𝜂𝑡 = η𝑡 ′ so erkennt man, dass ein Regressionsmode ll mit ARIMA(1,1,1) Störgrößen einem Regressionsmodell in Differenzen mit ARMA Störgrößen entspricht. Zusammenfassend erhält man:

(3.4.6) 𝑦𝑡 ′ = Σ (βi x′i ,t ) 𝑘 𝑖 =1 + 𝜖𝑡 (1− Θ1𝐵)/ (1−Φ1𝐵)

Aufgrund des Terms (1− Θ1𝐵) (1−Φ1𝐵) kann das Modell aus Gleichung (3.4.6) nicht länger durch die „OLS-Methode“ geschätzt werden. Im Allgemeinen können die Parameter derartiger Regressionsmodelle mit der „Maximum Likelihood Schätzung“ bestimmt werden.

Dynamische Regressionsmodelle erklären demnach die Zielvariable durch unabhängige, externe Variablen, sowie die zeitliche Struktur der Zielvariable selbst. Im Verhältnis zu den vorangegangen ETS und ARIMA Modellen kann die Sicherheit der Vorhersage potentiell erhöht werden (schrumpfende Konfidenzintervalle). Für eine Prognose mittels dynamischem Regressionsmodell werden eigene Vorhersagen für die unabhängigen Inputvariablen benötigt. Es ist wichtig anzumerken, dass die Konfidenzintervalle der Prognosen eines Regressionsmodells nur die Unsicherheit des Regressionsmodells selbst widerspiegeln. Die Unsicherheit der Regressor Vorhersagen (unabhängige Variablen) wird im Modell nicht reflektiert. Dynamische Regressionsmodelle sollten daher als auf Richtigkeit der Regressor Prognosen bedingte Modelle interpretiert werden.