Monday 3 July 2017

Umzugsdurchschnitt Acf


Identifizieren der Zahlen von AR - oder MA-Terme in einem ARIMA-Modell. ACF - und PACF-Plots Nachdem eine Zeitreihe durch Differenzierung stationärisiert wurde, ist der nächste Schritt bei der Anpassung eines ARIMA-Modells, um festzustellen, ob AR - oder MA-Begriffe benötigt werden, um jede Autokorrelation zu korrigieren Bleibt in der differenzierten Serie Natürlich, mit Software wie Statgraphics, können Sie nur versuchen, einige verschiedene Kombinationen von Begriffen und sehen, was funktioniert am besten Aber es ist ein systematischer Weg, dies zu tun Durch Betrachten der Autokorrelation Funktion ACF und teilweise Autokorrelation PACF Plots von Die differenzierten Serien, können Sie die Anzahl der AR - und MA-Begriffe, die benötigt werden, vorläufig identifizieren Sie sind bereits mit dem ACF-Plot vertraut, es ist nur ein Balkendiagramm der Koeffizienten der Korrelation zwischen einer Zeitreihe und Verzögerungen von sich selbst. Das PACF-Plot ist Eine Auftragung der partiellen Korrelationskoeffizienten zwischen der Reihe und den Verzögerungen von sich selbst. Im allgemeinen ist die partielle Korrelation zwischen zwei Variablen die Menge der Korrelation zwischen ihnen, die nicht durch ihre gegenseitigen Korrelationen mit einem bestimmten Satz von anderen Variablen erklärt wird Wir setzen eine Variable Y auf andere Variablen X1, X2 und X3 zurück, die partielle Korrelation zwischen Y und X3 ist die Korrelation zwischen Y und X3, die nicht durch ihre gemeinsamen Korrelationen mit X1 und X2 erklärt wird. Diese partielle Korrelation kann berechnet werden Als die Quadratwurzel der Reduktion der Varianz, die durch Hinzufügen von X3 zur Regression von Y auf X1 und X2 erreicht wird. Eine teilweise Autokorrelation ist die Korrelationsgröße zwischen einer Variablen und einer Verzögerung von sich selbst, die überhaupt nicht durch Korrelationen erklärt wird Niedrigere Ordnung Die Autokorrelation einer Zeitreihe Y bei Verzögerung 1 ist der Korrelationskoeffizient zwischen Y t und Y t - 1, der vermutlich auch die Korrelation zwischen Y t -1 und Y t - 2 ist. Ist aber Y t korreliert Mit Y t -1 und Y t -1 gleich mit Y t -2 korreliert ist, dann sollten wir auch erwarten, dass sie eine Korrelation zwischen Y t und Y t-2 finden. In der Tat ist die Korrelation, die wir bei Verzögerung 2 erwarten sollten, genau die Quadrat der Lag-1-Korrelation So breitet sich die Korrelation bei Verzögerung 1 auf Verzögerung 2 und vermutlich auf höherwertige Verzögerungen aus. Die partielle Autokorrelation bei Verzögerung 2 ist daher die Differenz zwischen der tatsächlichen Korrelation bei Verzögerung 2 und der erwarteten Korrelation aufgrund der Ausbreitung Der Korrelation bei der Verzögerung 1.Hier ist die Autokorrelationsfunktion ACF der UNITS-Reihe, bevor irgendeine Differenzierung durchgeführt wird. Die Autokorrelationen sind für eine große Anzahl von Verzögerungen bedeutsam - aber vielleicht sind die Autokorrelationen bei Verzögerungen 2 und darüber nur auf die Ausbreitung zurückzuführen Der Autokorrelation bei Verzögerung 1 Dies wird durch das PACF-Plot bestätigt. Beachten Sie, dass die PACF-Kurve nur bei Verzögerung 1 einen signifikanten Spike aufweist, was bedeutet, dass alle Autokorrelationen höherer Ordnung effektiv durch die Lag-1-Autokorrelation erklärt werden. Die partiellen Autokorrelationen bei Alle Verzögerungen können durch Anpassen einer Folge von autoregressiven Modellen mit zunehmender Anzahl von Verzögerungen berechnet werden. Insbesondere ist die partielle Autokorrelation bei der Verzögerung k gleich dem geschätzten AR k-Koeffizienten in einem autoregressiven Modell mit k-Term - dh einem multiplen Regressionsmodell, bei dem Y Wird auf LAG Y, 1, LAG Y, 2, etc. bis zu LAG Y, k umgeleitet. So können Sie durch die bloße Inspektion der PACF bestimmen, wie viele AR-Begriffe Sie verwenden müssen, um das Autokorrelationsmuster in einer Zeitreihe zu erklären, wenn das Die partielle Autokorrelation ist bei der Verzögerung k und ist bei keinem höheren Auftrag signifikant, dh wenn die PACF bei der Verzögerung k abschaltet - dann schlägt man vor, dass man ein autoregressives Modell der Ordnung k anpassen sollte. Die PACF der UNITS-Serie bietet Ein extremes Beispiel für das Cut-off-Phänomen hat es eine sehr große Spike bei lag 1 und keine anderen signifikanten Spikes, was darauf hinweist, dass in Abwesenheit von differencing ein AR 1 - Modell verwendet werden sollte. Allerdings wird der AR 1-Term in diesem Modell ausfallen Um einen ersten Unterschied zu sein, da der geschätzte AR 1 - Koeffizient, der die Höhe des PACF-Spikes bei Verzögerung 1 ist, fast genau gleich 1 ist. Nun ist die Prognosegleichung für ein AR 1 - Modell für eine Serie Y ohne Ordnungen von Differenziert ist. Wenn der AR 1 - Koeffizient 1 in dieser Gleichung gleich 1 ist, ist es äquivalent zu der Vorhersage, dass die erste Differenz von Y konstant ist - dh es entspricht der Gleichung des zufälligen Wandermodells mit dem Wachstum. Die PACF von Die UNITS-Serie erzählt uns, dass, wenn wir es nicht anders machen, dann sollten wir ein AR-1-Modell passen, das sich als gleichbedeutend mit einem ersten Unterschied herausstellen wird. Mit anderen Worten, es sagt uns, dass UNITS wirklich eine Bestellung benötigt Differenziert, um stationär zu sein. AR - und MA-Signaturen Wenn die PACF einen scharfen Cutoff zeigt, während die ACF langsamer abfällt, dh signifikante Spikes bei höheren Verzögerungen hat, sagen wir, dass die stationäre Serie eine AR-Signatur anzeigt, was bedeutet, dass das Autokorrelationsmuster mehr erklärt werden kann Leicht durch Hinzufügen von AR-Terme als durch Hinzufügen von MA-Begriffen Sie werden wahrscheinlich feststellen, dass eine AR-Signatur häufig mit einer positiven Autokorrelation bei Verzögerung 1 assoziiert ist - dh sie neigt dazu, in Serie zu kommen, die leicht unter differenziert sind. Der Grund dafür ist, dass ein AR-Term Kann wie ein partieller Unterschied in der Prognosegleichung fungieren. Beispielsweise wirkt der AR-Term in einem AR-1-Modell wie ein erster Unterschied, wenn der autoregressive Koeffizient gleich 1 ist, tut es nichts, wenn der autoregressive Koeffizient null ist und er wirkt wie folgt Eine Teildifferenz, wenn der Koeffizient zwischen 0 und 1 liegt. Wenn also die Serie etwas unterdifferenziert ist - dh wenn das nichtstationäre Muster der positiven Autokorrelation nicht vollständig beseitigt ist, wird es eine Teildifferenz durch die Anzeige einer AR-Signatur verlangen Haben die folgende Faustregel für die Bestimmung, wann man AR-Terme hinzufügen soll. Regel 6 Wenn die PACF der differenzierten Serie einen scharfen Cutoff zeigt und die Lag-1 Autokorrelation positiv ist - wenn die Serie etwas unterdifferenziert erscheint - dann erwägen sie hinzuzufügen Ein AR-Term zum Modell Die Verzögerung, bei der die PACF abschneidet, ist die angegebene Anzahl von AR-Terme. Grundsätzlich kann jedes Autokorrelationsmuster aus einer stationärisierten Reihe entfernt werden, indem man genügend autoregressive Terme der stationärisierten Reihe der Prognosegleichung hinzufügt, Und die PACF sagt Ihnen, wie viele solcher Begriffe wahrscheinlich benötigt werden. Allerdings ist dies nicht immer der einfachste Weg, um ein gegebenes Muster der Autokorrelation zu erklären, manchmal ist es effizienter, MA-Terms-Verzögerungen der Prognosefehler zu addieren. Die Autokorrelationsfunktion ACF spielt die Gleiche Rolle für MA-Begriffe, dass die PACF für AR-Begriffe spielt - das heißt, die ACF sagt Ihnen, wie viele MA-Begriffe sind wahrscheinlich erforderlich, um die verbleibende Autokorrelation aus der differenzierten Serie zu entfernen Wenn die Autokorrelation bei lag k aber nicht bei Irgendwelche höheren Verzögerungen - dh wenn der ACF bei Verzögerung k abschaltet - bedeutet dies, dass genau k MA-Begriffe in der Prognosegleichung verwendet werden sollen. Im letzteren Fall sagen wir, dass die stationäre Serie eine MA-Signatur anzeigt, was bedeutet, dass die Autokorrelation Muster kann durch Hinzufügen von MA-Terminen leichter erklärt werden, als durch Hinzufügen von AR-Terme. Eine MA-Signatur ist üblicherweise mit einer negativen Autokorrelation bei Verzögerung 1 assoziiert - dh sie neigt dazu, in Serie zu kommen, die etwas überdimensioniert sind. Der Grund dafür ist, dass ein MA Englisch: www. tab. fzk. de/en/projekt/zusammenf...ng/ab117.htm Um dies zu sehen, ist zu erinnern, dass ein ARIMA 0,1,1 Modell ohne Konstante gleichbedeutend mit einem Simple Exponential Glättungsmodell ist. Die Prognosegleichung für dieses Modell ist, wo der MA 1 Koeffizient 1 ist Entspricht der Menge 1 - im SES-Modell Wenn 1 gleich 1 ist, entspricht dies einem SES-Modell mit 0, das ist nur ein CONSTANT-Modell, weil die Prognose niemals aktualisiert wird. Dies bedeutet, dass wenn 1 gleich 1 ist Die die SES-Prognose gewöhnlich bei der letzten Beobachtung wieder verankern kann. Andererseits, wenn der gleitende durchschnittliche Koeffizient gleich 0 ist, reduziert sich dieses Modell auf ein zufälliges Wandermodell - dh es verlässt es Die differenzierende Operation allein Also, wenn 1 etwas größer als 0 ist, ist es so, als ob wir teilweise eine Reihenfolge der Differenzierung annullieren. Wenn die Serie schon etwas überdimensioniert ist - dh wenn eine negative Autokorrelation eingeführt wurde - dann wird sie fragen Ein Unterschied, der teilweise durch die Anzeige einer MA-Signatur abgesagt wird. Eine Menge von Armwellen geht hier weiter Eine strengere Erklärung dieses Effektes findet sich in der mathematischen Struktur von ARIMA-Models Handout daher die folgende zusätzliche Faustregel. Regel 7 Wenn die ACF der differenzierten Serie zeigt einen scharfen Cutoff und / oder die Lag-1 Autokorrelation ist negativ - wenn die Serie etwas überdifferenziert erscheint - dann erwägen, einen MA-Term zum Modell hinzuzufügen. Die Verzögerung, bei der der ACF abschaltet, ist die angegebene Zahl Von MA-Terminen. Modell für die UNITS-Serie - ARIMA 2,1,0 Bisher haben wir festgestellt, dass die UNITS-Serie mindestens eine Reihenfolge der Nicht-Sequenz-Differenzierung benötigt, um stationär zu sein. Nach der Einnahme einer nicht-seasonalen Differenz - dh Anpassung an eine ARIMA 0,1 , 0-Modell mit Konstante - die ACF - und PACF-Plots sehen so aus. Nichts, dass die Korrelation bei lag 1 signifikant und positiv ist und b die PACF einen schärferen Cutoff als die ACF zeigt. Insbesondere hat die PACF nur zwei signifikante Spikes , Während der ACF vier hat, so ergibt sich nach der obigen Regel 7 die differenzierte Serie eine AR 2 - Signatur Wenn wir also die Reihenfolge des AR-Termes auf 2 setzen - also ein ARIMA-2,1,0-Modell passen - erhalten wir Die folgenden ACF - und PACF-Plots für die Residuen. Die Autokorrelation bei den entscheidenden Verzögerungen - nämlich Verzögerungen 1 und 2 - wurde eliminiert, und es gibt kein erkennbares Muster in höherwertigen Verzögerungen Die Zeitreihenpläne der Residuen zeigen etwas Beunruhigende Tendenz, vom Mittelwert weg zu wandern. Allerdings zeigt der Analyse-Zusammenfassungsbericht, dass das Modell dennoch in der Validierungsperiode sehr gut abläuft, beide AR-Koeffizienten unterscheiden sich deutlich von Null und die Standardabweichung der Residuen wurde von 1 54371 reduziert Auf 1 4215 fast 10 durch die Hinzufügung der AR-Terme Darüber hinaus gibt es keine Anzeichen für eine Einheit Wurzel, weil die Summe der AR-Koeffizienten 0 252254 0 195572 ist nicht in der Nähe von 1 Einheit Wurzeln werden ausführlicher diskutiert Im Folgenden, Dies scheint ein gutes Modell zu sein. Die untransformierten Prognosen für das Modell zeigen einen linearen Aufwärtstrend, der in die Zukunft projiziert wird. Der Trend in den Langzeitprognosen ist auf die Tatsache zurückzuführen, dass das Modell einen nicht-seasonalen Unterschied und einen konstanten Begriff dieses Modells beinhaltet Grundsätzlich ein zufälliger Spaziergang mit wachsendem Feind durch Addition zweier autoregressiver Begriffe - dh zwei Verzögerungen der differenzierten Serie Die Steigung der Langzeitprognosen, dh der durchschnittliche Anstieg von einer Periode zur anderen, entspricht dem Mittelwert der Modellzusammenfassung 0 467566 Die Prognosegleichung ist da ist der konstante Term in der Modellübersicht 0 258178, 1 ist der AR 1 Koeffizient 0 25224 und 2 ist der AR 2 Koeffizient 0 195572.Mean gegenüber der Konstante Im Allgemeinen ist der mittlere Term in der Die Ausgabe eines ARIMA-Modells bezieht sich auf den Mittelwert der differenzierten Reihe, dh der durchschnittliche Trend, wenn die Reihenfolge der Differenzierung gleich 1 ist, während die Konstante der konstante Term ist, der auf der rechten Seite der Prognosegleichung erscheint Konstante Begriffe sind durch die Gleichung verknüpft. CONSTANT MEAN 1 minus die Summe der AR Koeffizienten In diesem Fall haben wir 0 258178 0 467566 1 - 0 25224 - 0 195572.Lichtmodell für die UNITS Serie - ARIMA 0,2, 1 Erinnern wir uns, dass wir, als wir anfingen, die UNITS-Reihe zu analysieren, nicht ganz sicher waren von der korrekten Reihenfolge der Differenzierung zu verwenden. Eine Reihenfolge der Nicht-Seasonal-Differenzierung ergab die niedrigste Standardabweichung und ein Muster der milden positiven Autokorrelation, während zwei Ordnungen der Nichtseason-Differenzierung nachgaben Eine eher stationär aussehende Zeitreihen-Handlung, aber mit einer starken negativen Autokorrelation Hier sind sowohl die ACF als auch die PACF der Serie mit zwei nicht-seasonalen Differenzen. Die einzelne negative Spike bei Verzögerung 1 im ACF ist eine MA 1 Signatur gemäß Regel 8 oben Wenn wir also 2 Nichtseasonalunterschiede verwenden würden, hätten wir auch einen MA 1-Term, der ein ARIMA-0,2,1-Modell liefert. Nach Regel 5 wollen wir auch den konstanten Begriff unterdrücken. Hier sind also Die Ergebnisse der Anpassung eines ARIMA 0,2,1 Modells ohne Konstante. Notice, dass die geschätzte weiße Rausch Standardabweichung RMSE ist nur sehr etwas höher für dieses Modell als die vorherige 1 46301 hier versus 1 45215 zuvor Die Prognose Gleichung für dieses Modell ist Wo theta-1 der MA 1 - Koeffizient ist, erinnern wir, dass dies einem linearen exponentiellen Glättungsmodell ähnlich ist, wobei der MA 1 - Koeffizient der Größe 2 1-alpha im LES-Modell entspricht. Der MA 1 - Koeffizient von 0 76 in diesem Modell deutet darauf hin Dass ein LES-Modell mit Alpha in der Nähe von 0 72 genauso gut passen würde. Wenn ein LES-Modell an die gleichen Daten angepasst ist, erweist sich der optimale Wert von alpha auf etwa 0 61, was nicht zu weit weg ist Ist ein Modellvergleichsbericht, der die Ergebnisse der Montage des ARIMA 2,1,0 Modells mit konstantem, ARIMA 0,2,1 Modell ohne Konstante und dem LES Modell zeigt. Die drei Modelle sind in der Schätzperiode nahezu identisch Das ARIMA 2,1,0 Modell mit konstantem erscheint etwas besser als die beiden anderen in der Validierungsperiode Auf der Basis dieser statistischen Ergebnisse allein wäre es schwer, zwischen den drei Modellen zu wählen. Allerdings, wenn wir die langfristigen Prognosen abgeben Die von dem ARIMA 0,2,1 Modell ohne Konstante gemacht wurden, die im Wesentlichen die gleichen sind wie die des LES-Modells, sehen wir einen signifikanten Unterschied zu denen des früheren Modells. Die Prognosen haben etwas weniger Aufwärtstrend als die des früheren Modell - denn der lokale Trend nahe dem Ende der Serie ist etwas weniger als der durchschnittliche Trend über die ganze Serie - aber die Konfidenzintervalle breiten sich viel schneller aus Das Modell mit zwei Ordnungen der Differenzierung geht davon aus, dass der Trend in der Serie Zeit ist - varying, daher hält es für die ferne Zukunft, um viel unsicherer zu sein, als das Modell mit nur einer Reihenfolge der Differenzierung. Welches Modell sollten wir wählen Das hängt von den Annahmen ab, die wir in Bezug auf die Konstanz des Trendes in den Daten bequem machen Das Modell mit nur einer Reihenfolge der Differenzierung nimmt einen konstanten durchschnittlichen Trend an - es handelt sich im Wesentlichen um ein fein abgestimmtes zufälliges Wandermodell mit Wachstum - und das macht daher relativ konservative Trendprojektionen. Es ist auch ziemlich optimistisch hinsichtlich der Genauigkeit, mit der es prognostiziert werden kann Mehr als eine Periode im Vorfeld Das Modell mit zwei Ordnungen der Differenzierung nimmt einen zeitlich variierenden lokalen Trend - es ist im Wesentlichen ein lineares exponentielles Glättungsmodell - und seine Trendprojektionen sind etwas mehr fälschlich. Als allgemeine Regel in dieser Art von Situation, Ich würde empfehlen, das Modell mit der niedrigeren Reihenfolge der Differenzierung zu wählen, andere Dinge sind ungefähr gleich In der Praxis, zufällige Spaziergang oder einfach-exponentiell-glättende Modelle scheinen oft besser zu funktionieren als lineare exponentielle Glättung Modelle. Mixed Modelle In den meisten Fällen die besten Modell stellt sich heraus, ein Modell, das entweder nur AR-Begriffe oder nur MA-Begriffe verwendet, obwohl in einigen Fällen ein gemischtes Modell mit sowohl AR - als auch MA-Terminen die besten Anpassungen an die Daten liefern kann. Allerdings muss bei der Montage von gemischten Modellen Vorsicht geboten werden Für einen AR-Term und einen MA-Term, um sich gegenseitig s Effekte aufzuheben, obwohl beide im Modell signifikant erscheinen können, wie durch die t-Statistik ihrer Koeffizienten beurteilt wird. So wird beispielsweise angenommen, dass das richtige Modell für eine Zeitreihe ein ARIMA ist 0,1,1-Modell, aber stattdessen passen Sie ein ARIMA 1,1,2-Modell - dh Sie beinhalten einen zusätzlichen AR-Term und einen zusätzlichen MA-Term Dann können die zusätzlichen Begriffe am Ende im Modell deutlich erscheinen, aber intern können sie Nur gegeneinander arbeiten Die daraus resultierenden Parameterschätzungen können zweideutig sein, und der Parameterschätzprozess kann sehr viele z. B. mehr als 10 Iterationen annehmen, um daraus zu konvergieren. Regel 8 Es ist möglich, dass ein AR-Term und ein MA-Term sich gegenseitig aufheben Effekte, also wenn ein gemischtes AR-MA-Modell den Daten zu entsprechen scheint, probier auch ein Modell mit einem weniger AR-Term und einem weniger MA-Term aus - besonders wenn die Parameterschätzungen im Originalmodell mehr als 10 Iterationen konvergieren müssen In diesem Grund können ARIMA-Modelle nicht durch einen rückwärts schrittweisen Ansatz identifiziert werden, der sowohl AR - als auch MA-Terme enthält. Mit anderen Worten: Sie können nicht beginnen, indem Sie mehrere Begriffe jeder Art einbeziehen und dann diejenigen auswerfen, deren geschätzte Koeffizienten nicht signifikant sind Ein vorwärts schrittweises Vorgehen, das Hinzufügen von Terme der einen oder anderen Art, wie durch das Auftreten der ACF - und PACF-Plots angedeutet ist. Unit-Wurzeln Wenn eine Reihe grob unter - oder überdifferenziert ist - dh wenn eine ganze Reihenfolge der Differenzierung hinzugefügt werden muss oder Abgesagt, wird dies oft von einer Einheitswurzel in den geschätzten AR - oder MA-Koeffizienten des Modells signalisiert. Ein AR-1-Modell soll eine Einheitswurzel haben, wenn der geschätzte AR 1 - Koeffizient fast genau gleich 1 ist Deutlich anders als im Hinblick auf den eigenen Standardfehler des Koeffizienten Wenn dies geschieht, bedeutet dies, dass der AR 1-Term genau einen ersten Unterschied nachahmt, in welchem ​​Fall man den AR 1-Term entfernen und eine Reihenfolge der Differenzierung hinzufügen soll. Das ist genau so Was passieren würde, wenn man ein AR 1 - Modell an die undifferenzierte UNITS-Serie anpasst, wie bereits erwähnt In einem AR-Modell höherer Ordnung existiert eine Einheitswurzel im AR-Teil des Modells, wenn die Summe der AR-Koeffizienten genau gleich 1 ist In diesem Fall solltest du die Reihenfolge des AR-Termes um 1 reduzieren und eine Reihenfolge der Differenzierung hinzufügen. Eine Zeitreihe mit einer Einheitswurzel in den AR-Koeffizienten ist nichtstationär - es braucht eine höhere Reihenfolge der Differenzierung. Regel 9 Wenn es eine Einheitswurzel im AR-Teil des Modells - dh wenn die Summe der AR-Koeffizienten fast genau 1 ist - soll man die Anzahl der AR-Terme um eins reduzieren und die Reihenfolge der Differenzierung um eins erhöhen. Ähnlich ein MA 1-Modell Soll eine Einheitswurzel haben, wenn der geschätzte MA 1 - Koeffizient genau gleich 1 ist. Wenn dies geschieht, bedeutet dies, dass der MA 1-Term genau einen ersten Unterschied annulliert, in welchem ​​Fall Sie den MA 1-Term entfernen und auch reduzieren sollten Die Reihenfolge der Differenzierung um eins In einem übergeordneten MA-Modell existiert eine Einheitswurzel, wenn die Summe der MA-Koeffizienten genau gleich 1 ist. Regel 10 Wenn es eine Einheitswurzel im MA-Teil des Modells gibt - dh wenn Die Summe der MA-Koeffizienten ist fast genau 1 - Sie sollten die Anzahl der MA-Terme um eins reduzieren und die Reihenfolge der Differenzierung um eins reduzieren. Zum Beispiel, wenn Sie ein lineares exponentielles Glättungsmodell ein ARIMA 0,2,2 Modell passen Wenn ein einfaches exponentielles Glättungsmodell ein ARIMA-0,1,1-Modell ausreichen würde, können Sie feststellen, dass die Summe der beiden MA-Koeffizienten sehr nahezu gleich 1 ist. Durch Verringerung der MA-Ordnung und der Reihenfolge der Differenzierung um jeweils eine, Erhalten Sie das passendere SES-Modell Ein Prognosemodell mit einer Einheitswurzel in den geschätzten MA-Koeffizienten wird als nichtinvertibel bezeichnet, was bedeutet, dass die Residuen des Modells nicht als Schätzungen des wahren zufälligen Rauschens betrachtet werden können, das die Zeitreihen erzeugt hat. Ein weiteres Symptom von Eine Einheit Wurzel ist, dass die Prognosen des Modells kann sprengen oder sonst verhalten bizarr Wenn die Zeitreihenplot der längerfristigen Prognosen des Modells sieht seltsam, sollten Sie die geschätzten Koeffizienten Ihres Modells für die Anwesenheit einer Einheit Wurzel zu überprüfen. Rule 11 Wenn die Langzeitprognosen unregelmäßig oder instabil erscheinen, kann es in den AR - oder MA-Koeffizienten eine Einheitswurzel geben. Keiner dieser Probleme entstand mit den beiden hier installierten Modellen, weil wir sorgfältig mit plausiblen Ordnungen der Differenzierung beginnen mussten Und entsprechende Anzahl von AR - und MA-Koeffizienten durch das Studium der ACF - und PACF-Modelle. Mehr detaillierte Diskussionen über Einheitswurzeln und Streichungseffekte zwischen AR - und MA-Terme finden Sie in der Mathematischen Struktur von ARIMA Models Handout. AR MA, ARMA Acf-Pacf Visualisierungen. As erwähnt in früheren Post Ich habe mit Autoregressive und Moving Average Simulationen gearbeitet Um die Korrektheit der Schätzungen durch unsere Simulationen zu testen, verwenden wir acf Autokorrelation und pacf partielle Autokorrelation zu unserer Verwendung Für verschiedene Reihenfolge von AR und MA erhalten wir die unterschiedlichen Visualisierungen Mit ihnen, wie. Exponential abnehmende Kurven. Damped Sinuswellen. Positive und negative Spikes, etc. Während analysieren und schreiben Tests für die gleichen, habe ich auch einige Zeit, um diese Daten auf ilne und Balkendiagramme zu visualisieren, um ein klareres Bild. AR zu bekommen 1 process. AR 1 Prozess ist die autoregressive Simulation mit der Ordnung p 1, dh mit einem Wert von phi Ideal AR p Prozess wird dargestellt durch Um dies zu simulieren, installieren Sie Stichproben-Zeiten von hier. Hier, Anzahl der Beobachtungen, n 1500 größerer Wert Ist für die optimale Passform vorzuziehen, p 1, mit phi 0 9.To generieren es autokorrelation. Für ein AR 1 Prozess muss acf exponentiell zerfallen, wenn phi 0 oder abwechselnd im Zeichen, wenn phi 0 Ref durch die Analyse oben Es kann visualisiert werden Wie wenn phi 0 acf stetig exponentiell Wenn phi 0 bekommt man die alternativen acf lags. To generieren es s partielle autokorrelation. Für AR 1 Prozess muss pacf eine Spike bei lag 1 haben, dann 0 ehemalige Spike muss positiv sein, wenn phi 0 sonst, Negative Spike Schauen Sie sich die oben erzeugte Pacf-Serie an. Auf der Visualisierung der Daten Wenn phi 0 positive Verzögerung bei 1 und 0 enthält 1 0 Wenn phi 0 negative Verzögerung bei 1.Hier ist die Darstellung der idealen acf-vs-pacf für positive phi in AR 1.AR P-Prozess. Simulation von AR-P-Prozess ist ähnlich wie AR 1.For AR p, acf muss eine Dämpfung Sinus Welle geben Das Muster ist stark abhängig von der Wert und Zeichen der phi-Parameter Wenn positive Inhalte in Phi-Koeffizienten mehr ist , Bekommst du eine Sinuswelle, die von der positiven Seite ausgeht, sonst wird die Sinuswelle von der negativen Seite ausgehen. Hinweis: Die Dämpfungssinuswelle beginnt von der positiven Seite hier und der negativen Seite hier. pacf gibt Spike bei Verzögerung 0 Wert 1 0, Standard und ab Lag 1 to lag k Das obige Beispiel, AR 2 Prozess, dafür müssen wir Spikes bei lag 1 - 2 wie. MA 1 process. MA 1 Prozess ist die gleitende durchschnittliche Simulation mit Ordnung q 1 dh mit einem Wert von Theta Um dies zu simulieren, benutze masim-Methode von Statsample ARIMA ARIMA. Für theta 0 für MA 1 müssen wir einen positiven Spike bei lag 1 erhalten. Für theta 0 muss die Spike bei lag 1 in negatie Richtung sein. Wenn ich diese beiden Visualisierungen stelle Beidseitig scheint die Visualisierung ganz fit. MA q process. MA q Prozess Auftrag q Anzahl der Theta-Koeffizienten q Ideal MA q Prozess wird dargestellt. Ähnlich zu AR 1 Simulation, wird es Spikes für lag 1 - lag p as haben. In pacf der MA q Simulation beobachten wir exponentiell abklingende Dämpfung Sinuswelle. ARMA p, q process. ARMA p, q ist die Kombination von autoregressiven und gleitenden Mittelsimulationen Wenn q 0 der Prozess als reiner autoregressiver Prozess bezeichnet wird, wenn p 0 der Prozess ist Rein gleitender Durchschnitt Der Simulator von ARMA kann als armasim in Statsample gefunden werden ARIMA ARIMA Für ARMA 1, 1 Prozess, hier sind die Vergleiche der Visualisierungen von R und dieser Code, der gerade meinen Tag gemacht hat. Cheers, - Ankur Goel. Posted by Ankur Goel 20. Juli 2013.Recent Posts. GitHub Repos.2 1 Bewegliche durchschnittliche Modelle MA models. Time-Serienmodelle, die als ARIMA-Modelle bekannt sind, können autoregressive Begriffe und gleitende durchschnittliche Ausdrücke enthalten In Woche 1 haben wir einen autoregressiven Begriff in einer Zeitreihe gelernt Modell für die Variable xt ist ein verzögerter Wert von xt. Zum Beispiel ist ein autoregressiver Term 1 x t-1 multipliziert mit einem Koeffizienten. Diese Lektion definiert gleitende durchschnittliche Terme. Ein bewegter Durchschnittsterm in einem Zeitreihenmodell ist ein vergangener Fehler multipliziert mit Ein Koeffizient. Let wt Overset N 0, Sigma 2w, was bedeutet, dass die wt identisch, unabhängig verteilt sind, jeweils mit einer Normalverteilung mit Mittelwert 0 und der gleichen Varianz. Das 1-stufige gleitende Durchschnittsmodell, das mit MA 1 bezeichnet wird, ist. Xt mu wt theta1w. Das 2. geordnete gleitende Durchschnittsmodell, das mit MA 2 bezeichnet wird, ist. Xt mu wt theta1w theta2w. Das gängige gleitende durchschnittliche Modell, das mit MA q bezeichnet wird, ist. Xt mu wt theta1w theta2w punkte thetaq. Note Viele Lehrbücher und Softwareprogramme definieren das Modell mit negativen Vorzeichen vor den Begriffen Dies ändert nicht die allgemeinen theoretischen Eigenschaften des Modells, obwohl es die algebraischen Zeichen der geschätzten Koeffizientenwerte und nicht quittierten Begriffe in Formeln für ACFs und Abweichungen Sie müssen Ihre Software überprüfen, um zu überprüfen, ob negative oder positive Zeichen verwendet wurden, um das geschätzte Modell R korrekt zu schreiben. R verwendet positive Zeichen in seinem zugrunde liegenden Modell, wie wir hier sind. Die theoretischen Eigenschaften einer Zeitreihe mit Ein MA 1 Modell. Hinweis, dass der einzige Wert ungleich Null in der theoretischen ACF ist für lag 1 Alle anderen Autokorrelationen sind 0 Also ein Beispiel ACF mit einer signifikanten Autokorrelation nur bei lag 1 ist ein Indikator für eine mögliche MA 1 Modell. Für interessierte Studenten, Beweise dieser Eigenschaften sind ein Anhang zu diesem Handzettel. Beispiel 1 Angenommen, dass ein MA 1 - Modell xt 10 wt 7 w t-1 ist, wobei wt Overset N 0,1 Somit ist der Koeffizient 1 0 7 Die theoretische ACF ist gegeben durch Von diesem ACF folgt. Die Plot, die gerade gezeigt wird, ist die theoretische ACF für eine MA 1 mit 1 0 7 In der Praxis, ein Beispiel gewonnen t in der Regel ein solches klares Muster Mit R, simulierten wir n 100 Probenwerte mit dem Modell xt 10 wt 7 W t-1 wo w t. iid N 0,1 Für diese Simulation folgt ein Zeitreihenplot der Stichprobendaten Wir können aus dieser Handlung viel erzählen. Die Stichprobe ACF für die simulierten Daten folgt Wir sehen eine Spike bei Verzögerung 1 Gefolgt von im Allgemeinen nicht signifikanten Werten für Verzögerungen nach 1. Beachten Sie, dass die Stichprobe ACF nicht mit dem theoretischen Muster der zugrunde liegenden MA 1 übereinstimmt, was bedeutet, dass alle Autokorrelationen für Verzögerungen nach 1 0 sind. Eine andere Probe hätte eine etwas andere Probe ACF Unten gezeigt, aber wahrscheinlich die gleichen breiten Features haben. Theroretische Eigenschaften einer Zeitreihe mit einem MA 2 Modell. Für das MA 2 Modell sind die theoretischen Eigenschaften die folgenden. Hinweis, dass die einzigen Werte ungleich Null in der theoretischen ACF sind für Lags 1 Und 2 Autokorrelationen für höhere Verzögerungen sind 0 Also, ein Beispiel ACF mit signifikanten Autokorrelationen bei Verzögerungen 1 und 2, aber nicht signifikante Autokorrelationen für höhere Verzögerungen zeigt ein mögliches MA 2 - Modell an. N 0,1 Die Koeffizienten sind 1 0 5 und 2 0 3 Da es sich hierbei um einen MA 2 handelt, wird der theoretische ACF nur ungleich Null-Werte nur bei den Verzögerungen 1 und 2 haben. Die Werte der beiden Nicht-Null-Autokorrelationen sind. Ein Diagramm der theoretischen ACF folgt. Wenn fast immer der Fall ist, wurden die Beispieldaten gewonnen Verhalten sich ganz so perfekt wie die Theorie Wir simulierten n 150 Sample-Werte für das Modell xt 10 wt 5 w t-1 3 w t-2 wobei w t. iid N 0,1 Die Zeitreihen-Plot der Daten folgt Wie bei den Zeitreihen Plot für die MA 1 Beispieldaten, können Sie t viel davon erzählen. Das Beispiel ACF für die simulierten Daten folgt Das Muster ist typisch für Situationen, in denen ein MA 2 Modell nützlich sein kann Es gibt zwei statistisch signifikante Spikes bei den Verzögerungen 1 und 2 gefolgt Durch nicht signifikante Werte für andere Lags Beachten Sie, dass aufgrund des Stichprobenfehlers die Stichprobe ACF nicht mit dem theoretischen Muster genau übereinstimmte. ACF für General MA q Modelle. Eigenschaft von MA q-Modelle im Allgemeinen ist, dass es keine Null-Autokorrelationen für die erste gibt Q Verzögerungen und Autokorrelationen 0 für alle Verzögerungen q. Non-Eindeutigkeit der Verbindung zwischen Werten von 1 und Rho1 in MA 1 Modell. Im MA 1 Modell gibt für jeden Wert von 1 der reziproke 1 1 den gleichen Wert für ein Beispiel , Benutze 0 5 für 1 und verwende dann 1 0 5 2 für 1 Du bekommst in beiden Fällen rho1 0 4. Um eine theoretische Einschränkung zu erfüllen, die Invertierbarkeit genannt wird, beschränken wir MA 1 - Modelle, Werte mit einem absoluten Wert kleiner als 1 zu haben Gegeben, 1 0 5 wird ein zulässiger Parameterwert sein, wohingegen 1 1 0 5 2 nicht. Unterstützung von MA Modellen ist. Ein MA-Modell soll invertierbar sein, wenn es algebraisch äquivalent zu einer konvergierenden unendlichen Ordnung ist AR-Modell Durch konvergierende, wir Dass die AR-Koeffizienten auf 0 abnehmen, wenn wir uns in der Zeit zurückziehen. Unverträglichkeit ist eine Einschränkung, die in die Zeitreihen-Software programmiert ist, die verwendet wird, um die Koeffizienten von Modellen mit MA-Terminen abzuschätzen. Es ist nicht etwas, das wir in der Datenanalyse überprüfen. Weitere Informationen über die Invertierbarkeitsbeschränkung für MA 1 Modelle ist im Anhang angegeben. Advanced Theory Note Für ein MA q Modell mit einem angegebenen ACF gibt es nur ein invertierbares Modell Die notwendige Bedingung für die Invertierbarkeit ist, dass die Koeffizienten Werte haben, so dass die Gleichung 1- 1 y - - qyq 0 hat Lösungen für y, die außerhalb des Einheitskreises liegen. R Code für die Beispiele In Beispiel 1 haben wir die theoretische ACF des Modells xt 10 wt 7w t-1 aufgetragen und dann n 150 Werte aus diesem Modell simuliert und Aufgetragen die Sample-Zeitreihen und die Probe ACF für die simulierten Daten Die R-Befehle, die verwendet wurden, um das theoretische ACF zu zeichnen, waren. acfma1 ARMAacf ma c 0 7, 10 Verzögerungen von ACF für MA 1 mit theta1 0 7 Verzögerungen 0 10 erzeugt eine Variable namens Lags Das von 0 bis 10 Plot-Verzögerungen reicht, acfma1, xlim c 1,10, ylab r, Typ h, Haupt-ACF für MA 1 mit theta1 0 7 abline h 0 fügt eine horizontale Achse zum Plot hinzu. Der erste Befehl bestimmt die ACF und Speichert es in einem Objekt namens acfma1 unsere Wahl des Namens. Die Plot-Befehl der 3. Befehl Plots Lags gegenüber den ACF-Werte für Lags 1 bis 10 Die ylab Parameter markiert die y-Achse und der Haupt-Parameter setzt einen Titel auf dem Plot. To sehen Die numerischen Werte des ACF verwenden einfach den Befehl acfma1. Die Simulation und Plots wurden mit den folgenden Befehlen durchgeführt. List ma c 0 7 Simuliert n 150 Werte aus MA 1 x xc 10 fügt 10 hinzu, um Mittel zu machen 10 Simulationsvorgaben bedeuten 0 Plot x, Typ b, Haupt Simuliert MA 1 Daten acf x, xlim c 1,10, Haupt-ACF für simuliert Beispieldaten In Beispiel 2 haben wir die theoretische ACF des Modells xt 10 wt 5 w t-1 3 w t-2 aufgetragen und dann n 150 Werte aus diesem Modell simuliert und die Sample-Zeitreihen und die Probe ACF für die simulierten aufgetragen Daten Die verwendeten R-Befehle waren. acfma2 ARMAacf ma c 0 5,0 3, acfma2-Verzögerungen 0 10 Plot-Verzögerungen, acfma2, xlim c 1,10, ylab r, Typ h, Haupt-ACF für MA 2 mit theta1 0 5, theta2 0 3 abline h 0 list ma c 0 5, 0 3 x xc 10 plot x, Typ b, main Simuliert MA 2 Serie acf x, xlim c 1,10, Haupt-ACF für simulierte MA 2 Daten. Appendix Nachweis der Eigenschaften von MA 1 Für interessierte Schüler sind hier Beweise für die theoretischen Eigenschaften des MA 1 Modells. Variante Text xt Text mu wt theta1 w 0 text wt text theta1w sigma 2w theta 21 sigma 2w 1 theta 21 sigma 2w. Wenn h 1, der vorherige ausdruck 1 W 2 Für jeden h 2 ist der vorhergehende Ausdruck 0 Der Grund dafür ist, dass durch die Definition der Unabhängigkeit des wt E wkwj 0 für jedes kj weiter, weil das wt den Mittelwert 0 hat, E wjwj E wj 2 w 2.Für eine Zeitreihe. Geben Sie dieses Ergebnis, um das oben angegebene ACF zu erhalten. Ein invertierbares MA-Modell ist eines, das als ein unendliches Ordnungs-AR-Modell geschrieben werden kann, das so konvergiert, dass die AR-Koeffizienten zu 0 konvergieren, wenn wir uns unendlich zurück bewegen. Wir zeigen die Invertierbarkeit für die MA 1 model. We then substitute relationship 2 for w t-1 in equation 1. 3 zt wt theta1 z - theta1w wt theta1z - theta 2w. At time t-2 equation 2 becomes. We then substitute relationship 4 for w t-2 in equation 3. zt wt theta1 z - theta 21w wt theta1z - theta 21 z - theta1w wt theta1z - theta1 2z theta 31w. If we were to continue infinitely , we would get the infinite order AR model. zt wt theta1 z - theta 21z theta 31z - theta 41z dots. Note however, that if 1 1, the coefficients multiplying the lags of z will increase infinitely in size as we move back in time To prevent this, we need 1 1 This is the condition for an invertible MA 1 model. Infinite Order MA model. In week 3, we ll see that an AR 1 model can be converted to an infinite order MA model. xt - mu wt phi1w phi 21w dots phi k1 w dots sum phi j1w. This summation of past white noise terms is known as the causal representation of an AR 1 In other words, x t is a special type of MA with an infinite number of terms going back in time This is called an infinite order MA or MA A finite order MA is an infinite order AR and any finite order AR is an infinite order MA. Recall in Week 1, we noted that a requirement for a stationary AR 1 is that 1 1 Let s calculate the Var x t using the causal representation. This last step uses a basic fact about geometric series that requires phi1 1 otherwise the series diverges.

No comments:

Post a Comment