Tuesday, 19 September 2017

Arima Gleitender Durchschnitt


Autoregressive Integrated Moving Average - ARIMA. DEFINITION von Autoregressiv Integrated Moving Average - ARIMA. A statistische Analyse-Modell, das Zeitreihen-Daten verwendet, um zukünftige Trends vorherzusagen Es ist eine Form der Regressionsanalyse, die künftige Bewegungen entlang der scheinbar zufälligen Spaziergang durch Aktien vorhersagen will Und der Finanzmarkt durch die Prüfung der Unterschiede zwischen den Werten in der Serie statt der Verwendung der tatsächlichen Datenwerte Lags der differenzierten Serien werden als autoregressiv bezeichnet und Verzögerungen innerhalb der prognostizierten Daten werden als gleitender Durchschnitt bezeichnet. BREAKING DOWN Autoregressive Integrated Moving Average - ARIMA. Dieser Modelltyp wird im Allgemeinen als ARIMA p, d, q bezeichnet, wobei die ganzen Zahlen auf die autoregressiven integrierten und gleitenden mittleren Teile des Datensatzes verweisen, bzw. ARIMA-Modellierung kann Trends, Saisonalzenzyklen, Fehler und nicht-stationär berücksichtigen Aspekte eines Datensatzes bei der Erstellung von Prognosen. Einleitung zu ARIMA Nichtseasonale Modelle. ARIMA p, d, q Vorhersage Gleichung ARIMA Modelle sind in der Theorie die allgemeinste Klasse von Modellen für die Vorhersage einer Zeitreihe, die durch Differenzierung stationär gemacht werden kann Wenn nötig, vielleicht in Verbindung mit nichtlinearen Transformationen wie zB Protokollierung oder Abblendung ggf. Eine zufällige Variable, die eine Zeitreihe ist, ist stationär, wenn ihre statistischen Eigenschaften im Laufe der Zeit konstant sind. Eine stationäre Serie hat keinen Trend, ihre Variationen um ihren Mittelwert haben eine Konstante Amplitude, und es wackelt in einer konsequenten Art und Weise, dh seine kurzfristigen zufälligen Zeitmuster immer gleich aussehen in einem statistischen Sinne Die letztere Bedingung bedeutet, dass seine Autokorrelationen Korrelationen mit ihren eigenen vorherigen Abweichungen vom Mittel konstant über die Zeit oder gleichermaßen, dass Sein Leistungsspektrum bleibt über die Zeit konstant Eine zufällige Variable dieser Form kann wie üblich als eine Kombination von Signal und Rauschen betrachtet werden, und das Signal, wenn man offensichtlich ist, könnte ein Muster der schnellen oder langsamen mittleren Reversion oder sinusförmigen Oszillation oder schnell sein Abwechslung im Zeichen, und es könnte auch eine saisonale Komponente haben Ein ARIMA-Modell kann als ein Filter betrachtet werden, der versucht, das Signal vom Rauschen zu trennen, und das Signal wird dann in die Zukunft extrapoliert, um Prognosen zu erhalten. Die ARIMA-Prognosegleichung für ein Stationäre Zeitreihe ist eine lineare, dh regressionsgleiche Gleichung, bei der die Prädiktoren aus Verzögerungen der abhängigen Variablen und / oder Verzögerungen der Prognosefehler bestehen. Das ist. Begrenzter Wert von Y eine Konstante und / oder eine gewichtete Summe von einem oder mehreren neueren Werten von Y und oder eine gewichtete Summe aus einem oder mehreren neueren Werten der Fehler. Wenn die Prädiktoren nur aus verzögerten Werten von Y bestehen, ist es ein reines autoregressives, selbstregressives Modell, das nur ein Spezialfall eines Regressionsmodells ist und das sein könnte Mit Standard-Regressionssoftware ausgestattet Zum Beispiel ist ein autoregressives AR 1-Modell erster Ordnung für Y ein einfaches Regressionsmodell, bei dem die unabhängige Variable nur Y um eine Periode LAG Y, 1 in Statgraphics oder YLAG1 in RegressIt liegt. Wenn einige der Prädiktoren sind Sind Verzögerungen der Fehler, ein ARIMA-Modell ist es kein lineares Regressionsmodell, denn es gibt keine Möglichkeit, den letzten Periodenfehler als eigenständige Variable anzugeben, die Fehler müssen bei der Periode auf Periodenbasis berechnet werden, wenn das Modell eingebaut ist Zu den Daten Aus technischer Sicht ist das Problem bei der Verwendung von verzögerten Fehlern als Prädiktoren, dass die Vorhersagen des Modells keine linearen Funktionen der Koeffizienten sind, obwohl sie lineare Funktionen der vergangenen Daten sind. Daher müssen Koeffizienten in ARIMA-Modellen, die verzögerte Fehler enthalten, Durch nichtlineare Optimierungsmethoden geschätzt werden, anstatt durch einfaches Lösen eines Gleichungssystems. Das Akronym ARIMA steht für Auto-Regressive Integrated Moving Average Lags der stationären Serie in der Prognose-Gleichung heißen autoregressive Begriffe, Verzögerungen der Prognosefehler sind Genannt gleitende durchschnittliche Ausdrücke, und eine Zeitreihe, die differenziert werden muss, um stationär zu sein, soll eine integrierte Version einer stationären Serie sein. Random-Walk - und Random-Trend-Modelle, autoregressive Modelle und exponentielle Glättungsmodelle sind alle Sonderfälle von ARIMA-Modelle. Ein nicht-seasonal ARIMA-Modell ist als ARIMA p, d, q-Modell klassifiziert, wobei. p die Anzahl der autoregressiven Begriffe ist. d ist die Anzahl der Nicht-Sektionsunterschiede, die für die Stationarität benötigt werden, und. q ist die Anzahl der verzögerten Prognosefehler In der Vorhersage Gleichung. Die Prognose Gleichung ist wie folgt aufgebaut Erstens, y bezeichnen die d th Differenz von Y, was bedeutet. Hinweis, dass die zweite Differenz von Y der d 2 Fall ist nicht der Unterschied von 2 Perioden vor Vielmehr ist es die First-different-of-the-first-Differenz, die das diskrete Analog einer zweiten Ableitung ist, dh die lokale Beschleunigung der Serie und nicht deren lokaler Trend. In Bezug auf y ist die allgemeine Prognosegleichung. Hier sind die gleitenden Durchschnittsparameter s So dass ihre Zeichen in der Gleichung negativ sind, nach der Konvention, die von Box und Jenkins eingeführt wird. Einige Autoren und Software einschließlich der Programmiersprache R definieren sie so, dass sie Pluszeichen haben. Wenn die tatsächlichen Zahlen in die Gleichung gesteckt werden, gibt es keine Unklarheit , Aber es ist wichtig zu wissen, welche Konvention Ihre Software verwendet, wenn Sie die Ausgabe lesen Oft werden die Parameter dort mit AR 1, AR 2, und MA 1, MA 2 usw. bezeichnet. Um das passende ARIMA-Modell für Y zu identifizieren Beginnen mit der Bestimmung der Reihenfolge der Differenzierung d Notwendigkeit, die Serie zu stationieren und entfernen Sie die groben Merkmale der Saisonalität, vielleicht in Verbindung mit einer Varianz-stabilisierende Transformation wie Protokollierung oder Abblendung Wenn Sie an diesem Punkt zu stoppen und vorherzusagen, dass die differenzierte Serie konstant ist, Sie haben nur einen zufälligen Spaziergang oder ein zufälliges Trendmodell platziert. Allerdings können die stationärisierten Serien noch autokorrelierte Fehler haben, was darauf hindeutet, dass in der Prognosegleichung auch eine Anzahl von AR-Terme p 1 und oder einige Anzahl MA-Terme q 1 benötigt werden Die Bestimmung der Werte von p, d und q, die am besten für eine gegebene Zeitreihe sind, werden in späteren Abschnitten der Noten, deren Links oben auf dieser Seite sind, aber eine Vorschau auf einige der Arten von nicht-seasonalen ARIMA-Modellen, die Sind häufig angetroffen wird unten gegeben. ARIMA 1,0,0 Autoregressives Modell erster Ordnung, wenn die Serie stationär und autokorreliert ist, vielleicht kann es als ein Vielfaches ihres eigenen vorherigen Wertes vorausgesagt werden, plus eine Konstante Die Prognosegleichung ist in diesem Fall Das ist Y, das auf sich selbst zurückgeht, ist von einer Periode zurückgegangen. Dies ist ein konstantes ARIMA 1,0,0-Modell Wenn der Mittelwert von Y Null ist, dann wäre der konstante Term nicht enthalten. Wenn der Steigungskoeffizient 1 positiv und kleiner als 1 ist In der Größenordnung muss es kleiner als 1 in der Größe sein, wenn Y stationär ist, beschreibt das Modell das Mittelwert-Rückverfolgungsverhalten, bei dem der nächste Perioden-s-Wert vorausgesagt werden sollte, um 1 mal so weit weg von dem Mittelwert zu sein, wie dieser Periodenwert If 1 negativ ist , Es prognostiziert Mittel-Rückkehr-Verhalten mit Wechsel von Zeichen, dh es prognostiziert auch, dass Y wird unterhalb der mittleren nächsten Periode, wenn es über dem Mittelwert dieser Periode ist. In einem zweiten Ordnung autoregressive Modell ARIMA 2,0,0 würde es Auch ein Y-t-2-Term auf der rechten Seite und so weiter Abhängig von den Zeichen und Größen der Koeffizienten könnte ein ARIMA 2.0,0 Modell ein System beschreiben, dessen mittlere Reversion in einer sinusförmig oszillierenden Weise stattfindet Die Bewegung einer Masse auf einer Feder, die zufälligen Schocks ausgesetzt ist. ARIMA 0,1,0 zufälliger Spaziergang Wenn die Serie Y nicht stationär ist, ist das einfachste Modell für sie ein zufälliges Wandermodell, das als Begrenzung betrachtet werden kann Fall eines AR 1 - Modells, bei dem der autoregressive Koeffizient gleich 1 ist, dh eine Reihe mit unendlich langsamer mittlerer Reversion Die Vorhersagegleichung für dieses Modell kann geschrieben werden, wo der konstante Term die durchschnittliche Periodenänderung ist, dh die lange - die Drift in Y Dieses Modell könnte als ein Nicht-Intercept-Regressionsmodell eingebaut werden, bei dem die erste Differenz von Y die abhängige Variable ist. Da es nur eine nicht-seasonale Differenz und einen konstanten Term enthält, wird sie als ARIMA 0,1, 0-Modell mit Konstante Das random-walk-ohne - Drift-Modell wäre ein ARIMA 0,1,0 Modell ohne constant. ARIMA 1,1,0 differenzierte Autoregressive Modell erster Ordnung Wenn die Fehler eines zufälligen Walk-Modells autokorreliert sind, vielleicht Kann das Problem durch Hinzufügen einer Verzögerung der abhängigen Variablen zu der Vorhersagegleichung behoben werden - dh durch Umschalten der ersten Differenz von Y auf sich selbst verzögert um eine Periode Dies würde die folgende Vorhersagegleichung ergeben, die umgeordnet werden kann. Dies ist ein Erstklassiges autoregressives Modell mit einer Reihenfolge der Nichtseason-Differenzierung und einem konstanten Term - dh ein ARIMA 1,1,0 Modell. ARIMA 0,1,1 ohne konstante, einfache exponentielle Glättung Eine weitere Strategie zur Korrektur autokorrelierter Fehler in einem zufälligen Walk-Modell ist Vorgeschlagen durch das einfache exponentielle Glättungsmodell Erinnern Sie sich, dass für einige nichtstationäre Zeitreihen, z. B. solche, die geräuschvolle Schwankungen um ein langsam variierendes Mittel aufweisen, das zufällige Spaziergangmodell nicht so gut wie ein gleitender Durchschnitt der vergangenen Werte ausführt. Mit anderen Worten, anstatt zu nehmen Die jüngste Beobachtung als Prognose der nächsten Beobachtung, ist es besser, einen Durchschnitt der letzten Beobachtungen zu verwenden, um das Rauschen herauszufiltern und den lokalen Mittel genauer zu schätzen. Das einfache exponentielle Glättungsmodell verwendet einen exponentiell gewichteten gleitenden Durchschnitt von Vergangene Werte, um diesen Effekt zu erzielen Die Vorhersagegleichung für das einfache exponentielle Glättungsmodell kann in einer Anzahl von mathematisch äquivalenten Formen geschrieben werden, von denen eine die sogenannte Fehlerkorrekturform ist, in der die vorherige Prognose in Richtung des Fehlers eingestellt wird Es ist gemacht. Wenn e t-1 Y t-1 - t-1 per Definition, kann dies umgeschrieben werden, wie ist eine ARIMA 0,1,1 - without-konstante Prognose Gleichung mit 1 1 - Dies bedeutet, dass Sie passen können Eine einfache exponentielle Glättung, indem man sie als ARIMA-0,1,1-Modell ohne Konstante spezifiziert und der geschätzte MA 1 - Koeffizient entspricht 1-minus-alpha in der SES-Formel. Erinnern Sie sich, dass im SES-Modell das Durchschnittsalter der Daten in Die 1-Perioden-Prognosen sind 1 bedeutet, dass sie dazu neigen, hinter Trends oder Wendepunkten um etwa 1 Perioden zu verzichten. Daraus folgt, dass das Durchschnittsalter der Daten in den 1-Periodenprognosen einer ARIMA 0,1,1 - without-konstantes Modell ist 1 1 - 1 Also, wenn 1 0 8, das Durchschnittsalter ist 5 As 1 nähert sich 1, wird das ARIMA 0,1,1 - without-konstantes Modell eine sehr langfristige Bewegung Durchschnitt, und als 1 nähert sich 0 wird es zu einem zufälligen Walk-ohne-Drift-Modell. Was ist der beste Weg, um Autokorrelation zu korrigieren Hinzufügen von AR-Terme oder Hinzufügen von MA-Terme In den beiden vorangegangenen Modellen, die oben diskutiert wurden, ist das Problem der autokorrelierten Fehler in einem Das zufällige Spaziergangmodell wurde auf zwei verschiedene Arten fixiert, indem ein verzögerter Wert der differenzierten Reihe der Gleichung hinzugefügt wurde oder ein verzögerter Wert des Prognosefehlers hinzugefügt wurde. Welcher Ansatz ist am besten eine Faustregel für diese Situation, die in mehr diskutiert wird Detail später ist, dass die positive Autokorrelation in der Regel am besten durch Hinzufügen eines AR-Begriffs an das Modell behandelt wird und negative Autokorrelation ist in der Regel am besten durch Hinzufügen eines MA-Begriffs In der Wirtschaft und wirtschaftliche Zeitreihen, negative Autokorrelation oft als ein Artefakt der Differenzierung Im Allgemeinen , Differenziert die positive Autokorrelation und kann sogar einen Wechsel von positiver zu negativer Autokorrelation verursachen. So wird das ARIMA-0,1,1-Modell, bei dem die Differenzierung mit einem MA-Term begleitet wird, häufiger als ein ARIMA 1,1,0-Modell verwendet. ARIMA 0,1,1 mit konstanter einfacher exponentieller Glättung mit Wachstum Durch die Implementierung des SES-Modells als ARIMA-Modell erhalten Sie tatsächlich eine gewisse Flexibilität. Zunächst einmal ist der geschätzte MA 1 - Koeffizient negativ, dies entspricht einem Glättungsfaktor größer Als 1 in einem SES-Modell, das in der Regel nicht von der SES-Modell-Anpassungs-Prozedur erlaubt ist Zweitens haben Sie die Möglichkeit, einen konstanten Begriff in das ARIMA-Modell einzubeziehen, wenn Sie es wünschen, um einen durchschnittlichen Nicht-Null-Trend zu schätzen Die ARIMA 0,1,1 Modell mit Konstante hat die Vorhersage Gleichung. Die Ein-Periode-voraus Prognosen aus diesem Modell sind qualitativ ähnlich denen der SES-Modell, mit der Ausnahme, dass die Trajektorie der langfristigen Prognosen ist in der Regel eine abfallende Linie, deren Steigung Ist gleich mu anstatt einer horizontalen Linie. ARIMA 0,2,1 oder 0,2,2 ohne konstante lineare exponentielle Glättung Lineare exponentielle Glättungsmodelle sind ARIMA-Modelle, die zwei Nichtseasonale Unterschiede in Verbindung mit MA-Terme verwenden Der zweite Unterschied einer Serie Y ist nicht einfach die Differenz zwischen Y und selbst, die von zwei Perioden verzögert ist, sondern vielmehr die erste Differenz der ersten Differenz - die Änderung der Veränderung von Y in der Periode t. Also die zweite Differenz von Y an Die Periode t ist gleich Y t - Y t-1 - Y t-1 - Y t-2 Y t - 2Y t-1 Y t-2 Eine zweite Differenz einer diskreten Funktion ist analog zu einer zweiten Ableitung einer stetigen Funktion Es misst die Beschleunigung oder Krümmung in der Funktion zu einem gegebenen Zeitpunkt. Das ARIMA 0,2,2 Modell ohne Konstante prognostiziert, dass die zweite Differenz der Serie gleich einer linearen Funktion der letzten beiden Prognosefehler ist, die als neu arrangiert werden können Wo 1 und 2 die MA 1 - und MA 2 - Koeffizienten sind Dies ist ein allgemeines lineares exponentielles Glättungsmodell, das im Wesentlichen das gleiche wie das Holt-Modell ist, und das Brown-Modell ist ein Spezialfall. Es verwendet exponentiell gewichtete Bewegungsdurchschnitte, um sowohl eine lokale Ebene als auch zu schätzen Ein lokaler Trend in der Serie Die Langzeitprognosen aus diesem Modell konvergieren zu einer Geraden, deren Steigung von der durchschnittlichen Tendenz abhängt, die gegen Ende der Serie beobachtet wird. ARIMA 1,1,2 ohne konstante gedämpfte Trendlineare exponentielle Glättung Modell wird in den begleitenden Folien auf ARIMA-Modellen illustriert Es extrapoliert den lokalen Trend am Ende der Serie, sondern flacht es bei längeren Prognosehorizonten, um eine Notiz des Konservatismus einzuführen, eine Praxis, die empirische Unterstützung hat. Sehen Sie den Artikel auf Warum der gedämpfte Trend Werke von Gardner und McKenzie und der Golden Rule Artikel von Armstrong et al für Details. Es ist in der Regel ratsam, an Modellen, in denen mindestens eines von p und q ist nicht größer als 1, dh nicht versuchen, ein Modell wie zu passen ARIMA 2,1,2, da dies wahrscheinlich zu überfälligen und gängigen Faktor-Problemen führen wird, die in den Anmerkungen zur mathematischen Struktur von ARIMA-Modellen näher erörtert werden. Die Vorlagen-Implementierung ARIMA-Modelle wie die oben beschriebenen sind einfach zu implementieren Auf einer Tabellenkalkulation Die Vorhersagegleichung ist einfach eine lineare Gleichung, die sich auf vergangene Werte der ursprünglichen Zeitreihen und vergangene Werte der Fehler bezieht. So können Sie eine ARIMA-Prognosekalkulationstabelle einrichten, indem sie die Daten in Spalte A, die Prognosemethode in Spalte B, speichert Und die Fehlerdaten minus Prognosen in Spalte C Die Prognoseformel in einer typischen Zelle in Spalte B wäre einfach ein linearer Ausdruck, der sich auf Werte in vorhergehenden Zeilen der Spalten A und C bezieht, multipliziert mit den entsprechenden AR - oder MA-Koeffizienten, die in anderen Zellen gespeichert sind Auf der Kalkulationstabelle.8 4 Verschieben von durchschnittlichen Modellen. Als vergangene Werte der Prognosevariablen in einer Regression verwenden, verwendet ein gleitendes Durchschnittsmodell vergangene Prognosefehler in einem regressionsähnlichen Modell. Yc et theta e theta e dots theta e. where et ist weißes Rauschen Wir verweisen darauf als MA q Modell Natürlich beobachten wir nicht die Werte von et, also ist es nicht wirklich Regression im üblichen Sinne. Notice that each Wert von yt kann als ein gewichteter gleitender Durchschnitt der letzten Prognosefehler gedacht werden. Allerdings sollten die gleitenden durchschnittlichen Modelle nicht mit der gleitenden durchschnittlichen Glättung verwechselt werden, die wir in Kapitel 6 besprochen haben. Ein gleitendes Durchschnittsmodell wird für die Prognose zukünftiger Werte beim gleitenden durchschnittlichen Glättung verwendet Wird zur Schätzung des Trendzyklus vergangener Werte verwendet. Abbildung 8 6 Zwei Beispiele für Daten aus bewegten Mittelmodellen mit unterschiedlichen Parametern Linke MA 1 mit yt 20 et 0 8e t-1 Rechts MA 2 mit ytet - e t-1 0 8e T-2 In beiden Fällen ist et normal normales Rauschen mit mittlerem Nullpunkt und Varianz eins. Abbildung 8 6 zeigt einige Daten aus einem MA 1 Modell und einem MA 2 Modell Ändern der Parameter theta1, Punkte, Thetaq führt zu unterschiedlichen Zeitreihenmustern Wie bei autoregressiven Modellen ändert die Varianz des Fehlerterms nur den Maßstab der Serie, nicht die Muster. Es ist möglich, jedes stationäre AR-Modell als MA-Inft-Modell zu schreiben. Beispielsweise können wir mit wiederholter Substitution nachweisen Dies für ein AR 1 Modell. Beginn des Phi1y et phi1 phi1y e et phi1 2y phi1 e et phi1 3y phi1 2e phi1 e et text end. Provided -1 phi1 1, wird der Wert von phi1 k kleiner, wenn k größer wird. Yt et phi1 e phi1 2 e phi1 3 e cdots. an MA infty Prozess. Das umgekehrte Ergebnis gilt, wenn wir einige Einschränkungen auf die MA-Parameter auferlegen. Dann wird das MA-Modell als invertierbar bezeichnet. Das heißt, dass wir einen invertierbaren MA q - Prozeß schreiben können Ein AR-Infty-Prozess. Unvertible Modelle sind nicht einfach, um es uns zu ermöglichen, von MA-Modellen in AR-Modelle umzuwandeln. Sie haben auch einige mathematische Eigenschaften, die sie in der Praxis einfacher zu bedienen machen. Die Invertierbarkeitsbeschränkungen sind ähnlich wie die Stationaritätsbeschränkungen. Für eine MA 1 Modell -1 theta1 1.Für ein MA 2 Modell -1 theta2 1, theta2 theta1 -1, theta1 - theta2 1.Mehr komplizierte Bedingungen gelten für q ge3 Wiederum wird R diese Einschränkungen bei der Schätzung der Modelle berücksichtigen.

No comments:

Post a Comment