Wednesday, 31 May 2017

Moving Average Serielle Korrelation


Ökonometrische TheorieSerielle Korrelation Es gibt Zeiten, vor allem in Zeitreihen-Daten, dass die CLR-Annahme von c o r r (t t 1) 0, epsilon) 0 gebrochen wird. Dies ist in der Ökonometrie als Serienkorrelation oder Autokorrelation bekannt. Dies bedeutet, dass c o r r (t t 1) 0, epsilon) neq 0 ist und es gibt ein Muster über die Fehlerterme. Die Fehlerterme sind dann nicht unabhängig voneinander auf die Beobachtungen verteilt und nicht streng zufällig. Beispiele für Autocorrelation Edit Wenn der Fehlerterm mit dem vorherigen Fehlerterm verknüpft ist, kann er in einer algebraischen Gleichung geschrieben werden. T t 1 u t rho epsilon u wobei der Autokorrelationskoeffizient zwischen den beiden Störungstermen und u der Störungsterm für die Autokorrelation ist. Dies wird als Autoregressiver Prozess bezeichnet. In der Gleichung wird u benötigt, denn obwohl der Fehlerterm weniger zufällig ist, hat er noch einen leichten Zufallseffekt. Serielle Korrelation der N-ten Ordnung Edit Autoregressives Modell Edit Autoregressive Prozess erster Ordnung, AR (1). T t 1 u t rho epsilon u Dies wird als Autoregression erster Ordnung bezeichnet, da der Fehlerausdruck nur abhängig vom vorherigen Fehlerterm ist. N-ter Ordnung Autoregressiver Prozess, AR (n). T 1 t 1 2 t 2 ntnut rho epsilon rho epsilon c Bewegliches Durchschnittsmodell Bearbeiten Die Schreibweise MA (q) bezieht sich auf das gleitende Durchschnittsmodell der Ordnung q: X tti 1 qiti mu varepsilon sum theta varepsilon, wobei die 1 . Q sind die Parameter des Modells, ist die Erwartung von X t (oft angenommen, gleich 0), und die t. T & sub1; Sind wieder, Störungen des weißen Rauschens. Das gleitende Durchschnittsmodell ist im wesentlichen ein endlicher Impulsantwortfilter mit einer zusätzlichen Interpretation, die auf ihn gelegt wird. Autoregressivemovierend-durchschnittliches Modell Bearbeiten Die Notation ARMA (p. Q) bezieht sich auf das Modell mit p autoregressiven Terme und q gleitenden durchschnittlichen Terme. Dieses Modell enthält die AR (p) und MA (q) - Modelle, X t c t i 1 p i X t i i 1 q i t i. Cvarepsilon Summe varphi X sum theta varepsilon., Ursachen der Autokorrelation Bearbeiten K o r r (t 1) 0, epsilon) neq 0 Räumliche Autokorrelation tritt auf, wenn die beiden Fehler speziell und oder geographisch verwandt sind. Im einfacheren Sinne sind sie neben jedem. Beispiele: Die Stadt St. Paul hat eine Spitze des Verbrechens und so sie mieten zusätzliche Polizei. Im folgenden Jahr stellten sie fest, dass die Kriminalitätsrate deutlich zurückging. Erstaunlicherweise, die Stadt Minneapolis, die nicht ihre Polizei eingestellt hat, findet, dass sie eine Erhöhung der Kriminalitätsrate im gleichen Zeitraum. Anmerkung: Diese Art der Autokorrelation tritt über Querschnittsproben auf. InertiaTime to Adjust Dies tritt häufig in Makro-, Zeitreihen-Daten auf. Der US-Zinssatz steigt unerwartet an, so dass die Wechselkurse mit anderen Ländern verbunden sind. Das Erreichen eines neuen Gleichgewichts kann einige Zeit in Anspruch nehmen. Verlängerte Einflüsse Dies ist wieder eine Makro-Zeitreihe, die sich mit wirtschaftlichen Schocks beschäftigt. Es wird nun erwartet, dass der US-Zinssatz zunehmen wird. Die zugehörigen Wechselkurse werden sich langsam bis zur Ankündigung der Federal Reserve anpassen und das Gleichgewicht überschreiten. Data SmoothingManipulation Mit Funktionen, um Daten zu glätten bringt Autokorrelation in die Störung Begriffe Misspecification Eine Regression wird oft Zeichen der Autokorrelation, wenn es weggelassen Variablen. Da die fehlende unabhängige Variable nun im Störungsterm existiert, erhalten wir einen Störungsterm, der wie folgt aussieht: t 2 X 2 ut beta X u wenn die korrekte Spezifikation Y t 0 1 X 1 2 X 2 ut beta beta X beta X u ist Konsequenzen der Autokorrelation Edit Das Hauptproblem bei der Autokorrelation ist, dass es ein Modell besser aussehen lässt, als es tatsächlich ist. Liste der Konsequenzen Bearbeiten Die Koeffizienten sind noch unbestimmt E (t) 0. c o v (X t. U t) 0) 0, cov (X, u) 0 Die wahre Varianz wird durch das Vorhandensein von Autokorrelationen erhöht. Die geschätzte Varianz ist aufgrund der Autokorrelation kleiner (nach unten vorgespannt). Eine Abnahme von s e ()) und eine Erhöhung der t-Statistik führt dazu, dass der Schätzer genauer aussieht, als er tatsächlich ist. R aufgeblasen wird. Alle diese Probleme führen dazu, dass Hypothesentests ungültig werden. Autokorrelation in Daten. 2 Läufe, aber die echte OLS, die wir nie gefunden haben, ist irgendwo in der Mitte. Testen auf Autokorrelation Bearbeiten Obwohl nicht schlüssig, kann man einen Eindruck gewinnen, indem man einen Graphen der abhängigen Variablen gegen den Fehlerterm betrachtet (nämlich ein Reststreudiagramm). Druin-Watson-Test: Angenommen tt 1 ut epsilon rho u Test H (0): 0 (keine Wechselspannung) gegen H (1): gt 0 (eintägiger Test) Teststatistik DW (tt 1) ​​2 2 2 2 - epsilon ) 2-2rho Jeder Wert unter D (L) (in der DW-Tabelle) lehnt die Nullhypothese ab und AC existiert. Jeder Wert zwischen D (L) und D (W) lässt uns keinen Abschluss von AC. Jeder Wert größer als D (W) akzeptiert die Nullhypothese und AC existiert nicht. Anmerkung, dieses ist ein Endtest. Um den anderen Schwanz zu bekommen. Verwenden Sie stattdessen 4 - DW als Teststatus. Autoregressiver integrierter Moving Average ARIMA (p, d, q) Modelle für die Zeitreihenanalyse Im vorherigen Artikelsatz (Teile 1. 2 und 3) P), MA (q) und ARMA (p, q) lineare Zeitreihenmodelle. Wir verwendeten diese Modelle zur Generierung von simulierten Datensätzen, angepassten Modellen, um Parameter zurückzugewinnen und diese Modelle dann auf Finanzaktiendaten anzuwenden. In diesem Artikel werden wir eine Erweiterung des ARMA-Modells diskutieren, nämlich das Modell Autoregressive Integrated Moving Average oder das Modell ARIMA (p, d, q). Wir werden sehen, dass es notwendig ist, das ARIMA-Modell zu betrachten, wenn wir nichtstationäre Serien haben. Solche Reihen treten in der Gegenwart von stochastischen Trends auf. Quick Recap und die nächsten Schritte Bisher haben wir die folgenden Modelle betrachtet (die Links führen zu den entsprechenden Artikeln): Wir haben unser Verständnis von Zeitreihen mit Konzepten wie Serienkorrelation, Stationarität, Linearität, Residuen, Korrektrammen, Simulation, Montage, Saisonalität, bedingte Heterosedastizität und Hypothesentests. Bis jetzt haben wir keine Vorhersage oder Prognose aus unseren Modellen durchgeführt und daher keinen Mechanismus zur Herstellung eines Handelssystems oder einer Eigenkapitalkurve gehabt. Sobald wir ARIMA (in diesem Artikel), ARCH und GARCH (in den nächsten Artikeln) studiert haben, sind wir in der Lage, eine grundlegende langfristige Handelsstrategie auf der Grundlage der Vorhersage der Aktienindexrenditen aufzubauen. Trotz der Tatsache, dass ich in viele Details über Modelle, die wir kennen wird letztlich nicht über eine große Leistung (AR, MA, ARMA) gegangen sind, sind wir nun gut versiert in den Prozess der Zeitreihen-Modellierung. Dies bedeutet, dass wir, wenn wir neuere Modelle (und sogar solche, die derzeit in der Forschungsliteratur studieren), über eine wichtige Wissensbasis verfügen, um diese Modelle effektiv zu bewerten, anstatt sie als Schlüssel zu behandeln Verschreibung oder Black Box. Noch wichtiger ist, wird es uns mit dem Vertrauen, zu verlängern und zu modifizieren sie auf unsere eigenen und verstehen, was wir tun, wenn wir es tun Id wie vielen Dank für Ihre Geduld so weit, wie es scheint, dass diese Artikel weit entfernt sind Die eigentliche Handlung des tatsächlichen Handels. Allerdings echte quantitative Handelsforschung ist vorsichtig, gemessen und nimmt erhebliche Zeit, um richtig zu bekommen. Es gibt keine schnelle Lösung oder reiches Schema in quant trading. Wir waren fast bereit, unser erstes Handelsmodell zu betrachten, das eine Mischung aus ARIMA und GARCH sein wird. Daher ist es zwingend notwendig, dass wir einige Zeit damit verbringen, das ARIMA-Modell gut zu verstehen. Sobald wir unser erstes Handelsmodell aufgebaut haben, werden wir mehr berücksichtigen Fortgeschrittene Modelle wie Langzeitgedächtnisprozesse, State-Space-Modelle (dh der Kalman-Filter) und Vector Autoregressive (VAR) Modelle, die uns zu anderen, anspruchsvolleren Handelsstrategien führen werden. Autoregressive Integrated Moving Average (ARIMA) Modelle der Ordnung p, d, q ARIMA-Modelle werden verwendet, da sie eine nicht stationäre Serie auf eine stationäre Serie reduzieren können, indem sie eine Folge von differenzierenden Schritten verwenden. Wir können uns an den Artikel über weißes Rauschen und zufällige Wanderungen erinnern, daß wir, wenn wir den Differenzoperator auf eine zufällige Wegserie (eine nicht stationäre Reihe) anwenden, mit weißem Rauschen (einer stationären Reihe) verlassen werden: begin nabla xt xt - x wt Ende führt ARIMA diese Funktion im Wesentlichen aus, tut dies jedoch wiederholt d-mal, um eine nicht-stationäre Serie auf eine stationäre zu reduzieren. Um andere Formen der Nicht-Stationarität über stochastische Trends hinaus zu bewältigen, können zusätzliche Modelle verwendet werden. Saisonale Effekte (wie die, die in den Rohstoffpreisen auftreten) können mit dem saisonalen ARIMA-Modell (SARIMA) angegangen werden, aber wir werden nicht über SARIMA viel in dieser Serie diskutieren. Bedingte heteroscedastische Effekte (wie bei Volatilitäts-Clustern in Aktienindizes) können mit ARCHGARCH angegangen werden. In diesem Artikel werden wir betrachten nicht-stationäre Serie mit stochastischen Trends und passen ARIMA-Modelle zu diesen Serien. Wir werden auch endlich Prognosen für unsere Finanzserie produzieren. Definitionen Vor der Definition von ARIMA-Prozessen müssen wir das Konzept einer integrierten Reihe diskutieren: Integrierte Reihenfolge d Eine Zeitreihe ist in Ordnung d integriert. I (d), wenn: begin nablad xt wt end Das heißt, wenn wir die Serie d mal differenzieren, erhalten wir eine diskrete weiße Rauschenserie. Alternativ, mit dem Backward Shift Operator, ist eine äquivalente Bedingung: Nachdem wir eine integrierte Serie definiert haben, können wir den ARIMA Prozess selbst definieren: Autoregressives Integriertes Moving Average Modell der Ordnung p, d, q Eine Zeitreihe ist ein autoregressives integriertes gleitendes Durchschnittsmodell Der Ordnung p, d, q. ARIMA (p, d, q). Wenn nablad xt ein autoregressiver gleitender Durchschnitt der Ordnung p, q, ARMA (p, q) ist. Das heißt, wenn die Reihe d-mal differenziert wird und dann einem ARMA (p, q) - Prozess folgt, dann handelt es sich um eine ARIMA-Reihe (p, d, q). Wenn wir die Polynomnotation aus Teil 1 und Teil 2 der ARMA-Reihe verwenden, dann kann ein ARIMA (p, d, q) - Prozeß in Form des Rückwärtsverschiebungsoperators geschrieben werden. : Wobei wt eine diskrete weiße Rauschreihe ist. Es gibt einige Punkte, um über diese Definitionen zu beachten. Da der zufällige Weg durch xt x wt gegeben ist, kann man sehen, daß I (1) eine andere Darstellung ist, da nabla1 xt wt. Wenn wir einen nicht-linearen Trend vermuten, könnten wir möglicherweise in der Lage sein, wiederholtes Differenzieren (d. h. d gt & sub1;) zu verwenden, um eine Reihe auf stationäres weißes Rauschen zu reduzieren. In R können wir den diff-Befehl mit zusätzlichen Parametern verwenden, z. B. Diff (x, d3), um wiederholte Differenzen auszuführen. Simulation, Correlogram und Modellbefestigung Da wir bereits den Befehl arima. sim verwendet haben, um einen ARMA (p, q) Prozess zu simulieren, wird das folgende Verfahren ähnlich dem in Teil 3 der ARMA Serie durchgeführt. Der Hauptunterschied ist, dass wir nun d1 setzen, dh, wir werden eine nicht-stationäre Zeitreihe mit einer stochastischen Trending-Komponente erzeugen. Nach wie vor passen wir ein ARIMA-Modell an unsere simulierten Daten an, versuchen, die Parameter wiederherzustellen, Konfidenzintervalle für diese Parameter zu erzeugen, ein Korrelogramm der Residuen des eingebauten Modells zu erstellen und schließlich einen Ljung-Box-Test durchzuführen, um festzustellen, ob wir es haben eine gute Passform. Wir werden ein ARIMA (1,1,1) Modell mit dem autoregressiven Koeffizienten alpha0,6 und dem gleitenden mittleren Koeffizienten beta-0,5 simulieren. Hier ist der R-Code zu simulieren und plotten eine solche Serie: Nun, da wir unsere simulierte Serie werden wir versuchen zu versuchen und passen ein ARIMA (1,1,1) - Modell. Da wir die Reihenfolge kennen, geben wir sie einfach im Fit an: Die Konfidenzintervalle werden berechnet als: Die beiden Parameterschätzungen liegen innerhalb der Konfidenzintervalle und liegen nahe bei den wahren Parameterwerten der simulierten ARIMA-Reihe. Daher sollten wir nicht überrascht sein, die Residuen sehen wie eine Realisierung von diskreten weißen Rauschen zu sehen: Schließlich können wir eine Ljung-Box-Test, um statistische Beweise für eine gute Passform liefern: Wir können sehen, dass der p-Wert ist deutlich größer als 0,05 und als solche können wir sagen, dass es einen starken Beweis für diskrete weiße Rauschen, die eine gute Passung zu den Resten ist. Daher ist das ARIMA (1,1,1) - Modell, wie erwartet, eine gute Passform. Finanzdaten und Prognosen In diesem Abschnitt werden wir ARIMA-Modelle an Amazon, Inc. (AMZN) und den SampP500 US Equity Index (GPSC, in Yahoo Finance) anpassen. Wir verwenden die Prognose-Bibliothek, geschrieben von Rob J Hyndman. Gehen Sie voran und installieren Sie die Bibliothek in R: Jetzt können wir quantmod nutzen, um die tägliche Preisreihe von Amazon ab Anfang 2013 herunterzuladen. Da wir schon die ersten Bestellunterschiede der Serie genommen haben, wird die ARIMA fit in Kürze durchgeführt Benötigen wir für die integrierte Komponente nicht d gt 0: Wie in Teil 3 der ARMA-Reihe werden wir nun die Kombinationen von p, d und q durchlaufen, um das optimale ARIMA (p, d, q) Modell zu finden. Unter optimaler Bedeutung verstehen wir die Ordnungskombination, die das Akaike Information Criterion (AIC) minimiert: Wir können sehen, dass eine Ordnung von p4, d0, q4 ausgewählt wurde. Bemerkenswert ist d0, wie wir bereits oben besprochen haben: Wenn wir das Korrelogramm der Residuen darstellen, können wir nachweisen, ob wir einen Beweis für eine diskrete weiße Rauschenreihe haben: Es gibt zwei signifikante Peaks, nämlich bei k15 und k21, obwohl wir es sollten Erwarten, statistisch signifikante Peaks nur aufgrund der Abtastvariation 5 der Zeit zu sehen. Wir können einen Ljung-Box-Test durchführen (siehe vorherigen Artikel) und sehen, ob wir Beweise für eine gute Passform haben: Wie wir sehen können, ist der p-Wert größer als 0,05 und so haben wir Beweise für eine gute Passform auf der 95-Ebene. Wir können nun den Prognosebefehl aus der Prognosebibliothek verwenden, um 25 Tage vor der Rendite-Serie von Amazon zu prognostizieren: Wir sehen die Punktprognosen für die nächsten 25 Tage mit 95 (dunkelblau) und 99 (hellblau) Fehlerbändern . Wir werden diese Prognosen in unserer ersten Zeitreihenhandelsstrategie verwenden, wenn wir kommen, um ARIMA und GARCH zu kombinieren. Wir können das gleiche Verfahren für den SampP500 durchführen. Zuerst erhalten wir die Daten von quantmod und konvertieren sie in einen täglichen log returns stream: Wir passen ein ARIMA Modell, indem wir die Werte von p, d und q durchlaufen: Die AIC sagt uns, dass das beste Modell die ARIMA (2,0, 1) - Modell. Beachten Sie noch einmal, dass d0, da wir bereits erste Ordnung Differenzen der Serie genommen haben: Wir können die Residuen des eingebauten Modells zu sehen, ob wir Beweise für diskrete weißes Rauschen haben: Das Korrelogram sieht vielversprechend, so dass der nächste Schritt zu laufen ist Die Ljung-Box-Test und bestätigen, dass wir ein gutes Modell passen: Da der p-Wert größer als 0,05 haben wir Beweise für eine gute Modell passen. Warum ist es, dass im vorherigen Artikel unsere Ljung-Box-Test für die SampP500 zeigte, dass die ARMA (3,3) war eine schlechte Passform für die tägliche Log Rückkehr Beachten Sie, dass ich absichtlich beschnitten die SampP500 Daten ab 2013 beginnen in diesem Artikel , Die die volatilen Perioden um 2007-2008 praktisch ausschließt. Daher haben wir einen großen Teil des SampP500 ausgeschlossen, wo wir eine übermäßige Volatilitäts-Clusterbildung hatten. Dies wirkt sich auf die serielle Korrelation der Reihe aus und hat daher die Wirkung, die Serie scheinbar stationärer zu machen als in der Vergangenheit. Dies ist ein sehr wichtiger Punkt. Bei der Analyse von Zeitreihen müssen wir sehr vorsichtig auf bedingt heteroszedierte Serien wie Börsenindizes achten. In quantitativen Finanzen ist der Versuch, Perioden mit unterschiedlicher Volatilität zu bestimmen, oft als Regime-Detektion bekannt. Es ist eine der härteren Aufgaben zu erreichen Nun diskutieren diesen Punkt ausführlich in den nächsten Artikel, wenn wir kommen, um die ARCH und GARCH Modelle zu betrachten. Wir können nun eine Prognose für die nächsten 25 Tage der SampP500-täglichen Log-Rückkehr erstellen: Nachdem wir nun die Möglichkeit haben, Modelle wie ARIMA zu installieren und zu prognostizieren, waren wir sehr nahe daran, Strategieindikatoren für den Handel zu schaffen. Nächste Schritte Im nächsten Artikel werden wir einen Blick auf die Generalized Autoregressive Conditional Heteroscedasticity (GARCH) - Modell und verwenden Sie es zu erklären, mehr der seriellen Korrelation in bestimmten Aktien-und Aktienindex-Serie. Sobald wir GARCH besprochen haben, werden wir in der Lage sein, es mit dem ARIMA-Modell zu kombinieren und Signalindikatoren und damit eine grundlegende quantitative Handelsstrategie zu schaffen. Klicken Sie unten, um mehr darüber zu erfahren. Die Informationen auf dieser Website ist die Meinung der einzelnen Autoren auf der Grundlage ihrer persönlichen Beobachtung, Forschung und jahrelange Erfahrung. Der Herausgeber und seine Autoren sind nicht registrierte Anlageberater, Rechtsanwälte, CPAs oder andere Finanzdienstleister und machen keine Rechts-, Steuer-, Rechnungswesen, Anlageberatung oder andere professionelle Dienstleistungen. Die Informationen, die von dieser Web site angeboten werden, sind nur allgemeine Ausbildung. Weil jeder Einzelne sachliche Situation anders ist, sollte der Leser seinen persönlichen Berater suchen. Weder der Autor noch der Herausgeber übernehmen jegliche Haftung oder Verantwortung für Fehler oder Unterlassungen und haben weder eine Haftung noch Verantwortung gegenüber Personen oder Körperschaften in Bezug auf Schäden, die direkt oder indirekt durch die auf dieser Website enthaltenen Informationen verursacht oder vermutet werden. Benutzung auf eigene Gefahr. Darüber hinaus kann diese Website erhalten finanzielle Entschädigung von den Unternehmen erwähnt durch Werbung, Affiliate-Programme oder auf andere Weise. Preise und Angebote von Inserenten auf dieser Website ändern sich häufig, manchmal ohne Vorankündigung. Während wir uns bemühen, rechtzeitige und genaue Informationen aufrechtzuerhalten, können Angebot Details veraltet sein. Besucher sollten daher die Bedingungen dieser Angebote vor der Teilnahme an ihnen überprüfen. Der Autor und sein Verlag haften nicht für die Aktualisierung von Informationen und haften nicht für die Inhalte, Produkte und Dienstleistungen von Drittanbietern, auch wenn sie über Hyperlinks und Anzeigen auf dieser Website aufgerufen werden. AR-Modell: Ein Autoregression-Modus ist eine Regression der Variablen gegen sich selbst Werte der Prognoservariablen). Ein autoregressives Modell der Ordnung p, AR (p) kann als y t c 1 y t 1 2 y t 2 p y t p e t geschrieben werden. Wobei c eine Konstante ist und e t weißes Rauschen ist. MA-Modell: Im Gegensatz zum AR-Modell verwendet ein gleitendes Durchschnittsmodell vergangene Prognosefehler in einem regressionsähnlichen Modell. Ein gleitendes Durchschnittsmodell der Ordnung q, MA (q) kann als y t c e t 1 e t 1 2 e t 2 q e t q geschrieben werden. Wobei e t weißes Rauschen ist. In beiden Fällen ist der Fehlerbegriff weißes Rauschen. Und aus der obigen Formel können wir deutlich erkennen, wie die Fehlerterme in den beiden Modellen unterschiedlich modelliert werden. In einem AR-Modell sind die verzögerten Werte von y t Prädiktoren. Und der Fehlerterm e t im Modell ist genau wie der Fehlerterm in einer multiplen linearen Regression. In einem MA-Modell sind die vergangenen Prognosefehler Prädiktoren. Eines ist zu bemerken, dass es möglich ist, jedes stationäre AR (p) - Modell als unendliches MA-Modell zu schreiben, und ein (invertierbares) MA (p) kann als unendliches AR geschrieben werden. FYI, finden Sie einige detaillierte Konzept Beschreibungen in www2.sasproceedingssugi28252-28.pdf und die Beziehung zwischen stationären AR-Modell und MA-Modell in otexts. orgfpp84.

No comments:

Post a Comment