Wednesday 27 December 2017

Moving average zeitreihenanalyse


Como calcular as médias móveis no Excel Excel Data Analysis For Dummies, 2ª edição O comando Data Analysis fornece uma ferramenta para calcular as médias movimentadas e suavizadas exponencialmente no Excel. Suponha, por causa da ilustração, que você coletou informações diárias de temperatura coletadas. Você deseja calcular a média móvel de três dias 8212 a média dos últimos três dias 8212 como parte de algumas previsões meteorológicas simples. Para calcular as médias móveis para este conjunto de dados, siga as etapas a seguir. Para calcular uma média móvel, primeiro clique no botão de comando Análise de Dados tab8217s Dados. Quando o Excel exibe a caixa de diálogo Análise de dados, selecione o item Média móvel da lista e clique em OK. O Excel exibe a caixa de diálogo Mover média. Identifique os dados que deseja usar para calcular a média móvel. Clique na caixa de texto Intervalo de entrada da caixa de diálogo Média móvel. Em seguida, identifique o intervalo de entrada, digitando um endereço de faixa de planilha ou usando o mouse para selecionar o intervalo da planilha. Sua referência de intervalo deve usar endereços de células absolutos. Um endereço de célula absoluto precede a letra da coluna e o número da linha com sinais, como em A1: A10. Se a primeira célula do seu intervalo de entrada incluir um rótulo de texto para identificar ou descrever seus dados, marque a caixa de seleção Etiquetas em primeira fila. Na caixa de texto Intervalo, diga ao Excel quantos valores incluir no cálculo da média móvel. Você pode calcular uma média móvel usando qualquer número de valores. Por padrão, o Excel usa os três valores mais recentes para calcular a média móvel. Para especificar que algum outro número de valores seja usado para calcular a média móvel, insira esse valor na caixa de texto Intervalo. Diga ao Excel onde colocar os dados médios móveis. Use a caixa de texto do intervalo de saída para identificar o intervalo da planilha na qual deseja colocar os dados médios móveis. No exemplo da planilha, os dados médios móveis foram colocados no intervalo da planilha B2: B10. (Opcional) Especifique se deseja um gráfico. Se você deseja um gráfico que traça a informação da média móvel, selecione a caixa de seleção Classificação do gráfico. (Opcional) Indique se deseja obter informações de erro padrão. Se você quiser calcular erros padrão para os dados, selecione a caixa de seleção Erros padrão. O Excel coloca valores de erro padrão ao lado dos valores médios móveis. (As informações de erro padrão entram em C2: C10.) Depois de terminar de especificar qual a média móvel que você deseja calcular e onde deseja que ela seja colocada, clique em OK. O Excel calcula informações de média móvel. Nota: Se o Excel não possuir informações suficientes para calcular uma média móvel de um erro padrão, ele coloca a mensagem de erro na célula. Você pode ver várias células que mostram essa mensagem de erro como um valor. Média móvel - MA BREAKING DOWN Média móvel - MA Como exemplo de SMA, considere uma segurança com os seguintes preços de fechamento em 15 dias: Semana 1 (5 dias) 20, 22 24, 25, 23 semanas 2 (5 dias) 26, 28, 26, 29, 27 semanas 3 (5 dias) 28, 30, 27, 29, 28 Um MA de 10 dias seria a média dos preços de fechamento para o primeiro 10 dias como o primeiro ponto de dados. O próximo ponto de dados eliminaria o preço mais antigo, adicionaria o preço no dia 11 e levaria a média, e assim por diante, como mostrado abaixo. Conforme observado anteriormente, as MAs desaceleram a ação de preço atual porque são baseadas em preços passados ​​quanto mais o período de tempo para o MA, maior o atraso. Assim, um MA de 200 dias terá um grau de atraso muito maior do que um MA de 20 dias porque contém preços nos últimos 200 dias. O comprimento do MA a ser usado depende dos objetivos de negociação, com MAs mais curtos usados ​​para negociação de curto prazo e MA mais longo prazo mais adequados para investidores de longo prazo. O MA de 200 dias é amplamente seguido por investidores e comerciantes, com pausas acima e abaixo dessa média móvel considerada como sinais comerciais importantes. Os MAs também oferecem sinais comerciais importantes por conta própria, ou quando duas médias atravessam. Um MA ascendente indica que a segurança está em uma tendência de alta. Enquanto um MA decrescente indica que está em uma tendência de baixa. Da mesma forma, o momento ascendente é confirmado com um cruzamento de alta. Que ocorre quando um mes de curto prazo cruza acima de um MA de longo prazo. O impulso descendente é confirmado com um cruzamento de baixa, que ocorre quando um MA de curto prazo cruza abaixo de um termo MA. Zeitreihenanalyse mais longo e mais longo de prazo. Daten und extrapoliert in die Zukunft. Das Hufigste Modell dafr ist das MODELO ARIMA, Módulo Médico Motivo Integrado AutoRegressivo. Módulo Médio de Mudança Integrada AutoRegressiva. Dieses Modell dient zur Beschreibung von Datenreihen in der Zeitreihenanalyse und ist so allgemein, dass es mehrere unter anderem Namen bekannte Methoden als Spezialflle enthlt. Das hier vorgestellte Modell ist additiv, das heisst, die einzelnen Komponenten addieren sich zum Gesamtergebnis. Im Gegensatz dazu steht das Multiplikative Modell. Aufgrund der Komplexitt dieses Modells und der zahlreichen Varianten und Erweiterungsmglichkeiten kann hier nur das Grundgerst auf anschaulicher Ebene wiedergegeben werden. Fr konkrete Berechnungen rt der Verfasser unbedingt zu einschlgiger Literatur und Software. Die hier dargestellten Rechenwege sind derart, dass sie im Kopf nachvollzogen werden knnen sie fhren aber mit grosser Wahrscheinlichkeit nicht zu den optimal erzielbaren ARIMA Modellen. Ziel der aus den 3 Parametern p, d, q bestehenden Methode ARIMA (p, d, q) ist es: Die vorliegende Messreihe vollstndig zu beschreiben Dies ist nach dem Theorem von Wold fr alle stationren Zeitreihen mglich. Zuknftige Werte der Zeitreihe vorherzusagen. Dies funktioniert deshalb, weil der jeweils aktuelle Wert mittels Kombination von Einflssen vorangehender Werte beschrieben wird. Es handelt sich hier um eine mathematische Zerlegungsmethode. Vom Grundgerst its ist das vergleichbar beispielsweise mit Taylorreihen (Darstellung einer beliebigen Funktion mit einem Polynom) Fourierreihen (Darstellung einer beliebigen Funktion mit Sinus oder Cosinusfunktionen) p: siehe Schritt 2, d: siehe Schritt 1, q: siehe Schritt 3ARIMA arbeitet mit 2 Komponenten Einer gewichteten Summe aus zurckliegenden Messwerten (AR, AutoRegressive, Schritt2) einer gewichteten Summe aus zurckliegenden Zufallseinfluessen (MA, Moving Average, Schritt 3). Diese beiden Komponenten ergeben strenggenommen nur ein ARMA Modell (ohne I, Schritt 1). Der Buchstabe I (Integrated) symbolisiert die Sicherstellung der Nahezu alle statistischen Verfahren verlangen stationre, também sich nicht ndernde Randedingungen. Im Falle von Zeitreihen bedeutet Stationaritt, dass die zugrundegelegte Verteilungsfunktion der Messwerte zeitlich konstant ist. Die Nicht-Erfllung dieser Voraussetzung sei anhand folgender Beispiele veranschaulicht: Hier nimmt offensichtlich der Mittelwert mit der Zeit zu Zeitreihen mit (nicht nur linearem) Trend knnen mit dem ARIMA Modell unter Umstnden erfolgreich beschrieben werden. Hier nimmt offensichtlich die Varianz mit der Zeit zu Zeitreihen mit vernderlicher Varianz und vernderlicher Hherer Momente knnen mit der ARIMA Methode nicht beschrieben werden. Eine stationre Zeitreihe besteht também aus Werten, die entsprechend der zugrundegelegten Verteilungsfunktion um einen zeitlich konstanten Mittelwert streuen. Interessant ist hier, dass die einzelnen Werte - obwohl aus einer konstant bleibenden Verteilungsfunktion stammend - nicht voneinander unabhngig zu sein brauchen. Em solchen Fllen macht die Vorhersage zuknftiger Werte sogar erst richtig Sinn. Dies knnte ein Zufallsrauschen sein, dem ein langwelliges Schwingungsgemisch berlagert ist. Die Funktionsweise des ARIMA Modells soll im Folgenden schrittweise erarbeitet werden. Anmerkung: Es wird davon ausgegangen, dass saisonale Effekte bereits herausgerechnet worden sind. Die Bercksichtigung saisonaler Effekte gehrt eigentlich nicht zum ARIMA Modell. Schritt 1. Herstellung von Stationaritt: Trendbeseitigung Besitzt die zu untersuchende Zeitreihe einen Trend. Dann Muss Dieser também zuerst beseitigt werden. Da man zur Vorhersage von Messwerten immer die Originalreihe vor Augen haben muss, ist es ratsam, zur Erreichung von Stationaritt mglichst einfache mathematische Operationen zu verwenden, die manicht wieder rckgngig machen kann. Hat der Trend die Form eines Polynoms n-ter Ordnung: dann lsst er sich einfach durch n-faches Differenzieren beseitigen Aus Sicht des ARIMA Modells ist die Originalmessere o folclich integriert (Integrado). Nach 2facher Differenzierung (Abziehen jeweils benachbarter Werte) einer Reihe mit offenbar quadratischem Trend erhlt man eine Reihe, die offenbar keinen Trend mehr enthlt. (Rauschen wurde der bersicht halber weggelassen) Saisonale Schwankungen (Periodizitt) e a nossa Weitere Verletzung von Stationaritt. Sie lassen sich dadurch beseitigen, indem man im ersten Differezierungsschritt nicht jeweils benachbarte Werte voneinander abzieht, sondern zB. Den 6. vom 1. den 7. vom 2. den 8. vom 3. usw. (Em diesem Beispiel besteht die Periodendauer aus 5 Messwerten) Anschliessend kann - falls notwendig - wieder normal, também zwischen jeweils benachbarten Werten differenziert werden. Saisonale Schwankungen lassen sich aber auch durch die autoregressive Komponente (AR) beschreiben, welche im nchsten Schritt beschrieben wird. Waren im konkreten Fall beispielsweise 2 Differenzierungen zur Erreichung von Stationaritt notwendig, dann muss man zur Vorhersage bezglich der Originalreihe erst wieder 2 mal integrieren. Formal wird dieser Fall als ARIMA (p, d, q) mit d2, também ARIMA (p, 2, q) bezeichnet. Schritt 2. AutoRegressive Komponente: Vorhersage mittels zurckliegender Messwerte. Ergebnis dieses Schrittes ist eine Gleichung der Form der n-te Wert hngt também von einer Reihe vorausgegangener Werte ab. (Rauschen wurde hier weggelassen) Um morre Koeffizienten a n-i zu ermitteln wird zunchst der Korrelationskoeffizient zwischen der stationr gemachten Messreihe und der um i Messwerte verschobenen stationr gemachten Messreihe (sogenanntes i-tes Lag) berechnet. Beispiel 2 (hat nichts mit Beispiel 1 zu tun) Folgende Grafik visualisiert die Tabellenwerte: In der rechten Spalte der Tabelle (rot) stehen die Korrelationskoeffizienten zwischen der stationr gemachten Originalreihe und ihrem 1. bis 5. Lag. Es ist nicht auszuschliessen, dass es unter den noch Hheren Lags einige mit ebenfalls bedeutsamen Korrelationskoeffizienten gibt. Bei der Berechnung der Korrelationskoeffizienten wird nicht zyklisch gerechnet (wie bei der Autokorrelation), sondern es werden nur bereinanderstehende Werte verwendet. Das bedeutet, dass die Anzahl Wertepaare fr hhere Lags geringer wird. Folgende Tabelle zeigt die Berechnungen der Signifikanz der Korrelationskoeffizienten. Das genaue Vorgehen hierzu ist unter der Rubrik Z-transformation beschrieben. Die Tabelle zeigt 5 einzeln und unabhngig durchgefhrte Testes. Zur hier auftretenden Problematik siehe Multiples Testen und Alpha Inflação. Wir knnten hier an dieser Stelle entscheiden, dass der 1. und 4. Lag zur Modellierung ausreichen. Genausogut knnten wir auch alle 5 Komponenten im weiteren Modell hinzunehmen. Beide Flle se encontra no Folgender Grafik dargestellt. Man sieht, dass die Hinzunahme der Lags 2,3 e 5 nicht unbedingt das bessere Modell ergibt. Die Berechnung erfolgte então, dass die Summe der quadrierten Korreletionskoeffizienten der jeweils verwendeten Lags zu Eins normiert und gewichtet worden ist. Die bisher ermittelten Modellgleichungen der beiden Modelle lauten: Hier ist 5.2 der Mittelwert der Originalreihe. Die Werte der anderen Vorfaktoren ergeben sich aus den normierten Bestimmtkeitsmassen (quadrierte Korrelationskoeffizienten) der Lags, wobei die Vorzeichen von den Korrelationskoeffizienten bernommen wurden. Folgend Tabelle veranschaulicht den Rechengang: Es ist zu bedenken, dass die Signifikanz werte in der Tabelle keine Verbindung mit einem mehr oder weniger guten Modell haben. Sie bedeuten lediglich, dass die Korrelationskoeffizienten nicht bloss Zufall sind. Wurde hier nicht berechnet, wie Lag 4 direkt mit der stationr gemachten Original, em inglês, em inglês, em alemão, em alemão. Diese Art Korrelation heisst partielle Autocorrelação e wird hier nicht behandelt. Es gibt spezielle Signifikanztests, die auf Autokorrelation testen. Durbin h-Statistik. Testet die Autokorrelation der Zeitreihenwerte mit dem ersten Lag. Durbin Watson Test: Testet die Autokorrelation der Residuen der Zeitreihenwerte mit dem ersten Lag. Testet também em Autokorrelation der Fehler --gt Schritt 3. Schritt 3. Mover média: Vorhersage mittels vorangegangener Fehler. Unter Fehler ist hier zuflliger statistischer Einfluss zu verstehen, denn eine stationre Zeitreihe besteht aus Werten, morre entsprechend der zugrundegelegten Verteilungsfunktion um einen zeitlich konstanten Mittelwert streuen. Ergebnis dieses Schrittes ist eine Gleichung der Form Die autoregressive Komponente des vorhergehenden Schrittes 2 wird também com gewichteten Fehlern vorangehender Werte korrigiert. Folgende Tabelle entablo in der obersten Zeile die stationr gemachte Originalreihe aus Beispiel 2, in der 2. Zeile das AR Modell aus Schritt 2, dann den Fehler des Modells aus Schritt 2, e schliesslich die ersten 5 Lags des Fehlers (também morre Wertereihe des Modellfehlers Um 1,2,3,4 und 5 Positionen verschoben). Ohne explizite Rechnung ist bereits erkennbar, dass keiner der Korrelationskoeffizienten significante, ja sogar jeder relativ klein ist. Das deutet stark darauf hin, dass der Fehler des in Schritt 2 gewonnenen Models fast nur aus zuflligem (normalverteiltem) Rauschen besteht. Das bedeutet konkret: Der n1 - te Messwert wird durch keine Zufallskomponente irgendeines vorhergehenden Wertes n, n-1. N-s beeinflusst Die Fehler korrelieren nicht einmal mit den Werten selbst (0.20) Es gibt in der vorliegenden Reihe keine Fehlerfortpflanzung. Das Bisher entwickelte Modell lautet demnach ARIMA (4,2,0) 4. Der autorregressivo Teil des Modells (AR) greift bis auf den 4. Lag zurck 2. Morrer Originalmente musste 2 Mal differenziert werden, um stationr zu werden. 0. Der Moving Average Teil (MA) greift auf keinen Lag zurck. Im Folgenden seien zum allgemeinen Verstndnis bildhaft ein paar schne Autokorrelationsfunktionen und partielle Autokorrelationsfunktionen sowie die dazugehrende Nomenklatur dargestellt. Die Sulen stellen Korrelationswerte dar. Bei Autokorrelationsfunktionen, ACF. Handelt es sich um Funktionen wie bisher beschrieben, d. h. Es werden alle Einflsse berrcksichtigt. In dem obigen Beispiel 2 wurde zwar entschieden, nur Lag 1 e 4 fr das zu erstellende Modell zu verwenden, trotzdem sind dort die eventuellen Einflsse der Lags 2 und 3 mit enthalten, denn Lag 4 kann ja von Lag 3 abhngen, und Lag 3 von Lag 2, und dieses wiederum von Lag 1 alternativ knnte Lag 4 aber auch direkt von Lag 1 abhngen und nicht von Lag 2 und 3, wieder alternativ knnte Lag 4 von allen Lags 1,2 e 3 abhngen die bisher beschriebene Vorgehensweise zur Bildung der Autokorrelationsfunktion Kann diese Flle grundstzlich nicht unterscheiden (ob Lags direkt voneinander abhngen oder ber dazwischenliegende Lags). Aus diesem Grund verwendet man Partielle Autokorrelationsfunktionen, PACF. Dort berechnet man z. B.den direkten Einfluss des Lags 4 auf die originale Messreihe und rechnet die Einflsse der Lags 1,2 und 3 auf Lag 4 heraus. Die blosse visuelle Analise o derrube Funktionen ACF (pdq) e PACF (pdq) na área de varejo Fllen bereits richtungsweisende Aussagen. Allerdings erfordert bereits die Erstellung der beiden Funktionen schon spezielle Statistiksoftware. Partielle Autokorrelationsfunktion (PACF)

No comments:

Post a Comment