Monday, October 24, 2016

Use Of Moving Average In Time Reeks Ontleding

Wat is 'n bewegende gemiddelde Die eerste bewegende gemiddelde is 4310, wat is die waarde van die eerste waarneming. (In tydreeksanalise, die eerste getal in die reeks bewegende gemiddeldes is nie bereken is dit 'n vermiste waarde.) Die volgende bewegende gemiddelde is die gemiddeld van die eerste twee waarnemings, (4310 4400) / 2 4355. Die derde bewegende gemiddelde is die gemiddelde van waarneming 2 en 3, (4400 4000) / 2 4200, en so aan. As jy wil 'n bewegende gemiddelde lengte 3 gebruik, is drie waardes gemiddeld in plaas van twee. Kopiereg 2016 Minitab Inc.. Deur die gebruik van hierdie webwerf stem jy in om die gebruik van koekies vir analise en persoonlike inhoud. Lees ons policyMoving gemiddeldes bewegende gemiddeldes Met konvensionele datastelle die gemiddelde waarde is dikwels die eerste, en een van die mees bruikbare, opsommingstatistiek te bereken. Wanneer data in die vorm van 'n tydreeks, die reeks beteken is 'n nuttige maatstaf, maar nie die dinamiese aard van die data weerspieël. Gemiddelde waardes bereken oor kortsluiting periodes, hetsy voor die huidige tydperk of gesentreer op die huidige tydperk, is dikwels meer nuttig. Omdat so 'n gemiddelde waardes sal wissel, of beweeg, soos die huidige tydperk beweeg van tyd t 2, t 3. ens staan ​​hulle bekend as bewegende gemiddeldes (Mas). 'N Eenvoudige bewegende gemiddelde is (tipies) die ongeweegde gemiddelde van k voor waardes. 'N eksponensieel geweeg bewegende gemiddelde is in wese dieselfde as 'n eenvoudige bewegende gemiddelde, maar met bydraes tot die gemiddelde geweegde deur hul nabyheid aan die huidige tyd. Want daar is nie een nie, maar 'n hele reeks bewegende gemiddeldes vir enige gegewe reeks, die stel van Mas kan hulself getrek word op grafieke, ontleed as 'n reeks, en gebruik in die modellering en voorspelling. 'N verskeidenheid van modelle kan gebou word met behulp van bewegende gemiddeldes, en dit is bekend as MA modelle. As sulke modelle word gekombineer met outoregressiewe (AR) modelle die gevolglike saamgestelde modelle is bekend as ARMA of ARIMA modelle (die Ek is vir geïntegreerde). Eenvoudige bewegende gemiddeldes Sedert 'n tydreeks kan as 'n stel waardes beskou word,, t 1,2,3,4, N die gemiddeld van hierdie waardes kan bereken word. As ons aanvaar dat N is nogal groot, en ons kies 'n heelgetal k wat is veel kleiner as n. kan ons 'n stel van blok gemiddeldes, of eenvoudig bewegende gemiddeldes (van orde k) bereken: Elke maat verteenwoordig die gemiddelde van al die datawaardes oor 'n interval van k waarnemings. Let daarop dat die eerste moontlike MA van orde k gt0 is dat vir t k. Meer in die algemeen kan ons die ekstra onderskrif val in die uitdrukkings bo en skryf: Dit bepaal dat die geskatte gemiddelde op tydstip t is die eenvoudige gemiddelde van die waargeneem waarde op tydstip t en die voorafgaande k -1 tyd stappe. As gewigte word toegepas wat die bydrae van waarnemings wat verder weg in die tyd is verminder, is die bewegende gemiddelde gesê eksponensieel word stryk. Bewegende gemiddeldes word dikwels gebruik as 'n vorm van vooruitskatting, waardeur die beraamde waarde vir 'n reeks op tydstip t 1, S T1. geneem word as die MA vir die tydperk tot en met tyd t. bv vandag se skatting is gebaseer op 'n gemiddelde van vorige aangeteken waardes tot en met gister se (vir daaglikse data). Eenvoudige bewegende gemiddeldes kan gesien word as 'n vorm van gladstryking. In die onderstaande diagram getoon word byvoorbeeld het die lugbesoedeling dataset getoon in die inleiding tot hierdie onderwerp is aangevul deur 'n 7-daagse bewegende gemiddelde (MA) reël, hier in rooi. Soos gesien kan word, die MA lyn glad uit die pieke en trôe in die data en kan baie nuttig wees in die identifisering van tendense wees. Die standaard toekomsgerigte berekening formule beteken dat die eerste k -1 datapunte het geen MA waarde, maar daarna berekeninge uit te brei na die finale data punt in die reeks. PM10 daaglikse gemiddelde waardes, Greenwich bron: London Luggehalte Network, www. londonair. org. uk Een rede vir die berekening van eenvoudige bewegende gemiddeldes op die voorgeskrewe wyse, is dat dit in staat stel om waardes te bereken vir alle tydgleuwe van tyd tk tot op hede en as 'n nuwe meting verkry vir tyd t 1, die MA vir tyd t 1 kan die reeds bereken stel bygevoeg. Dit bied 'n eenvoudige prosedure vir 'n dinamiese datastelle. Daar is egter 'n paar probleme met hierdie benadering. Dit is redelik om te argumenteer dat die gemiddelde waarde van die afgelope 3 periodes, sê, moet geleë wees op tyd t -1, nie tyd t. en vir 'n MA oor 'n gelyke getal periodes miskien is dit moet geleë wees by die middelpunt tussen twee tyd intervalle. 'N oplossing vir hierdie probleem is om gesentreer MA berekeninge, waarin die MA op tydstip t is die gemiddeld van 'n simmetriese stel waardes rondom t gebruik. Ten spyte van die ooglopende meriete, is hierdie benadering nie oor die algemeen gebruik word, want dit vereis dat data is beskikbaar vir toekomstige gebeure, wat nie die geval mag wees. In gevalle waar analise is geheel en al van 'n bestaande reeks, kan die gebruik van gesentreer Mas beter wees. Eenvoudige bewegende gemiddeldes kan beskou word as 'n vorm van gladstryking, die verwydering van 'n paar hoë frekwensie komponente van 'n tydreeks en beklemtoon (maar nie die verwydering van) tendense in 'n soortgelyke wyse as die algemene opvatting van digitale filter. Inderdaad, bewegende gemiddeldes is 'n vorm van lineêre filter. Dit is moontlik om 'n bewegende gemiddelde berekening van toepassing op 'n reeks wat reeds stryk, dit wil sê glad of filter 'n reeds stryk reeks. Byvoorbeeld, met 'n bewegende gemiddelde van orde 2, ons kan dit beskou as synde bereken met behulp van gewigte, sodat die MA by x 2 0.5 x 1 0.5 x 2. Net so, die MA by x 3 0.5 x 2 0.5 x 3. As ons dien 'n tweede vlak van gladstryking of filter, ons het 0,5 x 2 0.5 x 3 0.5 (0.5 x 1 0.5 x 2) 0.5 (0.5 x 2 0.5 x 3) 0.25 x 1 0.5 x 2 0,25 x 3 dws die 2-stadium filter proses (of konvolusie) het 'n wisselvallig geweegde simmetriese bewegende gemiddelde, met gewigte vervaardig. Veelvuldige konvolusie kan ingewikkeld geweegde bewegende gemiddeldes, waarvan sommige is gevind veral gebruik in gespesialiseerde velde, soos in lewensversekering berekeninge te produseer. Bewegende gemiddeldes gebruik kan word om periodieke effekte verwyder indien bereken met die lengte van die periodisiteit as 'n bekende. Byvoorbeeld, met 'n maandelikse data seisoenale variasies dikwels verwyder kan word (indien dit die doel) deur toe te pas 'n simmetriese 12 maande bewegende gemiddelde met al maande gelyke gewigte, behalwe die eerste en laaste wat geweeg deur 1/2. Dit is omdat daar sal 13 maande in die simmetriese model (huidige tyd, t / -. 6 maande). Die totale is gedeel deur 12. Soortgelyke prosedures kan vir enige goed gedefinieerde periodisiteit word aangeneem. Eksponensieel geweeg bewegende gemiddeldes (EWMA) Met die eenvoudige bewegende gemiddelde formule: alle waarnemings is ewe geweegde. As ons noem hulle die gelyke gewigte, Alpha t. elk van die k gewigte sou gelyk 1 / k. sodat die som van die gewigte sal wees 1, en die formule sou wees: Ons het reeds gesien dat verskeie programme van hierdie proses lei tot die gewigte wissel. Met eksponensieel geweeg bewegende gemiddeldes die bydrae tot die gemiddelde waarde van waarnemings wat meer verwyder betyds beraadslaag verminder, en sodoende meer onlangse (plaaslike) gebeure beklemtoon. In wese 'n glad parameter, 0lt Alpha LT1, is bekend gestel, en die formule hersien om 'n simmetriese weergawe van hierdie formule van die vorm sal wees: As die gewigte in die simmetriese model is gekies as die terme van die bepalings van die binomiale uitbreiding, (1/21/2) 2S. hulle sal vat om 1, en as Q groot word, sal die normaalverdeling benader. Dit is 'n vorm van kern gewig, met die Binomiale optree as die kern funksie. Die twee stadium konvolusie in die vorige subartikel beskryf is juis hierdie reëling, met Q 1, opbrengs die gewigte. In eksponensiële gladstryking is dit nodig om 'n stel gewigte gebruik wat som tot 1 en wat verminder in grootte meetkundig. Die gewigte gebruik is tipies van die vorm: Om te wys dat hierdie gewigte op te som tot 1, oorweeg die uitbreiding van 1 / as 'n reeks. Ons kan skryf en die uitdrukking in hakies gebruik te maak van die binomiale formule (1- x) p brei. waar x (1-) en p -1, wat gee: Dit bied dan 'n vorm van geweegde bewegende gemiddelde van die vorm: Hierdie opsomming kan geskryf word as 'n herhaling verhouding: wat berekening grootliks vereenvoudig, en vermy die probleem wat die gewig regime moet streng oneindige wees vir die gewigte op te som tot 1 (vir klein waardes van alfa. hierdie is tipies nie die geval). Die notasie wat gebruik word deur verskillende skrywers wissel. Sommige gebruik die letter S aan te dui dat die formule is in wese 'n reëlmatige veranderlike, en skryf: terwyl die beheerteorie literatuur gebruik dikwels Z eerder as S vir die eksponensieel geweeg of glad waardes (sien, byvoorbeeld, Lucas en Saccucci, 1990, LUC1 , en die NIST webwerf vir meer besonderhede en uitgewerkte voorbeelde). Bogenoemde aangehaal formules uit die werk van Roberts (1959 ROB1), maar Hunter (1986, HUN1) gebruik 'n uitdrukking van die vorm: wat meer geskik is vir gebruik in 'n paar prosedures kan wees. Met alfa 1 die gemiddelde skatting is eenvoudig sy gemeet waarde (of die waarde van die vorige data-item). Met 0,5 die skatting is die eenvoudige bewegende gemiddelde van die huidige en vorige metings. In voorspellingsmodelle die waarde, S t. word dikwels gebruik as die skatting of voorspelling waarde vir die volgende tydperk, dit wil sê as die skatting vir x op tydstip t 1. So ons het: Dit dui aan dat die voorspelling waarde op tydstip t 1 is 'n kombinasie van die vorige eksponensieel geweeg bewegende gemiddelde plus 'n komponent wat die geweegde voorspelling fout, Epsilon verteenwoordig. op tyd t. Die aanvaarding van 'n tydreeks gegee en 'n voorspelling is nodig, word 'n waarde vir Alpha vereis. Dit kan geskat word van die bestaande data deur die evaluering van die som van 'n vierkant voorspelling foute te kry met wisselende waardes van Alpha vir elke T 2,3. die opstel van die eerste skatting van die eerste waargenome data waarde wees, x 1. In beheer aansoeke ter waarde van Alpha is belangrik in wat gebruik word in die bepaling van die boonste en onderste beheer perke, en raak die gemiddelde duur lank (ARL) verwag voor hierdie beheer perke is gebreek (onder die aanname dat die tyd reeks verteenwoordig 'n stel van ewekansige, identies verdeelde onafhanklike veranderlikes met 'n gemeenskaplike variansie). Onder hierdie omstandighede die variansie van die beheer statistiek: is (Lucas en Saccucci, 1990): beheer perke word gewoonlik gestel as vaste veelvoude van hierdie asimptotiese variansie, bv / - 3 keer die standaardafwyking. 1,134 en die proses sal een of ander perk in 500 bereik - As alfa 0,25, byvoorbeeld, en die data wat gemonitor word aangeneem dat 'n normale verspreiding, N (0,1) het, terwyl dit in beheer, die beheer perke sal / kan stappe op die gemiddelde. Lucas en Saccucci (1990 LUC1) lei die ARLs vir 'n wye verskeidenheid van alfa waardes en onder verskillende aannames met behulp van Markov Chain prosedures. Hulle tabuleer die resultate, insluitend die verskaffing van ARLs wanneer die gemiddelde van die beheerproses is verskuif deur sommige verskeie van die standaardafwyking. Byvoorbeeld, met 'n 0.5 verskuiwing met alfa 0,25 die ARL is minder as 50 keer stappe. Die hierbo beskryf benaderings staan ​​bekend as een eksponensiële gladstryking. as die prosedures wat eenmaal aan die tydreeks toegepas en dan ontleed of beheer prosesse uit op die gevolglike stryk dataset gedra. As die dataset sluit 'n tendens en / of seisoenale komponente, twee - of drie-fase eksponensiële gladstryking kan hieronder toegedien word as 'n middel van die verwydering (uitdruklik modellering) hierdie effekte (sien verder, die afdeling oor vooruitskatting., En die NIST uitgewerkte voorbeeld ). CHA1 Chat Field C (1975) die ontleding van Times Reeks: teorie en praktyk. Chapman en Hall, Londen HUN1 Hunter J S (1986) Die eksponensieel geweeg bewegende gemiddelde. J van kwaliteit Tegnologie, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) eksponensieel Geweegde Moving Gemiddelde beheer Skemas: Properties en verbeteringe. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) beheer Chart Toetse Op grond van Meetkundige bewegende gemiddeldes. Technometrics, 1, 239-250Smoothing data verwyder ewekansige variasie en toon neigings en sikliese komponente Inherent in die versameling van data geneem met verloop van tyd is 'n vorm van ewekansige variasie. Daar bestaan ​​metodes vir die vermindering van van die kansellasie van die effek as gevolg van ewekansige variasie. 'N dikwels gebruikte tegniek in bedryf is glad. Hierdie tegniek, wanneer dit behoorlik toegepas word, blyk duidelik die onderliggende tendens, seisoenale en sikliese komponente. Daar is twee afsonderlike groepe glad metodes Berekening van gemiddelde metodes Eksponensiële Smoothing Metodes Neem gemiddeldes is die eenvoudigste manier om data te stryk Ons sal eers ondersoek sommige gemiddelde metodes, soos die eenvoudige gemiddeld van al die afgelope data. 'N Bestuurder van 'n pakhuis wil weet hoeveel 'n tipiese verskaffer lewer in 1000 dollar eenhede. Hy / sy neem 'n monster van 12 verskaffers, na willekeur, die verkryging van die volgende resultate: Die berekende gemiddelde of gemiddeld van die data 10. Die bestuurder besluit om dit te gebruik as die skatting vir uitgawes van 'n tipiese verskaffer. Is dit 'n goeie of slegte skat Gemiddelde kwadraat fout is 'n manier om te oordeel hoe goed 'n model is Ons sal bereken die gemiddelde kwadraat fout. Die fout ware bedrag wat minus die beraamde bedrag. Die fout vierkant is die fout hierbo, vierkantig. Die SSE is die som van die gekwadreerde foute. Die MSE is die gemiddeld van die kwadraat foute. MSE lei byvoorbeeld Die uitslae is: Fout en gekwadreerde foute Die raming 10 Die vraag ontstaan: kan ons gebruik maak van die gemiddelde inkomste voorspel as ons vermoed dat 'n tendens 'n blik op die grafiek hieronder toon duidelik dat ons nie dit sou doen. Gemiddeld weeg al verlede Waarnemings ewe In opsomming, ons verklaar dat die eenvoudige gemiddelde of gemiddeld van al verlede waarnemings is net 'n nuttige skatting vir vooruitskatting wanneer daar geen tendense. As daar tendense, gebruik verskillende skattings dat die tendens in ag neem. Die gemiddelde weeg al verlede Waarnemings ewe. Byvoorbeeld, die gemiddelde van die waardes 3, 4, 5 is 4. Ons weet natuurlik dat 'n gemiddelde word bereken deur die toevoeging van al die waardes en die som te deel deur die aantal waardes. Nog 'n manier van berekening van die gemiddelde is deur die byvoeging van elke waarde gedeel deur die aantal waardes, of 3/3 4/3 5/3 1 1,3333 1,6667 4. Die vermenigvuldiger 1/3 is die gewig genoem. In die algemeen: bar frac som links (frac regs) x1 links (frac regs) x2,. ,, Links (frac regs) xn. Die (links (frac regs)) is die gewigte en, natuurlik, hulle vat om 1.Time Reeks Ontleding en die toepassing daarvan: Met R Voorbeelde R tydreekse kitsoplossing die bladsy JavaScript gebruik vir accentuering. Dit is nie nodig om dit te draai op, maar die kode sal moeiliker om te lees. Dit is net 'n kort wandeling down tydreekse baan. My raad is om R oopmaak en speel saam met die studiemateriaal. Hopelik het jy R geïnstalleer en het gevind dat die ikoon op jou lessenaar wat lyk soos 'n R. Wel, dit is 'n R. As jy die gebruik van Linux, dan ophou soek omdat sy nie daar nie. net maak 'n terminale en tik R (of installeer R Studio.) As jy wil meer inligting oor tydreekse grafiese, veral met behulp van ggplot2. sien die Grafiese quick fix. Die kitsoplossing is bedoel om jou bloot te stel aan basiese R tydreekse vermoëns, en is 'n gegradueerde pret vir mense ouderdomme 8 tot 80. Dit is nie 'n les in tydreeksanalise, maar daar is tsaEZ. 'n vrye en maklik inleiding tot tydreeksanalise. LoZ Baby stappe. jou eerste R sessie. Kry gemaklik, dan begin haar op en probeer 'n paar eenvoudige toevoeging: Ok, nou is jy 'n kenner gebruik R. gaan astsa nou kry: Nou dat jy gelaai is, kan ons begin. laat gaan Eerste, ook speel met die Johnson amp Johnson datastel. Sy ingesluit in astsa as JJ. dat Dynomite karakter van goeie tye. In die eerste plek kyk na dit. en jy sien dat JJ is 'n versameling van 84 nommers bekend as 'n tydreeks voorwerp. Om te sien / verwyder jou voorwerpe: As jy 'n Matlab (of soortgelyke) gebruiker, kan jy dink JJ is 'n 84 keer 1 vektor, maar dit is nie. Dit het orde en lengte, maar geen dimensies (geen rye, geen kolomme). R noem hierdie soort voorwerpe vektore sodat jy moet versigtig wees. In R, matrikse het dimensies maar vektore nie - hulle het net soort van dangle oor in die kuberruimte. Nou, kan 'n maandelikse tydreekse voorwerp wat in Junie begin van die jaar 2293. Ons gaan die Vortex. Let daarop dat die Johnson en Johnson data is kwartaallikse verdienste, dus is dit het frequency4. Die tydreekse zardoz is maandelikse data, dus is dit het frequency12. Jy kry ook 'n paar nuttige dinge met die lepels voorwerp, byvoorbeeld: Nou probeer 'n plot van die Johnson Johnson data: Die getoon grafiek is 'n bietjie meer fancy as die kode sal gee. Vir meer besonderhede, sien die Grafiese quick fix bladsy. Dit geld vir die res van die erwe sal jy hier sien. Probeer hierdie en kyk wat gebeur: en terwyl jy hier, check plot. ts en ts. plot. Let daarop dat indien u data is 'n tydreeks voorwerp, plot () sal die truuk doen (vir 'n eenvoudige tyd plot, dit is). Anders, plot. ts () sal die grafiese in 'n tyd plot dwing. Hoe gaan dit met filter / glad die Johnson amp Johnson reeks met behulp van 'n twee-sided bewegende gemiddelde Kom ons probeer hierdie: FJJ (t) 8539 JJ (t-2) frac14 JJ (t-1) frac14 JJ (t) frac14 JJ (T1) 8539 JJ (T2) en goed voeg 'n lowess (lowess - jy weet die roetine) geskik is vir pret. Kom ons verskil die aangeteken data en noem dit dljj. Dan ook speel met dljj. Nou 'n histogram en 'n Q-Q plot, een bo-op die ander (maar in 'n mooi manier): Kom ons kyk na die korrelasie struktuur van dljj met behulp van verskeie tegnieke. In die eerste plek goed kyk na 'n rooster van spreiding diagrammen van dljj (t) teenoor uitgestel waardes. Die lyne is 'n lowess fiks en die monster ACF is blou in die boks. Nou kan 'n blik op die ACF en PACF van dljj. Let daarop dat die lag as is in terme van frekwensie. sodat 1,2,3,4,5 ooreenstem met hier loop 4,8,12,16,20 omdat frequency4. As jy dit nie soos hierdie tipe etikettering, kan jy dljj vervang in enige van die bogenoemde deur ts (dljj, freq1) bv ACF (TS (dljj, freq1), 20) Meer oor, kan probeer om 'n strukturele ontbinding van log (JJ) tendens seisoen fout met behulp lowess. As jy wil hê dat die residue inspekteer, byvoorbeeld, theyre in dogtime. series, 3. die derde kolom van die gevolglike reeks (die seisoenale en tendens komponente is in kolomme 1 en 2). Check uit die ACF van die residue, ACF (dogtime. series, 3) die residue Arent wit - nie eens naby. Jy kan 'n bietjie (baie min) doen 'n beter gebruik van 'n plaaslike seisoenale venster, in teenstelling met die globale een wat gebruik word deur die spesifiseer per. Tipe STL vir meer inligting. Theres ook iets genoem StructTS wat sal pas parametriese strukturele modelle. Ons moenie gebruik hierdie funksies in die teks wanneer ons strukturele modelle aan te bied in Hoofstuk 6 want ons verkies om ons eie programme te gebruik. LoZ Dit is 'n goeie tyd om te verduidelik. In die bogenoemde, hond is 'n voorwerp met 'n klomp van die dinge (tegniese term). As jy tik hond. sal jy sien die komponente, en as jy opsomming (hond) tik sal jy kry 'n bietjie opsomming van die resultate. Een van die komponente van die hond is time. series. wat bevat die gevolglike reeks (seisoenale, tendens, restant). Om hierdie komponent van die voorwerp hond sien. jy tik dogtime. series (en jy sal sien 3-reeks, die laaste waarvan bevat die residue). En dis die verhaal van. sal jy sien meer voorbeelde as ons saam beweeg. En nou goed te doen 'n probleem uit Hoofstuk 2. gaan die regressie log (JJ) betatime alfa 1 Q1 alfa 2 K2 alfa 3 Q3 Alpha 4 K4 epsilon waar Qi is 'n aanduiding van die kwartaal Ek 1,2,3,4 pas . Dan ook inspekteer die residue. Jy kan die model matriks (met die skynveranderlikes) beskou hierdie manier: kyk nou wat gebeur het. Kyk na 'n plot van die waarnemings en hul toegerus waardes: wat toon dat 'n plot van die data met die pas gesuperponeer is nie die kuberruimte wat dit neem om die moeite werd. Maar 'n plot van die residue en die ACF van die residue is sy gewig in joules werd: Doen die residue kyk wit Ignoreer die 0-lag korrelasie, sy altyd 1. Wenk: Die antwoord is NEE. sodat die regressie bogenoemde is onbenullig. So whats die middel Jammer, jy sal tot die klas te neem, want dit is nie 'n les in die tyd reeks. Ek het julle gewaarsku om aan die bokant. Jy moet versigtig wees wanneer jy agteruitgang een tydreekse op uitgestel komponente van 'n ander gebruik van LM (). Daar is 'n pakket genaamd dynlm wat maak dit maklik om uitgesak regressies pas, en ek sal na hierdie voorbeeld bespreek daardie reg. As jy gebruik lm (). dan wat jy hoef te doen is tie die reeks saam met behulp van ts. intersect. As jy dit nie bind die reeks saam, gewoond hulle behoorlik in lyn. Hier is 'n voorbeeld agteruit weeklikse kardiovaskulêre mortaliteit (cmort) op deeltjies besoedeling (deel) teen die huidige waarde en uitgestel vier weke (ongeveer 'n maand). Vir meer besonderhede oor die datastel, sien Hoofstuk 2. Maak seker astsa gelaai. Let wel: Daar is geen behoefte om lag hernoem (deel, -4) tot Part4. dit is net 'n voorbeeld van wat jy kan doen. 'N alternatief vir die bogenoemde is die pakket dynlm wat geïnstalleer moet word, natuurlik (soos ons gedoen het vir astsa daar aan die begin). Na afloop van die pakket is geïnstalleer, kan jy die vorige voorbeeld te doen soos volg: Wel, dit is tyd om na te boots. Die perd vir ARIMA simulasies is arima. sim (). Hier is 'n paar voorbeelde geen uitset is hier so jy op jou eie getoon. Die gebruik van astsa sy maklik om 'n ARIMA model pas: Jy mag dalk wonder oor die verskil tussen AIC en AIC hierbo. Daarvoor moet jy die teks lees of net nie bekommerd wees oor dit, want dit is nie die moeite werd om die ondergang van jou dag te dink oor dit. En ja, die residue kyk wit. As jy wil ARIMA vooruitskatting te doen, is sarima. for ingesluit in astsa. En nou vir 'n paar regressie met autocorrelated foute. Op pad was om te pas die model M t Alpha betat gammaP t e t waar M t en P t is die sterftesyfer (cmort) en deeltjies (deel) reeks, en e t is autocorrelated fout. In die eerste plek doen 'n OLS fiks en maak seker die residue: Nou pas die model Die residu-analise (nie getoon) lyk perfek. Hier is 'n ARMAX model, M t beta 0 phi 1 M t-1 phi 2 M t-2 beta 1 t beta 2 T t-1 beta 3 P t beta 4 P t-4 e t. waar e t moontlik is autocorrelated. Eerste probeer ons en ARMAX (2, Q0), kyk dan op die residue en besef Theres geen korrelasie verlaat, sodat daar gebeur. Ten slotte, 'n spectraalanalyse Quicky: Dis al vir nou. As jy wil meer inligting oor tydreekse grafiese, sien die Grafiese quick fix page.5.2 Smoothing Tyd Reeks Smoothing word gewoonlik gedoen om ons te help patrone, tendense beter sien byvoorbeeld in tydreekse. Oor die algemeen glad die onreëlmatige ruheid om 'n duideliker sein sien. Vir seisoenale data, kan ons glad die seisoen, sodat ons die tendens kan identifiseer. Glad nie die geval is voorsien ons met 'n model, maar dit kan 'n goeie eerste stap in die beskrywing van die verskillende komponente van die reeks wees. Die term filter word soms gebruik om 'n glad prosedure beskryf. Byvoorbeeld, as die stryk waarde vir 'n bepaalde tyd word bereken as 'n lineêre kombinasie van waarnemings vir omliggende keer, dit kan gesê word dat weve toegepas n lineêre filter om die data (nie dieselfde as om te sê die resultaat is 'n reguit lyn, deur die manier). Die tradisionele gebruik van die term bewegende gemiddelde is dat by elke punt in die tyd wat ons bepaal (moontlik geweegde) gemiddeldes van waargenome waardes wat 'n bepaalde tyd omring. Byvoorbeeld, op tyd t. 'n gesentreerde bewegende gemiddelde lengte 3 met gelyke gewigte sal die gemiddelde waardes by tye t -1. t. en T1. Om seisoenaliteit weg te neem van 'n reeks, sodat ons kan beter sien tendens, sou ons 'n bewegende gemiddelde met 'n lengte seisoenale span gebruik. So in die stryk reeks, het elk stryk waarde is gemiddeld oor alle seisoene. Dit kan gedoen word deur te kyk na 'n eensydige bewegende gemiddelde waarin jy gemiddeld alle waardes vir die vorige jaar se data of 'n gesentreerde bewegende gemiddelde waarin jy waardes gebruik beide voor en na die huidige tyd. Vir kwartaallikse data, byvoorbeeld, ons kan 'n reëlmatige waarde vir tyd t as definieer (x t x t-1 x T-2 x t-3) / 4, die gemiddelde van hierdie tyd en die vorige 3/4. In R-kode sal dit 'n eensydige filter wees. A-gesentreerde bewegende gemiddelde skep 'n bietjie van 'n probleem wanneer ons 'n ewe getal van tydperke in die seisoenale span (soos ons gewoonlik doen). Om weg te stryk seisoenaliteit in kwartaallikse data. ten einde tendens te identifiseer, die gewone konvensie is om die bewegende gemiddelde stryk op tydstip t is om weg te stryk seisoenaliteit in maandelikse data gebruik. ten einde tendens te identifiseer, die gewone konvensie is om die bewegende gemiddelde stryk op tydstip t is wat deur gebruik gewig 1/24 pas ons om waardes by tye T6 en T6 en gewig 12/01 alle waardes te alle tye tussen T5 en T5. In die opdrag R filter, sowel spesifiseer 'n twee-sided filter wanneer ons wil waardes wat kom beide voor en na die tyd waarvoor was glad gebruik. Let daarop dat op bladsy 71 van ons boek, die skrywers gelyk gewigte van toepassing oor 'n gesentreerde seisoenale bewegende gemiddelde. Dis okay ook. Byvoorbeeld, kan 'n kwartaallikse gladder word stryk op tydstip t is frac x frac x frac xt frac x frac x A maandelikse gladder kan 'n gewig van 1/13 van toepassing op alle waardes van tye t-6 tot T6. Die kode van die skrywers gebruik op bladsy 72 maak gebruik van 'n rep bevel dat 'n waarde herhaal 'n sekere aantal kere. Hulle hoef te gebruik die parameter filter binne die opdrag filter. Voorbeeld 1 Kwartaallikse Beer Produksie in Australië in beide Les 1 en Les 4, het ons gekyk na 'n reeks kwartaallikse bier produksie in Australië. Die volgende R-kode skep 'n reëlmatige reeks waarmee ons sien die tendens patroon, en plotte hierdie tendens patroon op dieselfde grafiek as die tyd reeks. Die tweede opdrag skep en stoor die stryk reeks in die voorwerp genoem trendpattern. Let daarop dat binne die opdrag filter, die parameter genoem filter gee die koëffisiënte vir ons glad en kante 2 veroorsaak dat 'n gesentreerde glad te bereken. beerprod skandering (beerprod. dat) trendpattern filter (beerprod, filter c (1/8, 1/4, 1/4, 1/4, 1/8), sides2) plot (beerprod, Tipe B, hoof bewegende gemiddelde jaarlikse tendens ) lyne (trendpattern) Hier is die resultaat: Ons kan die tendens patroon van die datawaardes trek om 'n beter blik op die seisoen kry. Hier is hoe dit sou gebeur: seasonals beerprod - trendpattern plot (seasonals, Tipe B, hoof seisoenale patroon vir bier produksie) Die resultaat volg: Nog 'n moontlikheid vir glad reeks tendens sien is die eensydige filter trendpattern2 filter (beerprod, filter c (1/4, 1/4, 1/4, 1/4), sides1) Met hierdie, die stryk waarde is die gemiddeld van die afgelope jaar. Voorbeeld 2. VS Maandeliks werkloosheid in die huiswerk vir week 4 jy kyk na 'n maandelikse reeks VSA Werkloosheid vir 1948-1978. Hier is 'n smoothing gedoen om te kyk na die tendens. trendunemployfilter (werkloos, filterc (1 / 24,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12, 1 / 12,1 / 24), sides2) trendunemploy ts (trendunemploy, begin c (1948,1), freq 12) plot (trendunemploy, mainTrend in die VSA Werkloosheid, 1948-1978, XLab Jaar) Slegs die reëlmatige tendens is geplot. Die tweede opdrag identifiseer die kalender tyd kenmerke van die reeks. Dit maak die plot het 'n meer betekenisvolle as. Die plot volg. Vir nie-seisoenale reeks, Arent jy gebind te stryk oor 'n spesifieke span. Vir glad moet jy eksperimenteer met bewegende gemiddeldes van verskillende strek. Diegene strek van die tyd kan relatief kort wees. Die doel is om af te klop die ruwe kante om te sien wat tendens of patroon daar mag wees. Ander Smoothing Metodes (Afdeling 2.4) Afdeling 2.4 beskryf verskeie gesofistikeerde en nuttige alternatiewe vir bewegende gemiddelde glad. Die besonderhede kan oppervlakkig lyk, maar dis okay, want ons dont wil kry vasgeval in baie besonderhede vir diegene metodes. Van die alternatiewe metodes in Afdeling 2.4 beskryf, kan lowess (plaaslik geweeg regressie) die mees algemeen gebruik. Voorbeeld 2 Voortgesette Die volgende plot is glad tendens lyn vir die VSA Werkloosheid reeks, bevind die gebruik van 'n lowess gladder waarin 'n aansienlike bedrag (2/3) het bygedra tot elke stryk skatting. Let daarop dat hierdie stryk die reeks meer aggressief as die bewegende gemiddelde. Die opdragte gebruik is werkloos ts (werkloos, begin c (1948,1), freq12) plot (lowess (werkloos, f 2/3), hoof Lowess smoothing van die Amerikaanse Werkloosheid Trend) Enkellopend Eksponensiële glad die basiese vooruitskatting vergelyking vir enkele eksponensiële gladstryking Daar word dikwels gegee as hoed Alpha xt (1-alfa) hoed t teks Ons voorspel die waarde van x in die tyd T1 'n geweegde kombinasie van die waargeneem waarde op tydstip t en die geskatte waarde op tydstip t wees. Hoewel die metode 'n glad metode, staan ​​bekend as die hoofsaaklik gebruik word vir 'n kort termyn vooruitskatting. Die waarde van die smoothing konstante genoem. Vir een of ander rede, 0.2 is 'n gewilde verstek keuse van programme. Dit plaas 'n gewig van 0,2 op die mees onlangse waarneming en 'n gewig van 1 0,2 0,8 op die mees onlangse skatting. Met 'n relatief klein waarde van, sal die smoothing relatief meer uitgebreide wees. Met 'n relatief groot waarde van die smoothing is relatief minder uitgebreide as meer gewig op die waargenome waarde gestel sal word. Dit is eenvoudig 'n stap vorentoe vooruitskatting metode wat met die eerste oogopslag blyk 'n model vir die data nie nodig. Trouens, hierdie metode is soortgelyk aan die gebruik van 'n ARIMA (0,1,1) model met geen konstante. Die optimale proses is om 'n ARIMA (0,1,1) model om die waargenome dataset pas en gebruik die resultate om die waarde van vas. Dit is 'n optimale in die sin van die skep van die beste vir die reeds waargeneem data. Alhoewel die doel is glad en 'n stap vorentoe voorspel, die ekwivalensie van die ARIMA (0,1,1) model bring 'n goeie punt. Ons behoort nie blindelings toepassing eksponensiële gladstryking omdat die onderliggende proses nie goed kan beskryf deur 'n ARIMA (0,1,1). ARIMA (0,1,1) en Eksponensiële Smoothing Ekwivalensie Oorweeg 'n ARIMA (0,1,1) met gemiddelde 0 vir die eerste verskille, xt - x t-1: begin hoed amp amp xt theta1 wt amp amp xt theta1 (xt - hat t) amp amp (1 theta1) xt - theta1hat geneig. As ons toelaat dat (1 1) en dus - (1) 1, sien ons die ekwivalensie vergelyking (1) hierbo. Hoekom die metode staan ​​bekend as eksponensiële Smoothing Dit lewer die volgende: begin hoed amp amp Alpha xt (1-alfa) Alpha X (1-alfa) hoed amp amp Alpha xt alfa (1-alfa) x (1-alfa) 2hat einde voort in hierdie mode deur agtereenvolgens vervang vir die geskatte waarde aan die regterkant van die vergelyking. Dit lei tot: hoed Alpha xt alfa (1-alfa) x alfa (1-alfa) 2 x kolle alfa (1-alfa) JX kolle alfa (1-alfa) x1 teks vergelyking 2 toon dat die voorspelde waarde is 'n geweegde gemiddelde van alle afgelope waardes van die reeks, met eksponensieel verander gewigte soos ons beweeg terug in die reeks. Optimale Eksponensiële Smoothing in R Eintlik het ons net pas 'n ARIMA (0,1,1) om die data en bepaal die koëffisiënt. Ons kan die pas van die gladde ondersoek deur 'n vergelyking van die voorspelde waardes van die werklike reeks. Eksponensiële gladstryking is geneig om meer as 'n voorspelling instrument as 'n ware gladder te gebruik, so soek om te sien of ons 'n goeie passing. Voorbeeld 3. N 100 maandelikse waarnemings van die logaritme van 'n olie-prysindeks in die Verenigde State van Amerika. Die data-reeks is: 'n ARIMA (0,1,1) pas in R het 'n MA (1) koëffisiënt 0,3877. So (1 1) 1,3877 en 1- -0,3877. Die eksponensiële gladstryking vooruitskatting vergelyking hoed 1.3877xt - 0.3877hat t Ten tye 100, die waargenome waarde van die reeks is x 100 0,86601. Die voorspelde waarde vir die reeks op daardie tydstip is dus die voorspelling vir die tyd 101 is hoed 1.3877x - 0.3877hat 1,3877 (0,86601) -0,3877 (0,856789) 0,8696 aanleiding is hoe goed die gladder pas die reeks. Dit is 'n goeie passing. Dis 'n goeie teken vir vooruitskatting, die hoofdoel van hierdie gladder. Hier is die instruksies wat gebruik word om die uitset vir hierdie voorbeeld te genereer: oilindex skandering (oildata. dat) plot (oilindex, Tipe B, hoof log olie-indeks Series) expsmoothfit ARIMA (oilindex, sodat c (0,1,1)) expsmoothfit om die ARIMA resultate sien predicteds oilindex - expsmoothfitresiduals voorspelde waardes plot (oilindex, typeb, hoof eksponensiële smoothing van log olie-indeks) lyne (predicteds) 1.3877oilindex100-0.3877predicteds100 voorspelling vir tyd 101 Double eksponensiële smoothing Double eksponensiële gladstryking gebruik kan word wanneer Theres tendens (hetsy lang termyn of kort termyn), maar daar is geen seisoenaliteit. In wese die metode skep 'n voorspelling deur die kombinasie van eksponensieel stryk skattings van die tendens (helling van 'n reguit lyn) en die vlak (basies, die afsnit van 'n reguit lyn). Twee verskillende gewigte, of glad parameters, word gebruik om hierdie twee komponente by elke keer op te dateer. Die stryk is min of meer gelykstaande aan 'n eenvoudige eksponensiële gladstryking van die datawaardes en die reëlmatige tendens is min of meer gelykstaande aan 'n eenvoudige eksponensiële gladstryking van die eerste verskille. Die prosedure is gelykstaande aan pas 'n ARIMA (0,2,2) model, met geen konstante trek hom af met 'n ARIMA (0,2,2) fiks uitgevoer kan word. (1-B) 2 xt (1theta1B theta2B2) wt. navigasie


No comments:

Post a Comment