Monday, October 10, 2016

Moving Average Voorbeelde Tyd Reeks

Bewegende gemiddelde Hierdie voorbeeld leer jy hoe om die bewegende gemiddelde van 'n tydreeks in Excel te bereken. 'N bewegende avearge gebruik te stryk onreëlmatighede (pieke en dale) om maklik tendense herken. 1. In die eerste plek kan 'n blik op ons tyd reeks. 2. Klik op die blad Data, kliek Data-analise. Nota: cant vind die Data-analise knoppie Klik hier om die analise ToolPak add-in te laai. 3. Kies bewegende gemiddelde en klik op OK. 4. Klik op die insette Range boks en kies die reeks B2: M2. 5. Klik op die boks interval en tik 6. 6. Klik in die uitset Range boks en kies sel B3. 8. Teken 'n grafiek van hierdie waardes. Verduideliking: omdat ons die interval stel om 6, die bewegende gemiddelde is die gemiddeld van die vorige 5 datapunte en die huidige data punt. As gevolg hiervan, is pieke en dale stryk uit. Die grafiek toon 'n toenemende tendens. Excel kan nie bereken die bewegende gemiddelde vir die eerste 5 datapunte, want daar is nie genoeg vorige datapunte. 9. Herhaal stappe 2 tot 8 vir interval 2 en interval 4. Gevolgtrekking: Hoe groter die interval, hoe meer die pieke en dale is glad nie. Hoe kleiner die interval, hoe nader die bewegende gemiddeldes is om die werklike data punte. Hou jy van hierdie gratis webwerf Deel asseblief hierdie bladsy op Googlemoving gemiddelde gemiddeld van tydreeksdata (waarnemings eweredig gespasieerde in tyd) van 'n paar agtereenvolgende tydperke. Genoem beweeg omdat dit voortdurend recomputed as nuwe data beskikbaar raak, dit vorder deur die val van die vroegste waarde en die toevoeging van die jongste waarde. Byvoorbeeld, kan die bewegende gemiddelde van ses maande verkoop word bereken deur die gemiddelde van verkope van Januarie tot Junie, dan is die gemiddeld van verkope van Februarie tot Julie dan Maart tot Augustus en so aan. Bewegende gemiddeldes (1) verminder die effek van tydelike verskille in data, (2) die verbetering van die passing van data om 'n lyn ( 'n proses genaamd smoothing) om die data in tendens duideliker wys, en (3) na vore te bring enige waarde bo of onder die tendens. As jy iets met 'n baie hoë variansie is die berekening van die beste wat jy kan in staat wees om te doen, is uit die bewegende gemiddelde. Ek wou weet wat die bewegende gemiddelde was van die data, so ek sal 'n beter begrip van hoe ons doen het. As jy probeer om uit te vind 'n paar nommers wat verander dikwels die beste wat jy kan doen is om te bereken die bewegende gemiddelde. Die beste van BusinessDictionary, afgelewer dailySmoothing data verwyder ewekansige variasie en programme tendense en sikliese komponente inherent in die versameling van data geneem met verloop van tyd is 'n vorm van ewekansige variasie. Daar bestaan ​​metodes vir die vermindering van van die kansellasie van die effek as gevolg van ewekansige variasie. 'N dikwels gebruikte tegniek in bedryf is glad. Hierdie tegniek, wanneer dit behoorlik toegepas word, blyk duidelik die onderliggende tendens, seisoenale en sikliese komponente. Daar is twee afsonderlike groepe glad metodes Berekening van gemiddelde metodes Eksponensiële Smoothing Metodes Neem gemiddeldes is die eenvoudigste manier om data te stryk Ons sal eers ondersoek sommige gemiddelde metodes, soos die eenvoudige gemiddeld van al die afgelope data. 'N Bestuurder van 'n pakhuis wil weet hoeveel 'n tipiese verskaffer lewer in 1000 dollar eenhede. Hy / sy neem 'n monster van 12 verskaffers, na willekeur, die verkryging van die volgende resultate: Die berekende gemiddelde of gemiddeld van die data 10. Die bestuurder besluit om dit te gebruik as die skatting vir uitgawes van 'n tipiese verskaffer. Is dit 'n goeie of slegte skat Gemiddelde kwadraat fout is 'n manier om te oordeel hoe goed 'n model is Ons sal bereken die gemiddelde kwadraat fout. Die fout ware bedrag wat minus die beraamde bedrag. Die fout vierkant is die fout hierbo, vierkantig. Die SSE is die som van die gekwadreerde foute. Die MSE is die gemiddeld van die kwadraat foute. MSE lei byvoorbeeld Die uitslae is: Fout en gekwadreerde foute Die raming 10 Die vraag ontstaan: kan ons gebruik maak van die gemiddelde inkomste voorspel as ons vermoed dat 'n tendens 'n blik op die grafiek hieronder toon duidelik dat ons nie dit sou doen. Gemiddeld weeg al verlede Waarnemings ewe In opsomming, ons verklaar dat die eenvoudige gemiddelde of gemiddeld van al verlede waarnemings is net 'n nuttige skatting vir vooruitskatting wanneer daar geen tendense. As daar tendense, gebruik verskillende skattings dat die tendens in ag neem. Die gemiddelde weeg al verlede Waarnemings ewe. Byvoorbeeld, die gemiddelde van die waardes 3, 4, 5 is 4. Ons weet natuurlik dat 'n gemiddelde word bereken deur die toevoeging van al die waardes en die som te deel deur die aantal waardes. Nog 'n manier van berekening van die gemiddelde is deur die byvoeging van elke waarde gedeel deur die aantal waardes, of 3/3 4/3 5/3 1 1,3333 1,6667 4. Die vermenigvuldiger 1/3 is die gewig genoem. In die algemeen: bar frac som links (frac regs) x1 links (frac regs) x2,. ,, Links (frac regs) xn. Die (links (frac regs)) is die gewigte en, natuurlik, hulle vat om 1.Wanneer berekening 'n lopende bewegende gemiddelde, die plasing van die gemiddelde in die middel tydperk sinvol in die vorige voorbeeld het ons bereken die gemiddeld van die eerste 3 tydperke en sit dit langs tydperk 3. Ons kan die gemiddelde in die middel van die tyd interval van drie periodes geplaas, dit is, langs tydperk 2. dit werk goed met vreemde tydperke, maar nie so goed vir nog tyd tydperke. So waar sou ons plaas die eerste bewegende gemiddelde wanneer M 4 Tegnies, sou die bewegende gemiddelde op t 2.5, 3.5 val. Om hierdie probleem wat ons glad Mas using 2. So glad ons die stryk waardes As ons gemiddeld 'n gelyke getal terme te vermy, moet ons die stryk waardes glad Die volgende tabel toon die resultate met behulp van M 4.Time Reeks Voorbeeld Die volgende voorbeelde illustreer hoe XLMiner kan gebruik word om die data te verken om tendense en seasonalities ontbloot. Op die XLMiner lint, uit die toepassing van u blad Model, kies Hulp - Voorbeelde. dan vooruitskatting / Data-ontginning Voorbeelde en open die voorbeeld datastel, Income. xlsx. Hierdie datastel bevat die gemiddelde inkomste van belastingbetalers deur die staat. Tipies die volgende stappe uitgevoer word in 'n tydreeksanalise. 1. Die data word verdeel in twee stelle met 60 van die aan die opleiding datastel en 40 aan die Validation Stel. 2. Verkennende tegnieke word toegepas op beide die opleiding en Validation stelle. As die resultate is in synch, dan is die model kan fiks wees. As die ACF en PACF erwe is dieselfde, dan dieselfde model kan gebruik word vir beide stelle. 3. Die model is geskik met behulp van die metode ARIMA (outoregressiewe geïntegreerde bewegende gemiddelde). 4. Wanneer 'n model is geskik met behulp van die ARIMA metode, XLMiner vertoon die ACF en PACF erwe vir residue. As hierdie erwe is in die band van UCL en LCL, dan is die residue is lukraak en die model is voldoende. 5. Indien die residue is nie binne die bands, dan 'n paar korrelasies bestaan, en die model moet verbeter. In die eerste plek uit te voer 'n partisie op die data. Kies 'n sel in die datastel, dan op die XLMiner ribboon, uit die blad tydreekse, kies Partition om die Tydreekse dialoog Partition Data oopmaak. Onder die lys veranderlikes, kies Jaar en klik GT te skuif na Tyd veranderlike. Kies die oorblywende veranderlikes onder die lys veranderlikes, en klik GT om hulle in te sluit in die veranderlikes in die lys Partition Data. Onder Spesifiseer Verdeling Options, kies Gee Records om die aantal rekords aan die opleiding en Validation Stel spesifiseer. Onder Spesifiseer Records vir afskortings, kies Gee rekords, dan tree 50 vir die aantal Opleiding Stel rekords en 21 vir die aantal Validation Stel rekords. As Spesifiseer persentasies is onder gekies Spesifiseer Verdeling Options, XLMiner ken 'n persentasie van rekords aan elke stel volgens die waardes wat deur die gebruiker of ingegaan outomaties deur XLMiner onder spesifiseer persentasie Verdeling geloop. Klik op OK. Die DataPartitionTS werkblad is ingevoeg aan die regterkant van die Inkomstebelastingwet werkblad. In die produksie bo, die skeiding metode is opeenvolgende (versus ewekansige). Die eerste 50 waarnemings toegeken aan die opleiding Stel en die oorblywende 21 waarnemings toegeken aan die Validation Stel. Kies 'n sel op die DataPartitionTS werkblad, dan op die XLMiner lint, uit die blad tydreekse, kies ARIMA - outokorrelasies om die dialoog ACF vertoon. Kies CA as die geselekteerde veranderlike, betree 10 vir beide ACF Parameters vir Opleiding Data en data validering. Plot ACF grafiek is standaard gekies. Klik op OK. Die werkblad ACFOutput word na die DataPartitionTS werkblad. Let op elke grafiek wat die outokorrelasie afneem as die aantal lags verhoog. Dit dui daarop dat 'n definitiewe patroon bestaan ​​in elke partisie. Maar sedert die patroon nie herhaal, dit kan aanvaar word dat geen seisoenaliteit is ingesluit in die data. Daarbenewens, aangesien beide kaarte toon 'n soortgelyke patroon, ons kan dieselfde model vir beide die Validering en Opleiding Stelle pas. Klik terug na die DataPartitionTS werkblad en op die XLMiner lint, uit die blad tydreekse, kies ARIMA - Gedeeltelike outokorrelasies om die dialoog PACF oopmaak. Kies CA van die veranderlikes in invoerdata lys, kliek GT om die veranderlike te Uitgesoekte veranderlike beweeg. Gee 40 vir Maksimum Lag onder PACF Parameters vir Opleiding Data, en 15 vir PACF Parameters vir datavalidering. Plot PACF grafiek is standaard gekies. Klik op OK. Die werkblad ACFOutput is direk ingevoeg aan die regterkant van die DataPartitionTS werkblad. Beide PACF erwe wys soortgelyke patrone in beide die Validering en Opleiding Stelle. As gevolg hiervan, kan ons dieselfde model vir beide stelle gebruik. PACF Uitgawe vir Opleiding Data PACF Uitgawe vir datavalidering Die PACF funksie toon 'n definitiewe patroon, wat beteken dat daar 'n tendens in die data. Maar sedert die patroon nie herhaal, kan ons aflei dat die data enige seisoen nie wys. Beide die ACF en PACF kaarte dui daarop dat 'n definitiewe patroon bestaan, maar sonder enige seisoen. Beide datastelle toon dieselfde gedrag in beide die opleiding en Validation stelle, wat daarop dui dat dieselfde model geskik is vir elkeen. Nou is ons gereed om die model aan te pas. Die ARIMA model aanvaar drie parameters: p - die aantal outoregressiewe terme d - die aantal nie-seisoenale verskil, en Q - die aantal uitgestel foute (bewegende gemiddeldes). Onthou dat die ACF plot het geen seisoenaliteit in die data, wat beteken dat outokorrelasie is byna staties, dalende met die aantal lags toeneem. Dit dui daarop omgewing Q 0 want daar blyk te wees nie uitgestel foute wees. Die PACF plot vertoon 'n groot waarde vir die eerste lag, maar minimale erwe vir opeenvolgende lags. Dit dui daarop opstel p 1. Met die meeste datastelle, die opstel van d 1 voldoende of kan ten minste 'n beginpunt wees. Klik terug na die DataPartitionTS werkblad en op die XLMiner lint, uit die blad tydreekse, kies ARIMA - ARIMA model om die Time Series bring - dialoog ARIMA. Kies CA van die veranderlikes in invoerdata lys, kliek GT om die veranderlike te skuif na die geselekteerde veranderlike veld. Onder Nie seisoenale parameters outoregressiewe (p) tot 1, verskil (d) tot 1, en bewegende gemiddelde (q) om 0. Klik Gevorderde om die ARIMA oop - dialoog Gevorderde Opsies. Kies toegerus Waardes en residue, voorspellings, en Rapporteer voorspelling vertrouensintervalle. Die verstek Vertroue Vlak omgewing van 95 is outomaties ingeskryf. Variansie-kovariansiematriks is standaard gekies. Klik OK op die dialoog ARIMA-Advanced Options en weer op die Time Series - dialoog ARIMA. XLMiner bereken en vertoon verskeie parameters en kaarte in twee uitset velle, ARIMAOutput en ARIMAResiduals. Die ARIMAOutput werkblad bevat die ARIMA model, hieronder getoon. Op dieselfde werkblad, het XLMiner die konstante term en die AR1 term vir ons model bereken. Dit is die konstante en F1 terme van die voorspelling vergelyking. Sien die volgende uitset van die Chi-kwadraat toets. Die klein p-waarde vir die konstante term (0,9704) en AR1 termyn (0) dui daarop dat die model is 'n goeie passing vir ons data. Maak die werkblad ARIMAResiduals. Hierdie tabel plotte die werklike en toegerus waardes en die gevolglike residue. Soos getoon in die onderstaande grafiek, die werklike en die geskatte waardes grootgeword het redelik goed. Die nut van die model in vooruitskatting sal afhang van hoe naby die werklike en geskatte waardes is in die tyd plot van Validation Stel. Volgende, sal ons die ACF en PACF erwe vir foute gevind aan die onderkant van die ARIMAOutput werkblad te sien. Alle lags, behalwe lag 1, is duidelik binne die UCL en LCL bands. Dit dui daarop dat die residue is lukraak en nie gekorreleer, wat is die eerste aanduiding dat die model parameters is voldoende vir hierdie data. Sien die voorspelling tabel op die ARIMAOutput werkblad. Die tabel toon die werklike en geskatte waarde. Die onderste en boonste waardes verteenwoordig die onderste en boonste grense van die vertroue interval. Daar is 'n 95 kans dat die geskatte waarde in hierdie reeks sal val. Die tyd komplot om die regte toon hoe die model wat ons toegerus met die opleiding Stel en uitgevoer op die Validation Stel. Die werklike en geskatte waardes is redelik naby, wat bevestig dat ons model goed vir vooruitskatting moet wees. Om die waardes plot onder die onderste en boonste kolom in dieselfde grafiek, kies die grafiek, dan op die Excel lint, Kies 'n ontwerp - Kies data na die dialoog Data Bron kies oopmaak. Vir Chart data reeks, voer ARIMAOutputB56: G77. dan verwyder jy Fout onder legende inskrywings. Klik op OK. Dit plot toon dat die werklike en die geskatte waardes binne die onderste en boonste 95 Vertroue Vlak bands lê. Alhoewel die werklike waardes doen wissel 'n bietjie, hierdie waardes val binne die middel van die reeks. Ons kan aflei uit die ARIMA uitset, wat ons model met behulp van parameters (1, 1, 0) het getoon dat voldoende pas die data.


No comments:

Post a Comment