Free Statistics

of Irreproducible Research!

Author's title

Author*Unverified author*
R Software Modulerwasp_arimaforecasting.wasp
Title produced by softwareARIMA Forecasting
Date of computationTue, 16 Dec 2008 07:16:09 -0700
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Dec/16/t12294370027ggr1wcgvwt0w26.htm/, Retrieved Thu, 16 May 2024 01:23:09 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=33956, Retrieved Thu, 16 May 2024 01:23:09 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact182
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F       [ARIMA Forecasting] [] [2008-12-16 14:16:09] [d41d8cd98f00b204e9800998ecf8427e] [Current]
F   PD    [ARIMA Forecasting] [workshop 9-step 1] [2008-12-16 19:08:42] [5b94fe8ce1508f2fbd1490c4566fbba6]
Feedback Forum
2008-12-18 08:12:48 [Carole Thielens] [reply
STEP 1

Vooreerst had de student kunnen vermelden dat bij het invoeren van de gegevens de testing period gelijkgesteld dient te worden aan 12, waardoor de laatste 12 maanden van de tijdsreeks worden afgeknipt. Vervolgens wordt voor die twaalf laatste maanden, zonder rekening te houden met de ‘afgeknipte’ gegevens, een voorspelling gemaakt op basis van de metingen uit het verleden. In de tabel zien we daarom enkel gegevens voor die laatste 12 maanden. De waarden voor de maanden daarvoor staan er ook wel, maar daar wordt geen rekening mee gehouden.

De student vermeldt correct dat het blauwgrijze gedeelte aan de rechterkant de voorspelde periode voorstelt. Het oranje vlak binnen de stippellijnen stelt vervolgens het betrouwbaarheidsinterval voor. De zwarte lijn staat voor de werkelijke waarden, terwijl de witte lijn de voorspelde waarden vertegenwoordigt.

Ook heeft de student op de tweede grafiek correct waargenomen dat de voorspelde en werkelijke waarden zeer nauw samenlopen. Eveneens vergroot het betrouwbaarheidsinterval doorheen de tijd, wat volgens de student zou kunnen wijzen op heteroskedasticiteit. Hier kan ik echter geen beoordeling over geven, gezien we dit begrip in de les niet in detail besproken hebben.

STEP 2

De student beweert dat deze tijdsreeks niet gekenmerkt wordt door een trend. Ik beweer het tegendeel. Er is wel degelijk een trendmatig verloop op te merken. We zien bijvoorbeeld in het begin van de tijdsreeks een top, waarna de tijdreeks waar daalt en vervolgens stijgt de tijdsreeks opnieuw. Er is met andere woorden een terugkomend verloop of beter gezegd een trendmatig verloop.
Over seizonaliteit zei de student niets. Ik geloof dat het wel duidelijk is dat er in deze tijdsreeks geen seizonaliteit bestaat.

STEP 3

Deze stap loste de student niet op. Hij kopieerde uitsluitend de tabellen die de software genereerde. Daarom maak ik hierbij enkele aanvullingen:

Uit de tweede tabel hebben we enkel de eerste twee kolommen nodig, op de kolom met de tijdsaanduiding na. De kolom %S.E. staat voor de procentuele standaardfout bij de voorspellingen. Het gaat hier met andere woorden om het percentage dat je ernaast mag zitten bij je voorspellingen. Logischerwijze vergroot dit percentage hoe verder in de toekomst je wil voorspellen, omdat je nog niet kan weten wat er in de verre toekomst zal gebeuren.
Wat mij opvalt, is dat dit percentage wel heel groot wordt. In de laatste periode wordt dit percentage zelfs 156% ! De procentuele standaardfout bij deze voorspelling is zeer groot.

De kolom P.E. staat voor de werkelijke procentuele fouten die gemaakt zijn bij het voorspellen. Het beste is dat deze in absolute waarde zo klein mogelijk zijn. Dit wil zeggen dat de voorspelde en de werkelijke waarde dan dicht bij elkaar liggen. Indien niet, heb je niet zo’n goede voorspelling gemaakt en dan liggen de voorspelde en de werkelijke waarden ver uit elkaar. Wat opvalt, is dat er zeer veel weinig fouten gemaakt zijn. Dit is met andere woorden een goede voorspelling.


STEP 4

Ook deze stap werd niet uitgewerkt. Daarom geef ik opnieuw ter verduidelijking een mogelijke uitwerking:


De kolom met de p-waarde geeft de kans weer dat de voorspelde waarde niet significant verschillend is van de werkelijke waarde. Indien de p-waarde groter is dan 0.05, dan is het verschil inderdaad niet significant, en spreken we dus van een goede voorspelling. Indien de p-waarde echter kleiner is dan 0.05, is het verschil tussen de voorspelde en de werkelijke waarde wel significant, en hebben we dus voor die maand geen goede voorspelling gemaakt. Alle p-waarden in deze kolom zijn groter dan 0.05, wat er op wijst dat een goede voorspelling gemaakt werd.

* De zevende kolom geeft de kans weer dat de voorspelde waarde hoger ligt dan de werkelijke waarde van de periode daarvoor. Deze kansen zijn niet erg hoog. Dit is een aanduiding voor het ontbreken van een lange termijn trend in de tijdsreeks.

* Kolom 8 beschrijft de kans dat je gestegen bent ten opzichte van het jaar voordien. Deze percentages zijn overal vrij laag.

*De laatste kolom ten slotte geeft de waarschijnlijkheid weer dat je gestegen bent ten opzichte van de laatste gekende waarde. Ook hier zien we weer zeer lage waarden. Er is met andere woorden geen stijgende trend in de tijdsreeks aanwezig.

STEP 5

De conclusie van de student bij stap 5 is correct.

2008-12-18 12:11:48 [Jonas Scheltjens] [reply
Step 1:
De student licht de grafiek zeer goed toe. Wat we nog kunnen toevoegen is dat de voorspelde waarden klaarblijkelijk steeds onder de werkelijke waarden liggen, maar de voorspelling is alleszins niet explosief en vertoont ook zeker geen grote schommelingen. We kunnen zien dat de voorspelling goed in lijn ligt met de voorgaande trend in de gegevensreeks.
Ook zou kunnen worden toegelicht dat aangezien we de testing period instellen op 12, dat de 12 laatste maanden niet worden opgenomen in de berekening van de voorspelling. We kunnen zo de voorspelling gaan vergelijken met de weggelaten waarden Of dit al dan niet betrouwbaar is gaan we na met behulp van de tabellen en grafieken.

De problematiek van het te grote betrouwbaarheidsinterval is hier inderdaad wel erg groot. Een oplossing hiervoor kan zijn dat de lambda-waarde toch aangepast moet worden. Een meer gepaste lambda-waarde zal zorgen voor een nauwkeuriger betrouwbaarheidsinterval.

De tabel ‘Univariate ARIMA Extrapolation Forecast’ (dewelke dus zou kunnen opgenomen worden bij step 1), geeft de lower- en upper bound weer wat dus wil zeggen dat dit de onder- en bovengrens van het betrouwbaarheidsinterval zijn. Aan de hand van deze tabllen (in combinatie van deze met de voorspelde waarde) kunnen we nagaan of de verkregen (voorspelde) waarden al dan niet significant verschillend zijn. Om het anders te zeggen: dit interval geeft aan dat de volgende waarde met een waarschijnlijkheid van 95% zich tussen deze grenzen zal bevinden, buiten indien er zich een exceptionaliteit voordoet. Uit de tabel kunnen we dan ook afleiden dat er in de 12 voorspelde perioden, de waarden allen binnen dit interval liggen.
Ook in deze tabel zien we dat het betrouwbaarheidsinterval wel erg groot is.

De ARIMA Extrapolation Forecast werd ook goed besproken. De waarden liggen inderdaad allen onder de werkelijke waarden. Ook is het juist dat het betrouwbaarheidsinterval steeds groter wordt. Eventueel kan nog vermeldt worden dat alle waarden binnen het betrouwbaarheidsinterval liggen.

Step 2:
Hier was het de bedoeling om de 2 grafieken grondig te bespreken.
Wat de student zegt is inderdaad juist. Er is niet echt sprake van een trend, zowel niet-seizoenaal als seizonaal. Verdere bespreking van deze grafieken werd al gegeven in step 1.

Step 3:
Deze step werd niet besproken door de student.
Het was hier echter de bedoeling om de ‘Univariate ARIMA Extrapolation Forecast Performance’ te bespreken.
De ‘Univariate ARIMA Extrapolation Forecast Performance’ bevat de theoretische schatting op basis van de theoretische assumpties met de procentuele waarden van de afwijkingen.
In deze tabel bepaalt de eerste kolom hoe groot de kans is dat we met onze schatting van de voorspelde waarden ernaast zitten (Standard Error).
In de 2de kolom van deze tabel zien we de werkelijke fout die we hebben gemaakt bij het schatten van de waarden.

Step 4 werd niet besproken door de student. Hier was het echter de bedoeling om de tabel ‘Univariate ARIMA Extrapolation Forecast’ te bespreken.
Hier volgt een korte bespreking van wat er in de kolommen staat.

De eerste kolom geeft de nummer van de maand weer.
De tweede kolom bevat de werkelijke waarde van deze maand.
In de derde kolom staat de voorspelde waarde.
De vierde en de vijfde kolom bevatten respectievelijk de lower- en upper bound voor de waarden die de onder- en bovengrens van het betrouwbaarheidsinterval voorstellen. Samen met de kolom van de voorspelde waarde kan men dan nagaan of de verkregen waarden al dan niet significant verschillend zijn. Praktisch gezien wil dit interval hier zeggen dat de volgende waarde met een waarschijnlijkheid van 95% zich tussen deze grenzen zal bevinden, buiten indien er zich een exceptionaliteit voordoet.
In de zesde kolom wordt de p-waarde van toetsing aan de nulhypothese weergegeven. De stelling die hier gesteld wordt luidt als volgt: ‘de waarde van Yt is gelijk aan de waarde van Ft, tenzij er zich iets exceptioneels voordoet’, wat dus neerkomt op een ceteris paribus-stelling. Het komt er dus op neer dat de stelling zegt dat het verschil tussen de voorspelde en de werkelijke waarde niet significant is. De bijhorende p-waarde zegt dan hoeveel procent kans er is dat indein men de stelling verwerpt en dus zegt dat het verschil wel significant is, men zich vergist.
In de 7de kolom kunnen we dan de p-waarde terugvinden die de waarschijnlijkheid aangeeft dat de Ft groter is dan de gekende waarde van de voorgaande periode.
In de achtste kolom krijgen we de waarden te zien hoe groot de kans is dat in deze maanden de waarden die zijn verkregen groter zijn dan de waarden van een jaar eerder. Indien er zich hoge waarden voordoen duidt dit erop dat de voorspelling een stijgende trend kent.
In de negende en laatste kolom kunnen we dan de waarschijnlijkheid waarnemen dat Ft groter is dan Y48 ( de laatst gekende waarde).

Bij step 5 moest men de grafieken bespreken en deze vergelijken met de werkelijke waarden. De student blijft hier echter zeer beperkt.

ARIMA Extrapolation Forecast: de stippelijnen geven hier de lower- en upper bound (de boven- en ondergrens) van het betrouwbaarheidsinterval weer. We moeten dus gaan zoeken naar waar de voorspelde waarden dit interval overschrijden. We zien dat de waarden goed binnen het betrouwbaarheidsinterval liggen en dus niet significant verschillend zijn. Ook liggen ze dicht bij de werkelijke waarden, wat dus wil zeggen dat dit een goed model is.
Ook in de andere grafiek kan men waarnemen dat de witte lijnen erg gelijken zijn met de zwarte. We kunnen dus nogmaals stellen dat het hier om een goed model gaat.
Het probleem met het betrouwbaarheidsinterval is er nog wel, maar een manier om dit te verbeteren werd al gegeven in de bespreking van step 1.
2008-12-20 19:33:46 [Kevin Vermeiren] [reply
stap 1
De student geeft een kort en onvolledig antwoord. Het klopt dat de zwarte lijn de gekende waarden aangeeft en de witte de voorspelde. Verder is het ook juist dat het oranje gedeelte het betrouwbaarheidsinterval weergeeft. Toch had hier nog vermeld mogen worden dat het hier de bedoeling was te kijken of de voorspelling die berekend wordt explosief verloopt of met grote schommelingen. In dit geval zien we dat dit zeker niet het geval is. Hier had ook nog gezegd kunnen worden dat testing period op 12 ingesteld moet worden aangezien we de laatste 12 maanden wegknippen en hier een voorspelling van te maken zonder rekening te houden met de weggelaten waarden. Vervolgens is het de bedoeling deze voorspelde waarden te vergelijken met deze die weggelaten zijn. We zien ook dat de voorspelde waarden dezelfde trend volgen dan de reeds bekende waarden. We besluiten dat de trend van de tijdreeks blijft behouden tenzij er zich bijzondere gebeurtenissen voordoen.
De tabel ‘Univariate ARIMA Extrapolation Forecast’ kon ook nog besproken worden. Deze tabel geeft de de lower- en upper bound weer die dus de onder- en bovengrens van het 95% betrouwbaarheidsinterval voorstellen. Dit interval moet als volgt geinterpreteerd worden: we kunnen zeggen dat de waarde met een waarschijnlijkheid van 95% binnen het interval zal bevinden, buiten indien er zich een exceptionaliteit voordoet. Uit de tabel kunnen we dan ook afleiden dat er in de 12 voorspelde perioden, de waarden allemaal binnen dit interval liggen.
Het klopt dat in de ARIMA extrpolation forecast te zien is dat de voorspelde waarden iets onder de gekende waarden liggen. Dit is echter geen probleem zolang ze binnen het betrouwbaarheidsinterval gelegen zijn (dit is hier het geval).
Verder is het ook juist dat het betrouwbaarheidsinterval naarmate het dichter bij het einde van de tijdreeks komt steeds groter wordt.

Stap 2
De student geeft hier een zeer beperkt antwoord. Het is wel correct dat de grafiek niet echt een trend weergeeft. Dit was mischien wel te verwachten. Hier had ook nog vermeld kunnen worden hoe de grafieken tot stand kwamen. Doordat de laatste 12 maanden weggelaten worden kan er voor deze maanden opnieuw een voorspelling gemaakt worden. Vervolgens worden dan deze resultaten met elkaar vergeleken, welk visueel waarneembaar is in de grafieken. Hier valt op dat er weliswaar geen trend aanwezig is maar dat de voorspelde waarden wel goed de gekende waarden representeren.

stap 3
Hier geeft de student enkel de tabellen. Hier hoefde eigelijk de tabel “Univariate ARIMA Extrapolation Forecast” niet gegeven te worden. De bespreking van de SE ontbreekt.
De standard error geeft aan hoeveel procent kans er is dat de voorspelling foutief is. We zien dat deze waarden zeer hoog zijn. De kans op fouten is dus zeer groot.

stap 4

Hier geeft de student geen antwoord. Hier volgt een kort overzicht van de tabel:
1ste kolom = nummer van de maand
2de kolom = werkelijke waarde van deze maand.
3de kolom staat de voorspelde waarde.
De 4de en de 5de kolom vormen het betrouwbaarheidsinterval. Hier moet je kijken of de voorspelde waarden binnen de lower en de upperbound gelegen zijn. Het interval moet als volgt geinterpreteerd worden: de waarde ligt met een waarschijnlijkheid van 95% tussen deze grenzen, tenzij er zich een bijzondere gebeurtenis voordoet.
6de kolom = de p-waarde van de nulhypothese (Yt=Ft, tenzij er zich bijzondere gebeurtenissen voordoen= ceteris paribus-stelling). Deze wil zeggen dat het verschil tussen de voorspelde en de werkelijke waarde niet significant is. De bijhorende p-waarde zegt dan hoeveel procent kans er is dat men zicht vergist bij het verwerpen van deze nulhypothese.
7de kolom geeft de kans weer dat Ft > de gekende waarde van periode t-1.
8ste kolom = de waarden van de kans dat in deze maanden de waarden die zijn bekomen groter zijn dan de waarden van een jaar vroeger. Hoge waarden duiden op een stijgende trend in de voorspelling
9de kolom= de waarschijnlijkheid Ft >Y48 met namde de laatst gekende waarde.

Stap 5
Student geeft een zeer beperkt antwoord. Hier had nog vermeld kunnen worden dat er gekeken moet worden naar het feit of de voorspelde waarden significant verschillen van de werkelijke waarden. Dit is makkelijk te doen aan de hand van het betrouwbaarheidsinterval, welk wordt weergegeven door de stippellijnen. Indien de voorspelde waarden deze lijnen overschrijden dan kunnen we spreken van een significant verschil. Dit is hier echter niet het geval. We zien inderdaad dat de voorspelling de gekende waarden goed volgt. We zouden op basis van deze grafiek inderdaad kunnen concluderen dat het een vrij goed model is.
2008-12-21 11:07:44 [] [reply
Bij de bespreking van stap 4 is er een fout gebeurd. Kolom 9 van de grafiek geeft weer: de waarschijnlijkheid Ft >Y85 met name de laatst gekende waarde en niet de waarschijnlijkheid Ft >Y48!

Post a new message
Dataseries X:
5,1
4,9
5,2
5,1
4,6
3,7
3,9
3,1
2,8
2,6
2,2
1,8
1,3
1,2
1,4
1,3
1,3
1,9
1,9
2,1
2,0
1,9
1,9
1,9
1,8
1,7
1,6
1,7
1,9
1,7
1,3
2,0
2,0
2,3
2,0
1,7
2,3
2,4
2,4
2,3
2,1
2,1
2,5
2,0
1,8
1,7
1,9
2,1
1,4
1,6
1,7
1,6
1,9
1,6
1,1
1,3
1,6
1,6
1,7
1,6
1,7
1,6
1,5
1,6
1,1
1,5
1,4
1,3
0,9
1,2
0,9
1,1
1,3
1,3
1,4
1,2
1,7
2,0
3,0
3,1
3,2
2,7
2,8
3,0
2,8
3,1
3,1
3,2
3,1
2,7
2,2
2,2
2,1
2,3
2,5
2,3
2,6




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time1 seconds
R Server'George Udny Yule' @ 72.249.76.132

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 1 seconds \tabularnewline
R Server & 'George Udny Yule' @ 72.249.76.132 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=33956&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]1 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'George Udny Yule' @ 72.249.76.132[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=33956&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=33956&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time1 seconds
R Server'George Udny Yule' @ 72.249.76.132







Univariate ARIMA Extrapolation Forecast
timeY[t]F[t]95% LB95% UBp-value(H0: Y[t] = F[t])P(F[t]>Y[t-1])P(F[t]>Y[t-s])P(F[t]>Y[85])
731.3-------
741.3-------
751.4-------
761.2-------
771.7-------
782-------
793-------
803.1-------
813.2-------
822.7-------
832.8-------
843-------
852.8-------
863.12.76851.90384.39030.34440.48480.9620.4848
873.12.65951.67424.86110.34750.34750.86890.4502
883.22.89921.666.29830.43110.45390.83640.5228
893.12.41791.36095.43320.32870.30560.67960.4019
902.72.25451.22735.4250.39150.30060.56250.368
912.21.95271.05654.75970.43140.30090.23230.277
922.21.93321.0095.09810.43440.43440.2350.2957
932.11.91490.96725.44690.45910.43720.23790.3117
942.32.01950.97136.48430.4510.48590.38260.3659
952.51.99570.93396.89060.420.45150.37370.3737
962.31.95270.89387.16850.44810.41850.34690.3751
972.61.99570.88248.10820.42320.46110.39820.3982

\begin{tabular}{lllllllll}
\hline
Univariate ARIMA Extrapolation Forecast \tabularnewline
time & Y[t] & F[t] & 95% LB & 95% UB & p-value(H0: Y[t] = F[t]) & P(F[t]>Y[t-1]) & P(F[t]>Y[t-s]) & P(F[t]>Y[85]) \tabularnewline
73 & 1.3 & - & - & - & - & - & - & - \tabularnewline
74 & 1.3 & - & - & - & - & - & - & - \tabularnewline
75 & 1.4 & - & - & - & - & - & - & - \tabularnewline
76 & 1.2 & - & - & - & - & - & - & - \tabularnewline
77 & 1.7 & - & - & - & - & - & - & - \tabularnewline
78 & 2 & - & - & - & - & - & - & - \tabularnewline
79 & 3 & - & - & - & - & - & - & - \tabularnewline
80 & 3.1 & - & - & - & - & - & - & - \tabularnewline
81 & 3.2 & - & - & - & - & - & - & - \tabularnewline
82 & 2.7 & - & - & - & - & - & - & - \tabularnewline
83 & 2.8 & - & - & - & - & - & - & - \tabularnewline
84 & 3 & - & - & - & - & - & - & - \tabularnewline
85 & 2.8 & - & - & - & - & - & - & - \tabularnewline
86 & 3.1 & 2.7685 & 1.9038 & 4.3903 & 0.3444 & 0.4848 & 0.962 & 0.4848 \tabularnewline
87 & 3.1 & 2.6595 & 1.6742 & 4.8611 & 0.3475 & 0.3475 & 0.8689 & 0.4502 \tabularnewline
88 & 3.2 & 2.8992 & 1.66 & 6.2983 & 0.4311 & 0.4539 & 0.8364 & 0.5228 \tabularnewline
89 & 3.1 & 2.4179 & 1.3609 & 5.4332 & 0.3287 & 0.3056 & 0.6796 & 0.4019 \tabularnewline
90 & 2.7 & 2.2545 & 1.2273 & 5.425 & 0.3915 & 0.3006 & 0.5625 & 0.368 \tabularnewline
91 & 2.2 & 1.9527 & 1.0565 & 4.7597 & 0.4314 & 0.3009 & 0.2323 & 0.277 \tabularnewline
92 & 2.2 & 1.9332 & 1.009 & 5.0981 & 0.4344 & 0.4344 & 0.235 & 0.2957 \tabularnewline
93 & 2.1 & 1.9149 & 0.9672 & 5.4469 & 0.4591 & 0.4372 & 0.2379 & 0.3117 \tabularnewline
94 & 2.3 & 2.0195 & 0.9713 & 6.4843 & 0.451 & 0.4859 & 0.3826 & 0.3659 \tabularnewline
95 & 2.5 & 1.9957 & 0.9339 & 6.8906 & 0.42 & 0.4515 & 0.3737 & 0.3737 \tabularnewline
96 & 2.3 & 1.9527 & 0.8938 & 7.1685 & 0.4481 & 0.4185 & 0.3469 & 0.3751 \tabularnewline
97 & 2.6 & 1.9957 & 0.8824 & 8.1082 & 0.4232 & 0.4611 & 0.3982 & 0.3982 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=33956&T=1

[TABLE]
[ROW][C]Univariate ARIMA Extrapolation Forecast[/C][/ROW]
[ROW][C]time[/C][C]Y[t][/C][C]F[t][/C][C]95% LB[/C][C]95% UB[/C][C]p-value(H0: Y[t] = F[t])[/C][C]P(F[t]>Y[t-1])[/C][C]P(F[t]>Y[t-s])[/C][C]P(F[t]>Y[85])[/C][/ROW]
[ROW][C]73[/C][C]1.3[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]74[/C][C]1.3[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]75[/C][C]1.4[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]76[/C][C]1.2[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]77[/C][C]1.7[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]78[/C][C]2[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]79[/C][C]3[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]80[/C][C]3.1[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]81[/C][C]3.2[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]82[/C][C]2.7[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]83[/C][C]2.8[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]84[/C][C]3[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]85[/C][C]2.8[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]86[/C][C]3.1[/C][C]2.7685[/C][C]1.9038[/C][C]4.3903[/C][C]0.3444[/C][C]0.4848[/C][C]0.962[/C][C]0.4848[/C][/ROW]
[ROW][C]87[/C][C]3.1[/C][C]2.6595[/C][C]1.6742[/C][C]4.8611[/C][C]0.3475[/C][C]0.3475[/C][C]0.8689[/C][C]0.4502[/C][/ROW]
[ROW][C]88[/C][C]3.2[/C][C]2.8992[/C][C]1.66[/C][C]6.2983[/C][C]0.4311[/C][C]0.4539[/C][C]0.8364[/C][C]0.5228[/C][/ROW]
[ROW][C]89[/C][C]3.1[/C][C]2.4179[/C][C]1.3609[/C][C]5.4332[/C][C]0.3287[/C][C]0.3056[/C][C]0.6796[/C][C]0.4019[/C][/ROW]
[ROW][C]90[/C][C]2.7[/C][C]2.2545[/C][C]1.2273[/C][C]5.425[/C][C]0.3915[/C][C]0.3006[/C][C]0.5625[/C][C]0.368[/C][/ROW]
[ROW][C]91[/C][C]2.2[/C][C]1.9527[/C][C]1.0565[/C][C]4.7597[/C][C]0.4314[/C][C]0.3009[/C][C]0.2323[/C][C]0.277[/C][/ROW]
[ROW][C]92[/C][C]2.2[/C][C]1.9332[/C][C]1.009[/C][C]5.0981[/C][C]0.4344[/C][C]0.4344[/C][C]0.235[/C][C]0.2957[/C][/ROW]
[ROW][C]93[/C][C]2.1[/C][C]1.9149[/C][C]0.9672[/C][C]5.4469[/C][C]0.4591[/C][C]0.4372[/C][C]0.2379[/C][C]0.3117[/C][/ROW]
[ROW][C]94[/C][C]2.3[/C][C]2.0195[/C][C]0.9713[/C][C]6.4843[/C][C]0.451[/C][C]0.4859[/C][C]0.3826[/C][C]0.3659[/C][/ROW]
[ROW][C]95[/C][C]2.5[/C][C]1.9957[/C][C]0.9339[/C][C]6.8906[/C][C]0.42[/C][C]0.4515[/C][C]0.3737[/C][C]0.3737[/C][/ROW]
[ROW][C]96[/C][C]2.3[/C][C]1.9527[/C][C]0.8938[/C][C]7.1685[/C][C]0.4481[/C][C]0.4185[/C][C]0.3469[/C][C]0.3751[/C][/ROW]
[ROW][C]97[/C][C]2.6[/C][C]1.9957[/C][C]0.8824[/C][C]8.1082[/C][C]0.4232[/C][C]0.4611[/C][C]0.3982[/C][C]0.3982[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=33956&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=33956&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Univariate ARIMA Extrapolation Forecast
timeY[t]F[t]95% LB95% UBp-value(H0: Y[t] = F[t])P(F[t]>Y[t-1])P(F[t]>Y[t-s])P(F[t]>Y[85])
731.3-------
741.3-------
751.4-------
761.2-------
771.7-------
782-------
793-------
803.1-------
813.2-------
822.7-------
832.8-------
843-------
852.8-------
863.12.76851.90384.39030.34440.48480.9620.4848
873.12.65951.67424.86110.34750.34750.86890.4502
883.22.89921.666.29830.43110.45390.83640.5228
893.12.41791.36095.43320.32870.30560.67960.4019
902.72.25451.22735.4250.39150.30060.56250.368
912.21.95271.05654.75970.43140.30090.23230.277
922.21.93321.0095.09810.43440.43440.2350.2957
932.11.91490.96725.44690.45910.43720.23790.3117
942.32.01950.97136.48430.4510.48590.38260.3659
952.51.99570.93396.89060.420.45150.37370.3737
962.31.95270.89387.16850.44810.41850.34690.3751
972.61.99570.88248.10820.42320.46110.39820.3982







Univariate ARIMA Extrapolation Forecast Performance
time% S.E.PEMAPESq.EMSERMSE
860.29890.11970.010.10990.00920.0957
870.42240.16570.01380.19410.01620.1272
880.59820.10380.00860.09050.00750.0868
890.63630.28210.02350.46530.03880.1969
900.71750.19760.01650.19850.01650.1286
910.73340.12670.01060.06120.00510.0714
920.83530.1380.01150.07120.00590.077
930.9410.09660.00810.03420.00290.0534
941.1280.13890.01160.07870.00660.081
951.25140.25270.02110.25440.02120.1456
961.36280.17790.01480.12060.01010.1003
971.56270.30280.02520.36520.03040.1745

\begin{tabular}{lllllllll}
\hline
Univariate ARIMA Extrapolation Forecast Performance \tabularnewline
time & % S.E. & PE & MAPE & Sq.E & MSE & RMSE \tabularnewline
86 & 0.2989 & 0.1197 & 0.01 & 0.1099 & 0.0092 & 0.0957 \tabularnewline
87 & 0.4224 & 0.1657 & 0.0138 & 0.1941 & 0.0162 & 0.1272 \tabularnewline
88 & 0.5982 & 0.1038 & 0.0086 & 0.0905 & 0.0075 & 0.0868 \tabularnewline
89 & 0.6363 & 0.2821 & 0.0235 & 0.4653 & 0.0388 & 0.1969 \tabularnewline
90 & 0.7175 & 0.1976 & 0.0165 & 0.1985 & 0.0165 & 0.1286 \tabularnewline
91 & 0.7334 & 0.1267 & 0.0106 & 0.0612 & 0.0051 & 0.0714 \tabularnewline
92 & 0.8353 & 0.138 & 0.0115 & 0.0712 & 0.0059 & 0.077 \tabularnewline
93 & 0.941 & 0.0966 & 0.0081 & 0.0342 & 0.0029 & 0.0534 \tabularnewline
94 & 1.128 & 0.1389 & 0.0116 & 0.0787 & 0.0066 & 0.081 \tabularnewline
95 & 1.2514 & 0.2527 & 0.0211 & 0.2544 & 0.0212 & 0.1456 \tabularnewline
96 & 1.3628 & 0.1779 & 0.0148 & 0.1206 & 0.0101 & 0.1003 \tabularnewline
97 & 1.5627 & 0.3028 & 0.0252 & 0.3652 & 0.0304 & 0.1745 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=33956&T=2

[TABLE]
[ROW][C]Univariate ARIMA Extrapolation Forecast Performance[/C][/ROW]
[ROW][C]time[/C][C]% S.E.[/C][C]PE[/C][C]MAPE[/C][C]Sq.E[/C][C]MSE[/C][C]RMSE[/C][/ROW]
[ROW][C]86[/C][C]0.2989[/C][C]0.1197[/C][C]0.01[/C][C]0.1099[/C][C]0.0092[/C][C]0.0957[/C][/ROW]
[ROW][C]87[/C][C]0.4224[/C][C]0.1657[/C][C]0.0138[/C][C]0.1941[/C][C]0.0162[/C][C]0.1272[/C][/ROW]
[ROW][C]88[/C][C]0.5982[/C][C]0.1038[/C][C]0.0086[/C][C]0.0905[/C][C]0.0075[/C][C]0.0868[/C][/ROW]
[ROW][C]89[/C][C]0.6363[/C][C]0.2821[/C][C]0.0235[/C][C]0.4653[/C][C]0.0388[/C][C]0.1969[/C][/ROW]
[ROW][C]90[/C][C]0.7175[/C][C]0.1976[/C][C]0.0165[/C][C]0.1985[/C][C]0.0165[/C][C]0.1286[/C][/ROW]
[ROW][C]91[/C][C]0.7334[/C][C]0.1267[/C][C]0.0106[/C][C]0.0612[/C][C]0.0051[/C][C]0.0714[/C][/ROW]
[ROW][C]92[/C][C]0.8353[/C][C]0.138[/C][C]0.0115[/C][C]0.0712[/C][C]0.0059[/C][C]0.077[/C][/ROW]
[ROW][C]93[/C][C]0.941[/C][C]0.0966[/C][C]0.0081[/C][C]0.0342[/C][C]0.0029[/C][C]0.0534[/C][/ROW]
[ROW][C]94[/C][C]1.128[/C][C]0.1389[/C][C]0.0116[/C][C]0.0787[/C][C]0.0066[/C][C]0.081[/C][/ROW]
[ROW][C]95[/C][C]1.2514[/C][C]0.2527[/C][C]0.0211[/C][C]0.2544[/C][C]0.0212[/C][C]0.1456[/C][/ROW]
[ROW][C]96[/C][C]1.3628[/C][C]0.1779[/C][C]0.0148[/C][C]0.1206[/C][C]0.0101[/C][C]0.1003[/C][/ROW]
[ROW][C]97[/C][C]1.5627[/C][C]0.3028[/C][C]0.0252[/C][C]0.3652[/C][C]0.0304[/C][C]0.1745[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=33956&T=2

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=33956&T=2

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Univariate ARIMA Extrapolation Forecast Performance
time% S.E.PEMAPESq.EMSERMSE
860.29890.11970.010.10990.00920.0957
870.42240.16570.01380.19410.01620.1272
880.59820.10380.00860.09050.00750.0868
890.63630.28210.02350.46530.03880.1969
900.71750.19760.01650.19850.01650.1286
910.73340.12670.01060.06120.00510.0714
920.83530.1380.01150.07120.00590.077
930.9410.09660.00810.03420.00290.0534
941.1280.13890.01160.07870.00660.081
951.25140.25270.02110.25440.02120.1456
961.36280.17790.01480.12060.01010.1003
971.56270.30280.02520.36520.03040.1745



Parameters (Session):
par1 = 12 ; par2 = -0.5 ; par3 = 1 ; par4 = 0 ; par5 = 12 ; par6 = 0 ; par7 = 1 ; par8 = 1 ; par9 = 0 ; par10 = FALSE ;
Parameters (R input):
par1 = 12 ; par2 = -0.5 ; par3 = 1 ; par4 = 0 ; par5 = 12 ; par6 = 0 ; par7 = 1 ; par8 = 1 ; par9 = 0 ; par10 = FALSE ;
R code (references can be found in the software module):
par1 <- as.numeric(par1) #cut off periods
par2 <- as.numeric(par2) #lambda
par3 <- as.numeric(par3) #degree of non-seasonal differencing
par4 <- as.numeric(par4) #degree of seasonal differencing
par5 <- as.numeric(par5) #seasonal period
par6 <- as.numeric(par6) #p
par7 <- as.numeric(par7) #q
par8 <- as.numeric(par8) #P
par9 <- as.numeric(par9) #Q
if (par10 == 'TRUE') par10 <- TRUE
if (par10 == 'FALSE') par10 <- FALSE
if (par2 == 0) x <- log(x)
if (par2 != 0) x <- x^par2
lx <- length(x)
first <- lx - 2*par1
nx <- lx - par1
nx1 <- nx + 1
fx <- lx - nx
if (fx < 1) {
fx <- par5
nx1 <- lx + fx - 1
first <- lx - 2*fx
}
first <- 1
if (fx < 3) fx <- round(lx/10,0)
(arima.out <- arima(x[1:nx], order=c(par6,par3,par7), seasonal=list(order=c(par8,par4,par9), period=par5), include.mean=par10, method='ML'))
(forecast <- predict(arima.out,fx))
(lb <- forecast$pred - 1.96 * forecast$se)
(ub <- forecast$pred + 1.96 * forecast$se)
if (par2 == 0) {
x <- exp(x)
forecast$pred <- exp(forecast$pred)
lb <- exp(lb)
ub <- exp(ub)
}
if (par2 != 0) {
x <- x^(1/par2)
forecast$pred <- forecast$pred^(1/par2)
lb <- lb^(1/par2)
ub <- ub^(1/par2)
}
if (par2 < 0) {
olb <- lb
lb <- ub
ub <- olb
}
(actandfor <- c(x[1:nx], forecast$pred))
(perc.se <- (ub-forecast$pred)/1.96/forecast$pred)
bitmap(file='test1.png')
opar <- par(mar=c(4,4,2,2),las=1)
ylim <- c( min(x[first:nx],lb), max(x[first:nx],ub))
plot(x,ylim=ylim,type='n',xlim=c(first,lx))
usr <- par('usr')
rect(usr[1],usr[3],nx+1,usr[4],border=NA,col='lemonchiffon')
rect(nx1,usr[3],usr[2],usr[4],border=NA,col='lavender')
abline(h= (-3:3)*2 , col ='gray', lty =3)
polygon( c(nx1:lx,lx:nx1), c(lb,rev(ub)), col = 'orange', lty=2,border=NA)
lines(nx1:lx, lb , lty=2)
lines(nx1:lx, ub , lty=2)
lines(x, lwd=2)
lines(nx1:lx, forecast$pred , lwd=2 , col ='white')
box()
par(opar)
dev.off()
prob.dec <- array(NA, dim=fx)
prob.sdec <- array(NA, dim=fx)
prob.ldec <- array(NA, dim=fx)
prob.pval <- array(NA, dim=fx)
perf.pe <- array(0, dim=fx)
perf.mape <- array(0, dim=fx)
perf.se <- array(0, dim=fx)
perf.mse <- array(0, dim=fx)
perf.rmse <- array(0, dim=fx)
for (i in 1:fx) {
locSD <- (ub[i] - forecast$pred[i]) / 1.96
perf.pe[i] = (x[nx+i] - forecast$pred[i]) / forecast$pred[i]
perf.mape[i] = perf.mape[i] + abs(perf.pe[i])
perf.se[i] = (x[nx+i] - forecast$pred[i])^2
perf.mse[i] = perf.mse[i] + perf.se[i]
prob.dec[i] = pnorm((x[nx+i-1] - forecast$pred[i]) / locSD)
prob.sdec[i] = pnorm((x[nx+i-par5] - forecast$pred[i]) / locSD)
prob.ldec[i] = pnorm((x[nx] - forecast$pred[i]) / locSD)
prob.pval[i] = pnorm(abs(x[nx+i] - forecast$pred[i]) / locSD)
}
perf.mape = perf.mape / fx
perf.mse = perf.mse / fx
perf.rmse = sqrt(perf.mse)
bitmap(file='test2.png')
plot(forecast$pred, pch=19, type='b',main='ARIMA Extrapolation Forecast', ylab='Forecast and 95% CI', xlab='time',ylim=c(min(lb),max(ub)))
dum <- forecast$pred
dum[1:12] <- x[(nx+1):lx]
lines(dum, lty=1)
lines(ub,lty=3)
lines(lb,lty=3)
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Univariate ARIMA Extrapolation Forecast',9,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'time',1,header=TRUE)
a<-table.element(a,'Y[t]',1,header=TRUE)
a<-table.element(a,'F[t]',1,header=TRUE)
a<-table.element(a,'95% LB',1,header=TRUE)
a<-table.element(a,'95% UB',1,header=TRUE)
a<-table.element(a,'p-value
(H0: Y[t] = F[t])',1,header=TRUE)
a<-table.element(a,'P(F[t]>Y[t-1])',1,header=TRUE)
a<-table.element(a,'P(F[t]>Y[t-s])',1,header=TRUE)
mylab <- paste('P(F[t]>Y[',nx,sep='')
mylab <- paste(mylab,'])',sep='')
a<-table.element(a,mylab,1,header=TRUE)
a<-table.row.end(a)
for (i in (nx-par5):nx) {
a<-table.row.start(a)
a<-table.element(a,i,header=TRUE)
a<-table.element(a,x[i])
a<-table.element(a,'-')
a<-table.element(a,'-')
a<-table.element(a,'-')
a<-table.element(a,'-')
a<-table.element(a,'-')
a<-table.element(a,'-')
a<-table.element(a,'-')
a<-table.row.end(a)
}
for (i in 1:fx) {
a<-table.row.start(a)
a<-table.element(a,nx+i,header=TRUE)
a<-table.element(a,round(x[nx+i],4))
a<-table.element(a,round(forecast$pred[i],4))
a<-table.element(a,round(lb[i],4))
a<-table.element(a,round(ub[i],4))
a<-table.element(a,round((1-prob.pval[i]),4))
a<-table.element(a,round((1-prob.dec[i]),4))
a<-table.element(a,round((1-prob.sdec[i]),4))
a<-table.element(a,round((1-prob.ldec[i]),4))
a<-table.row.end(a)
}
a<-table.end(a)
table.save(a,file='mytable.tab')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Univariate ARIMA Extrapolation Forecast Performance',7,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'time',1,header=TRUE)
a<-table.element(a,'% S.E.',1,header=TRUE)
a<-table.element(a,'PE',1,header=TRUE)
a<-table.element(a,'MAPE',1,header=TRUE)
a<-table.element(a,'Sq.E',1,header=TRUE)
a<-table.element(a,'MSE',1,header=TRUE)
a<-table.element(a,'RMSE',1,header=TRUE)
a<-table.row.end(a)
for (i in 1:fx) {
a<-table.row.start(a)
a<-table.element(a,nx+i,header=TRUE)
a<-table.element(a,round(perc.se[i],4))
a<-table.element(a,round(perf.pe[i],4))
a<-table.element(a,round(perf.mape[i],4))
a<-table.element(a,round(perf.se[i],4))
a<-table.element(a,round(perf.mse[i],4))
a<-table.element(a,round(perf.rmse[i],4))
a<-table.row.end(a)
}
a<-table.end(a)
table.save(a,file='mytable1.tab')