Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*Unverified author*

R Software Module

rwasp_arimaforecasting.wasp

Title produced by software

ARIMA Forecasting

Date of computation

Tue, 16 Dec 2008 07:16:09 -0700

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Dec/16/t12294370027ggr1wcgvwt0w26.htm/, Retrieved Thu, 16 May 2024 01:23:09 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=33956, Retrieved Thu, 16 May 2024 01:23:09 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

182

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F       [ARIMA Forecasting] [] [2008-12-16 14:16:09] [d41d8cd98f00b204e9800998ecf8427e] [Current]
F   PD    [ARIMA Forecasting] [workshop 9-step 1] [2008-12-16 19:08:42] [5b94fe8ce1508f2fbd1490c4566fbba6] 

Feedback Forum

2008-12-18 08:12:48 [Carole Thielens] [reply] 
STEP 1 
 
Vooreerst had de student kunnen vermelden dat bij het invoeren van de gegevens de testing period gelijkgesteld dient te worden aan 12, waardoor de laatste 12 maanden van de tijdsreeks worden afgeknipt. Vervolgens wordt voor die twaalf laatste maanden, zonder rekening te houden met de ‘afgeknipte’ gegevens, een voorspelling gemaakt op basis van de metingen uit het verleden. In de tabel zien we daarom enkel gegevens voor die laatste 12 maanden. De waarden voor de maanden daarvoor staan er ook wel, maar daar wordt geen rekening mee gehouden.  
 
De student vermeldt correct dat het blauwgrijze gedeelte aan de rechterkant de voorspelde periode voorstelt. Het oranje vlak binnen de stippellijnen stelt vervolgens het betrouwbaarheidsinterval voor. De zwarte lijn staat voor de werkelijke waarden, terwijl de witte lijn de voorspelde waarden vertegenwoordigt. 
 
Ook heeft de student op de tweede grafiek correct waargenomen dat de voorspelde en werkelijke waarden zeer nauw samenlopen. Eveneens vergroot het betrouwbaarheidsinterval doorheen de tijd, wat volgens de student zou kunnen wijzen op heteroskedasticiteit. Hier kan ik echter geen beoordeling over geven, gezien we dit begrip in de les niet in detail besproken hebben. 
 
STEP 2 
 
De student beweert dat deze tijdsreeks niet gekenmerkt wordt door een trend. Ik beweer het tegendeel. Er is wel degelijk een trendmatig verloop op te merken. We zien bijvoorbeeld in het begin van de tijdsreeks een top, waarna de tijdreeks waar daalt en vervolgens stijgt de tijdsreeks opnieuw. Er is met andere woorden een terugkomend verloop of beter gezegd een trendmatig verloop. 
Over seizonaliteit zei de student niets. Ik geloof dat het wel duidelijk is dat er in deze tijdsreeks geen seizonaliteit bestaat. 
 
STEP 3 
 
Deze stap loste de student niet op. Hij kopieerde uitsluitend de tabellen die de software genereerde. Daarom maak ik hierbij enkele aanvullingen: 
 
Uit de tweede tabel hebben we enkel de eerste twee kolommen nodig, op de kolom met de tijdsaanduiding na. De kolom %S.E. staat voor de procentuele standaardfout bij de voorspellingen. Het gaat hier met andere woorden om het percentage dat je ernaast mag zitten bij je voorspellingen. Logischerwijze vergroot dit percentage hoe verder in de toekomst je wil voorspellen, omdat je nog niet kan weten wat er in de verre toekomst zal gebeuren. 
Wat mij opvalt, is dat dit percentage wel heel groot wordt. In de laatste periode wordt dit percentage zelfs 156% ! De procentuele standaardfout bij deze voorspelling is zeer groot. 
 
De kolom P.E. staat voor de werkelijke procentuele fouten die gemaakt zijn bij het voorspellen. Het beste is dat deze in absolute waarde zo klein mogelijk zijn. Dit wil zeggen dat de voorspelde en de werkelijke waarde dan dicht bij elkaar liggen. Indien niet, heb je niet zo’n goede voorspelling gemaakt en dan liggen de voorspelde en de werkelijke waarden ver uit elkaar. Wat opvalt, is dat er zeer veel weinig fouten gemaakt zijn. Dit is met andere woorden een goede voorspelling.  
 
 
STEP 4 
 
Ook deze stap werd niet uitgewerkt. Daarom geef ik opnieuw ter verduidelijking een mogelijke uitwerking: 
 
 
De kolom met de p-waarde geeft de kans weer dat de voorspelde waarde niet significant verschillend is van de werkelijke waarde. Indien de p-waarde groter is dan 0.05, dan is het verschil inderdaad niet significant, en spreken we dus van een goede voorspelling. Indien de p-waarde echter kleiner is dan 0.05, is het verschil tussen de voorspelde en de werkelijke waarde wel significant, en hebben we dus voor die maand geen goede voorspelling gemaakt. Alle p-waarden in deze kolom zijn groter dan 0.05, wat er op wijst dat een goede voorspelling gemaakt werd. 
 
* De zevende kolom geeft de kans weer dat de voorspelde waarde hoger ligt dan de werkelijke waarde van de periode daarvoor. Deze kansen zijn niet erg hoog. Dit is een aanduiding voor het ontbreken van een lange termijn trend in de tijdsreeks. 
 
* Kolom 8 beschrijft de kans dat je gestegen bent ten opzichte van het jaar voordien. Deze percentages zijn overal vrij laag. 
 
*De laatste kolom ten slotte geeft de waarschijnlijkheid weer dat je gestegen bent ten opzichte van de laatste gekende waarde. Ook hier zien we weer zeer lage waarden. Er is met andere woorden geen stijgende trend in de tijdsreeks aanwezig. 
 
STEP 5 
 
De conclusie van de student bij stap 5 is correct. 
 
2008-12-18 12:11:48 [Jonas Scheltjens] [reply] 
Step 1:  
De student licht de grafiek zeer goed toe. Wat we nog kunnen toevoegen is dat de voorspelde waarden klaarblijkelijk steeds onder de werkelijke waarden liggen, maar de voorspelling is alleszins niet explosief en vertoont ook zeker geen grote schommelingen. We kunnen zien dat de voorspelling goed in lijn ligt met de voorgaande trend in de gegevensreeks. 
Ook zou kunnen worden toegelicht dat aangezien we de testing period instellen op 12, dat de 12 laatste maanden niet worden opgenomen in de berekening van de voorspelling.  We kunnen zo de voorspelling gaan vergelijken met de weggelaten waarden Of dit al dan niet betrouwbaar is gaan we na met behulp van de tabellen en grafieken. 
 
De problematiek van het te grote betrouwbaarheidsinterval is hier inderdaad wel erg groot. Een oplossing hiervoor kan zijn dat de lambda-waarde toch aangepast moet worden. Een meer gepaste lambda-waarde zal zorgen voor een nauwkeuriger betrouwbaarheidsinterval. 
 
De tabel ‘Univariate ARIMA Extrapolation Forecast’ (dewelke dus zou kunnen opgenomen worden bij step 1), geeft de lower- en upper bound weer wat dus wil zeggen dat dit de onder- en bovengrens van het betrouwbaarheidsinterval zijn. Aan de hand van deze tabllen (in combinatie van deze met de voorspelde waarde) kunnen we nagaan of de verkregen (voorspelde) waarden al dan niet significant verschillend zijn. Om het anders te zeggen: dit interval geeft aan dat de volgende waarde met een waarschijnlijkheid van 95% zich tussen deze grenzen zal bevinden, buiten indien er zich een exceptionaliteit voordoet. Uit de tabel kunnen we dan ook afleiden dat er in de 12 voorspelde perioden, de waarden allen binnen dit interval liggen. 
 Ook in deze tabel zien we dat het betrouwbaarheidsinterval wel erg groot is.  
 
De ARIMA Extrapolation Forecast werd ook goed besproken. De waarden liggen inderdaad allen onder de werkelijke waarden. Ook is het juist dat het betrouwbaarheidsinterval steeds groter wordt. Eventueel kan nog vermeldt worden dat alle waarden binnen het betrouwbaarheidsinterval liggen. 
 
Step 2:  
Hier was het de bedoeling om de 2 grafieken grondig te bespreken.  
Wat de student zegt is inderdaad juist. Er is niet echt sprake van een trend, zowel niet-seizoenaal als seizonaal. Verdere bespreking van deze grafieken werd al gegeven in step 1. 
 
Step 3: 
Deze step werd niet besproken door de student.  
Het was hier echter de bedoeling om de ‘Univariate ARIMA Extrapolation Forecast Performance’ te bespreken.  
De  ‘Univariate ARIMA Extrapolation Forecast Performance’ bevat de theoretische schatting op basis van de theoretische assumpties met de procentuele waarden van de afwijkingen. 
In deze tabel bepaalt de eerste kolom hoe groot de kans is dat we met onze schatting van de voorspelde waarden ernaast zitten (Standard Error). 
In de 2de kolom van deze tabel zien we de werkelijke fout die we hebben gemaakt bij het schatten van de waarden.  
 
Step 4 werd niet besproken door de student. Hier was het echter de bedoeling om de tabel ‘Univariate ARIMA Extrapolation Forecast’ te bespreken. 
Hier volgt een korte bespreking van wat er in de kolommen staat. 
 
De eerste kolom geeft de nummer van de maand weer.  
De tweede kolom bevat de werkelijke waarde van deze maand. 
In de derde kolom staat de voorspelde waarde.  
De vierde en de vijfde kolom bevatten respectievelijk de lower- en upper bound voor de waarden die de onder- en bovengrens van het betrouwbaarheidsinterval voorstellen. Samen met de kolom van de voorspelde waarde kan men dan nagaan of de verkregen waarden al dan niet significant verschillend zijn. Praktisch gezien wil dit interval hier zeggen dat de volgende waarde met een waarschijnlijkheid van 95% zich tussen deze grenzen zal bevinden, buiten indien er zich een exceptionaliteit voordoet.  
In de zesde kolom wordt de p-waarde van toetsing aan de nulhypothese weergegeven. De stelling die hier gesteld wordt luidt als volgt: ‘de waarde van Yt is gelijk aan de waarde van Ft, tenzij er zich iets exceptioneels voordoet’, wat dus neerkomt op een ceteris paribus-stelling. Het komt er dus op neer dat de stelling zegt dat het verschil tussen de voorspelde en de werkelijke waarde niet significant is. De bijhorende p-waarde zegt dan hoeveel procent kans er is dat indein men de stelling verwerpt en dus zegt dat het verschil wel significant is, men zich vergist.  
In de 7de kolom kunnen we dan de p-waarde terugvinden die de waarschijnlijkheid aangeeft dat de Ft groter is dan de gekende waarde van de voorgaande periode. 
In de achtste kolom krijgen we de waarden te zien hoe groot de kans is dat in deze maanden de waarden die zijn verkregen groter zijn dan de waarden van een jaar eerder. Indien er zich hoge waarden voordoen duidt dit erop dat de voorspelling een stijgende trend kent. 
In de negende en laatste kolom kunnen we dan de waarschijnlijkheid waarnemen dat Ft groter is dan Y48 ( de laatst gekende waarde). 
 
Bij step 5 moest men de grafieken bespreken en deze vergelijken met de werkelijke waarden. De student blijft hier echter zeer beperkt. 
 
ARIMA Extrapolation Forecast: de stippelijnen geven hier de lower- en upper bound (de boven- en ondergrens) van het betrouwbaarheidsinterval weer. We moeten dus gaan zoeken naar waar de voorspelde waarden dit interval overschrijden. We zien dat de waarden goed binnen het betrouwbaarheidsinterval liggen en dus niet significant verschillend zijn. Ook liggen ze dicht bij de werkelijke waarden, wat dus wil zeggen dat dit een goed model is. 
Ook in de andere grafiek kan men waarnemen dat de witte lijnen erg gelijken zijn met de zwarte. We kunnen dus nogmaals stellen dat het hier om een goed model gaat. 
Het probleem met het betrouwbaarheidsinterval is er nog wel, maar een manier om dit te verbeteren werd al gegeven in de bespreking van step 1. 
2008-12-20 19:33:46 [Kevin Vermeiren] [reply] 
stap 1 
De student geeft een kort en onvolledig antwoord. Het klopt dat de zwarte lijn de gekende waarden aangeeft en de witte de voorspelde. Verder is het ook juist dat het oranje gedeelte het betrouwbaarheidsinterval weergeeft. Toch had hier nog vermeld mogen worden dat het hier de bedoeling was te kijken of de voorspelling die berekend wordt explosief verloopt of met grote schommelingen. In dit geval zien we dat dit zeker niet het geval is. Hier had ook nog gezegd kunnen worden dat testing period op 12 ingesteld moet worden aangezien we de laatste 12 maanden wegknippen en hier een voorspelling van te maken zonder rekening te houden met de weggelaten waarden. Vervolgens is het de bedoeling deze voorspelde waarden te vergelijken met deze die weggelaten zijn. We zien ook dat de voorspelde waarden dezelfde trend volgen dan de reeds bekende waarden. We besluiten dat de trend van de tijdreeks blijft behouden tenzij er zich bijzondere gebeurtenissen voordoen. 
De tabel ‘Univariate ARIMA Extrapolation Forecast’ kon ook nog besproken worden. Deze tabel geeft de de lower- en upper bound weer die dus de onder- en bovengrens van het 95% betrouwbaarheidsinterval voorstellen. Dit interval moet als volgt geinterpreteerd worden: we kunnen zeggen dat de waarde met een waarschijnlijkheid van 95% binnen het interval zal bevinden, buiten indien er zich een exceptionaliteit voordoet. Uit de tabel kunnen we dan ook afleiden dat er in de 12 voorspelde perioden, de waarden allemaal binnen dit interval liggen. 
Het klopt dat in de ARIMA extrpolation forecast te zien is dat de voorspelde waarden iets onder de gekende waarden liggen. Dit is echter geen probleem zolang ze binnen het betrouwbaarheidsinterval gelegen zijn (dit is hier het geval).  
Verder is het ook juist dat het betrouwbaarheidsinterval naarmate het dichter bij het einde van de tijdreeks komt steeds groter wordt. 
 
Stap 2 
De student geeft hier een zeer beperkt antwoord. Het is wel correct dat de grafiek niet echt een trend weergeeft. Dit was mischien wel te verwachten. Hier had ook nog vermeld kunnen worden hoe de grafieken tot stand kwamen. Doordat de laatste 12 maanden weggelaten worden kan er voor deze maanden opnieuw een voorspelling gemaakt worden. Vervolgens worden dan deze resultaten met elkaar vergeleken, welk visueel waarneembaar is in de grafieken. Hier valt op dat er weliswaar geen trend aanwezig is maar dat de voorspelde waarden wel goed de gekende waarden representeren. 
 
stap 3 
Hier geeft de student enkel de tabellen. Hier hoefde eigelijk de tabel “Univariate ARIMA Extrapolation Forecast” niet gegeven te worden. De bespreking van de SE ontbreekt.  
De standard error geeft aan hoeveel procent kans er is dat de voorspelling foutief is. We zien dat deze waarden zeer hoog zijn. De kans op fouten is dus zeer groot. 
 
stap 4 
 
Hier geeft de student geen antwoord. Hier volgt een kort overzicht van de tabel: 
1ste  kolom = nummer van de maand 
2de  kolom = werkelijke waarde van deze maand.  
3de  kolom staat de voorspelde waarde.  
De 4de en de 5de kolom vormen het betrouwbaarheidsinterval. Hier moet je kijken of de voorspelde waarden binnen de lower en de upperbound gelegen zijn. Het interval moet als volgt geinterpreteerd worden: de waarde ligt met een waarschijnlijkheid van 95% tussen deze grenzen, tenzij er zich een bijzondere gebeurtenis voordoet.  
6de kolom = de p-waarde van de nulhypothese (Yt=Ft, tenzij er zich bijzondere gebeurtenissen voordoen= ceteris paribus-stelling). Deze wil zeggen dat het verschil tussen de voorspelde en de werkelijke waarde niet significant is. De bijhorende p-waarde zegt dan hoeveel procent kans er is dat men zicht vergist bij het verwerpen van deze nulhypothese. 
7de kolom geeft de kans weer dat Ft > de gekende waarde van periode t-1.  
8ste  kolom = de waarden van de kans dat in deze maanden de waarden die zijn bekomen groter zijn dan de waarden van een jaar vroeger. Hoge waarden duiden op een stijgende trend in de voorspelling 
9de kolom= de waarschijnlijkheid Ft >Y48 met namde de laatst gekende waarde. 
 
Stap 5 
Student geeft een zeer beperkt antwoord. Hier had nog vermeld kunnen worden dat er gekeken moet worden naar het feit of de voorspelde waarden significant verschillen van de werkelijke waarden. Dit is makkelijk te doen aan de hand van het betrouwbaarheidsinterval, welk wordt weergegeven door de stippellijnen. Indien de voorspelde waarden deze lijnen overschrijden dan kunnen we spreken van een significant verschil. Dit is hier echter niet het geval. We zien inderdaad dat de voorspelling de gekende waarden goed volgt. We zouden op basis van deze grafiek inderdaad kunnen concluderen dat het een vrij goed model is.
2008-12-21 11:07:44 [] [reply] 
Bij de bespreking van stap 4 is er een fout gebeurd. Kolom 9 van de grafiek geeft weer: de waarschijnlijkheid Ft >Y85 met name de laatst gekende waarde en niet de waarschijnlijkheid Ft >Y48!

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

5,1
4,9
5,2
5,1
4,6
3,7
3,9
3,1
2,8
2,6
2,2
1,8
1,3
1,2
1,4
1,3
1,3
1,9
1,9
2,1
2,0
1,9
1,9
1,9
1,8
1,7
1,6
1,7
1,9
1,7
1,3
2,0
2,0
2,3
2,0
1,7
2,3
2,4
2,4
2,3
2,1
2,1
2,5
2,0
1,8
1,7
1,9
2,1
1,4
1,6
1,7
1,6
1,9
1,6
1,1
1,3
1,6
1,6
1,7
1,6
1,7
1,6
1,5
1,6
1,1
1,5
1,4
1,3
0,9
1,2
0,9
1,1
1,3
1,3
1,4
1,2
1,7
2,0
3,0
3,1
3,2
2,7
2,8
3,0
2,8
3,1
3,1
3,2
3,1
2,7
2,2
2,2
2,1
2,3
2,5
2,3
2,6

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	1 seconds
R Server	'George Udny Yule' @ 72.249.76.132

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 1 seconds \tabularnewline
R Server & 'George Udny Yule' @ 72.249.76.132 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=33956&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]1 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'George Udny Yule' @ 72.249.76.132[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=33956&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=33956&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	1 seconds
R Server	'George Udny Yule' @ 72.249.76.132

Univariate ARIMA Extrapolation Forecast
time	Y[t]	F[t]	95% LB	95% UB	p-value(H0: Y[t] = F[t])	P(F[t]>Y[t-1])	P(F[t]>Y[t-s])	P(F[t]>Y[85])
73	1.3	-	-	-	-	-	-	-
74	1.3	-	-	-	-	-	-	-
75	1.4	-	-	-	-	-	-	-
76	1.2	-	-	-	-	-	-	-
77	1.7	-	-	-	-	-	-	-
78	2	-	-	-	-	-	-	-
79	3	-	-	-	-	-	-	-
80	3.1	-	-	-	-	-	-	-
81	3.2	-	-	-	-	-	-	-
82	2.7	-	-	-	-	-	-	-
83	2.8	-	-	-	-	-	-	-
84	3	-	-	-	-	-	-	-
85	2.8	-	-	-	-	-	-	-
86	3.1	2.7685	1.9038	4.3903	0.3444	0.4848	0.962	0.4848
87	3.1	2.6595	1.6742	4.8611	0.3475	0.3475	0.8689	0.4502
88	3.2	2.8992	1.66	6.2983	0.4311	0.4539	0.8364	0.5228
89	3.1	2.4179	1.3609	5.4332	0.3287	0.3056	0.6796	0.4019
90	2.7	2.2545	1.2273	5.425	0.3915	0.3006	0.5625	0.368
91	2.2	1.9527	1.0565	4.7597	0.4314	0.3009	0.2323	0.277
92	2.2	1.9332	1.009	5.0981	0.4344	0.4344	0.235	0.2957
93	2.1	1.9149	0.9672	5.4469	0.4591	0.4372	0.2379	0.3117
94	2.3	2.0195	0.9713	6.4843	0.451	0.4859	0.3826	0.3659
95	2.5	1.9957	0.9339	6.8906	0.42	0.4515	0.3737	0.3737
96	2.3	1.9527	0.8938	7.1685	0.4481	0.4185	0.3469	0.3751
97	2.6	1.9957	0.8824	8.1082	0.4232	0.4611	0.3982	0.3982

\begin{tabular}{lllllllll}
\hline
Univariate ARIMA Extrapolation Forecast \tabularnewline
time & Y[t] & F[t] & 95% LB & 95% UB & p-value(H0: Y[t] = F[t]) & P(F[t]>Y[t-1]) & P(F[t]>Y[t-s]) & P(F[t]>Y[85]) \tabularnewline
73 & 1.3 & - & - & - & - & - & - & - \tabularnewline
74 & 1.3 & - & - & - & - & - & - & - \tabularnewline
75 & 1.4 & - & - & - & - & - & - & - \tabularnewline
76 & 1.2 & - & - & - & - & - & - & - \tabularnewline
77 & 1.7 & - & - & - & - & - & - & - \tabularnewline
78 & 2 & - & - & - & - & - & - & - \tabularnewline
79 & 3 & - & - & - & - & - & - & - \tabularnewline
80 & 3.1 & - & - & - & - & - & - & - \tabularnewline
81 & 3.2 & - & - & - & - & - & - & - \tabularnewline
82 & 2.7 & - & - & - & - & - & - & - \tabularnewline
83 & 2.8 & - & - & - & - & - & - & - \tabularnewline
84 & 3 & - & - & - & - & - & - & - \tabularnewline
85 & 2.8 & - & - & - & - & - & - & - \tabularnewline
86 & 3.1 & 2.7685 & 1.9038 & 4.3903 & 0.3444 & 0.4848 & 0.962 & 0.4848 \tabularnewline
87 & 3.1 & 2.6595 & 1.6742 & 4.8611 & 0.3475 & 0.3475 & 0.8689 & 0.4502 \tabularnewline
88 & 3.2 & 2.8992 & 1.66 & 6.2983 & 0.4311 & 0.4539 & 0.8364 & 0.5228 \tabularnewline
89 & 3.1 & 2.4179 & 1.3609 & 5.4332 & 0.3287 & 0.3056 & 0.6796 & 0.4019 \tabularnewline
90 & 2.7 & 2.2545 & 1.2273 & 5.425 & 0.3915 & 0.3006 & 0.5625 & 0.368 \tabularnewline
91 & 2.2 & 1.9527 & 1.0565 & 4.7597 & 0.4314 & 0.3009 & 0.2323 & 0.277 \tabularnewline
92 & 2.2 & 1.9332 & 1.009 & 5.0981 & 0.4344 & 0.4344 & 0.235 & 0.2957 \tabularnewline
93 & 2.1 & 1.9149 & 0.9672 & 5.4469 & 0.4591 & 0.4372 & 0.2379 & 0.3117 \tabularnewline
94 & 2.3 & 2.0195 & 0.9713 & 6.4843 & 0.451 & 0.4859 & 0.3826 & 0.3659 \tabularnewline
95 & 2.5 & 1.9957 & 0.9339 & 6.8906 & 0.42 & 0.4515 & 0.3737 & 0.3737 \tabularnewline
96 & 2.3 & 1.9527 & 0.8938 & 7.1685 & 0.4481 & 0.4185 & 0.3469 & 0.3751 \tabularnewline
97 & 2.6 & 1.9957 & 0.8824 & 8.1082 & 0.4232 & 0.4611 & 0.3982 & 0.3982 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=33956&T=1

[TABLE]
[ROW][C]Univariate ARIMA Extrapolation Forecast[/C][/ROW]
[ROW][C]time[/C][C]Y[t][/C][C]F[t][/C][C]95% LB[/C][C]95% UB[/C][C]p-value(H0: Y[t] = F[t])[/C][C]P(F[t]>Y[t-1])[/C][C]P(F[t]>Y[t-s])[/C][C]P(F[t]>Y[85])[/C][/ROW]
[ROW][C]73[/C][C]1.3[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]74[/C][C]1.3[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]75[/C][C]1.4[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]76[/C][C]1.2[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]77[/C][C]1.7[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]78[/C][C]2[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]79[/C][C]3[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]80[/C][C]3.1[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]81[/C][C]3.2[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]82[/C][C]2.7[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]83[/C][C]2.8[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]84[/C][C]3[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]85[/C][C]2.8[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][C]-[/C][/ROW]
[ROW][C]86[/C][C]3.1[/C][C]2.7685[/C][C]1.9038[/C][C]4.3903[/C][C]0.3444[/C][C]0.4848[/C][C]0.962[/C][C]0.4848[/C][/ROW]
[ROW][C]87[/C][C]3.1[/C][C]2.6595[/C][C]1.6742[/C][C]4.8611[/C][C]0.3475[/C][C]0.3475[/C][C]0.8689[/C][C]0.4502[/C][/ROW]
[ROW][C]88[/C][C]3.2[/C][C]2.8992[/C][C]1.66[/C][C]6.2983[/C][C]0.4311[/C][C]0.4539[/C][C]0.8364[/C][C]0.5228[/C][/ROW]
[ROW][C]89[/C][C]3.1[/C][C]2.4179[/C][C]1.3609[/C][C]5.4332[/C][C]0.3287[/C][C]0.3056[/C][C]0.6796[/C][C]0.4019[/C][/ROW]
[ROW][C]90[/C][C]2.7[/C][C]2.2545[/C][C]1.2273[/C][C]5.425[/C][C]0.3915[/C][C]0.3006[/C][C]0.5625[/C][C]0.368[/C][/ROW]
[ROW][C]91[/C][C]2.2[/C][C]1.9527[/C][C]1.0565[/C][C]4.7597[/C][C]0.4314[/C][C]0.3009[/C][C]0.2323[/C][C]0.277[/C][/ROW]
[ROW][C]92[/C][C]2.2[/C][C]1.9332[/C][C]1.009[/C][C]5.0981[/C][C]0.4344[/C][C]0.4344[/C][C]0.235[/C][C]0.2957[/C][/ROW]
[ROW][C]93[/C][C]2.1[/C][C]1.9149[/C][C]0.9672[/C][C]5.4469[/C][C]0.4591[/C][C]0.4372[/C][C]0.2379[/C][C]0.3117[/C][/ROW]
[ROW][C]94[/C][C]2.3[/C][C]2.0195[/C][C]0.9713[/C][C]6.4843[/C][C]0.451[/C][C]0.4859[/C][C]0.3826[/C][C]0.3659[/C][/ROW]
[ROW][C]95[/C][C]2.5[/C][C]1.9957[/C][C]0.9339[/C][C]6.8906[/C][C]0.42[/C][C]0.4515[/C][C]0.3737[/C][C]0.3737[/C][/ROW]
[ROW][C]96[/C][C]2.3[/C][C]1.9527[/C][C]0.8938[/C][C]7.1685[/C][C]0.4481[/C][C]0.4185[/C][C]0.3469[/C][C]0.3751[/C][/ROW]
[ROW][C]97[/C][C]2.6[/C][C]1.9957[/C][C]0.8824[/C][C]8.1082[/C][C]0.4232[/C][C]0.4611[/C][C]0.3982[/C][C]0.3982[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=33956&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=33956&T=1

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Univariate ARIMA Extrapolation Forecast
time	Y[t]	F[t]	95% LB	95% UB	p-value(H0: Y[t] = F[t])	P(F[t]>Y[t-1])	P(F[t]>Y[t-s])	P(F[t]>Y[85])
73	1.3	-	-	-	-	-	-	-
74	1.3	-	-	-	-	-	-	-
75	1.4	-	-	-	-	-	-	-
76	1.2	-	-	-	-	-	-	-
77	1.7	-	-	-	-	-	-	-
78	2	-	-	-	-	-	-	-
79	3	-	-	-	-	-	-	-
80	3.1	-	-	-	-	-	-	-
81	3.2	-	-	-	-	-	-	-
82	2.7	-	-	-	-	-	-	-
83	2.8	-	-	-	-	-	-	-
84	3	-	-	-	-	-	-	-
85	2.8	-	-	-	-	-	-	-
86	3.1	2.7685	1.9038	4.3903	0.3444	0.4848	0.962	0.4848
87	3.1	2.6595	1.6742	4.8611	0.3475	0.3475	0.8689	0.4502
88	3.2	2.8992	1.66	6.2983	0.4311	0.4539	0.8364	0.5228
89	3.1	2.4179	1.3609	5.4332	0.3287	0.3056	0.6796	0.4019
90	2.7	2.2545	1.2273	5.425	0.3915	0.3006	0.5625	0.368
91	2.2	1.9527	1.0565	4.7597	0.4314	0.3009	0.2323	0.277
92	2.2	1.9332	1.009	5.0981	0.4344	0.4344	0.235	0.2957
93	2.1	1.9149	0.9672	5.4469	0.4591	0.4372	0.2379	0.3117
94	2.3	2.0195	0.9713	6.4843	0.451	0.4859	0.3826	0.3659
95	2.5	1.9957	0.9339	6.8906	0.42	0.4515	0.3737	0.3737
96	2.3	1.9527	0.8938	7.1685	0.4481	0.4185	0.3469	0.3751
97	2.6	1.9957	0.8824	8.1082	0.4232	0.4611	0.3982	0.3982

Univariate ARIMA Extrapolation Forecast Performance
time	% S.E.	PE	MAPE	Sq.E	MSE	RMSE
86	0.2989	0.1197	0.01	0.1099	0.0092	0.0957
87	0.4224	0.1657	0.0138	0.1941	0.0162	0.1272
88	0.5982	0.1038	0.0086	0.0905	0.0075	0.0868
89	0.6363	0.2821	0.0235	0.4653	0.0388	0.1969
90	0.7175	0.1976	0.0165	0.1985	0.0165	0.1286
91	0.7334	0.1267	0.0106	0.0612	0.0051	0.0714
92	0.8353	0.138	0.0115	0.0712	0.0059	0.077
93	0.941	0.0966	0.0081	0.0342	0.0029	0.0534
94	1.128	0.1389	0.0116	0.0787	0.0066	0.081
95	1.2514	0.2527	0.0211	0.2544	0.0212	0.1456
96	1.3628	0.1779	0.0148	0.1206	0.0101	0.1003
97	1.5627	0.3028	0.0252	0.3652	0.0304	0.1745

\begin{tabular}{lllllllll}
\hline
Univariate ARIMA Extrapolation Forecast Performance \tabularnewline
time & % S.E. & PE & MAPE & Sq.E & MSE & RMSE \tabularnewline
86 & 0.2989 & 0.1197 & 0.01 & 0.1099 & 0.0092 & 0.0957 \tabularnewline
87 & 0.4224 & 0.1657 & 0.0138 & 0.1941 & 0.0162 & 0.1272 \tabularnewline
88 & 0.5982 & 0.1038 & 0.0086 & 0.0905 & 0.0075 & 0.0868 \tabularnewline
89 & 0.6363 & 0.2821 & 0.0235 & 0.4653 & 0.0388 & 0.1969 \tabularnewline
90 & 0.7175 & 0.1976 & 0.0165 & 0.1985 & 0.0165 & 0.1286 \tabularnewline
91 & 0.7334 & 0.1267 & 0.0106 & 0.0612 & 0.0051 & 0.0714 \tabularnewline
92 & 0.8353 & 0.138 & 0.0115 & 0.0712 & 0.0059 & 0.077 \tabularnewline
93 & 0.941 & 0.0966 & 0.0081 & 0.0342 & 0.0029 & 0.0534 \tabularnewline
94 & 1.128 & 0.1389 & 0.0116 & 0.0787 & 0.0066 & 0.081 \tabularnewline
95 & 1.2514 & 0.2527 & 0.0211 & 0.2544 & 0.0212 & 0.1456 \tabularnewline
96 & 1.3628 & 0.1779 & 0.0148 & 0.1206 & 0.0101 & 0.1003 \tabularnewline
97 & 1.5627 & 0.3028 & 0.0252 & 0.3652 & 0.0304 & 0.1745 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=33956&T=2

[TABLE]
[ROW][C]Univariate ARIMA Extrapolation Forecast Performance[/C][/ROW]
[ROW][C]time[/C][C]% S.E.[/C][C]PE[/C][C]MAPE[/C][C]Sq.E[/C][C]MSE[/C][C]RMSE[/C][/ROW]
[ROW][C]86[/C][C]0.2989[/C][C]0.1197[/C][C]0.01[/C][C]0.1099[/C][C]0.0092[/C][C]0.0957[/C][/ROW]
[ROW][C]87[/C][C]0.4224[/C][C]0.1657[/C][C]0.0138[/C][C]0.1941[/C][C]0.0162[/C][C]0.1272[/C][/ROW]
[ROW][C]88[/C][C]0.5982[/C][C]0.1038[/C][C]0.0086[/C][C]0.0905[/C][C]0.0075[/C][C]0.0868[/C][/ROW]
[ROW][C]89[/C][C]0.6363[/C][C]0.2821[/C][C]0.0235[/C][C]0.4653[/C][C]0.0388[/C][C]0.1969[/C][/ROW]
[ROW][C]90[/C][C]0.7175[/C][C]0.1976[/C][C]0.0165[/C][C]0.1985[/C][C]0.0165[/C][C]0.1286[/C][/ROW]
[ROW][C]91[/C][C]0.7334[/C][C]0.1267[/C][C]0.0106[/C][C]0.0612[/C][C]0.0051[/C][C]0.0714[/C][/ROW]
[ROW][C]92[/C][C]0.8353[/C][C]0.138[/C][C]0.0115[/C][C]0.0712[/C][C]0.0059[/C][C]0.077[/C][/ROW]
[ROW][C]93[/C][C]0.941[/C][C]0.0966[/C][C]0.0081[/C][C]0.0342[/C][C]0.0029[/C][C]0.0534[/C][/ROW]
[ROW][C]94[/C][C]1.128[/C][C]0.1389[/C][C]0.0116[/C][C]0.0787[/C][C]0.0066[/C][C]0.081[/C][/ROW]
[ROW][C]95[/C][C]1.2514[/C][C]0.2527[/C][C]0.0211[/C][C]0.2544[/C][C]0.0212[/C][C]0.1456[/C][/ROW]
[ROW][C]96[/C][C]1.3628[/C][C]0.1779[/C][C]0.0148[/C][C]0.1206[/C][C]0.0101[/C][C]0.1003[/C][/ROW]
[ROW][C]97[/C][C]1.5627[/C][C]0.3028[/C][C]0.0252[/C][C]0.3652[/C][C]0.0304[/C][C]0.1745[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=33956&T=2

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=33956&T=2

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Univariate ARIMA Extrapolation Forecast Performance
time	% S.E.	PE	MAPE	Sq.E	MSE	RMSE
86	0.2989	0.1197	0.01	0.1099	0.0092	0.0957
87	0.4224	0.1657	0.0138	0.1941	0.0162	0.1272
88	0.5982	0.1038	0.0086	0.0905	0.0075	0.0868
89	0.6363	0.2821	0.0235	0.4653	0.0388	0.1969
90	0.7175	0.1976	0.0165	0.1985	0.0165	0.1286
91	0.7334	0.1267	0.0106	0.0612	0.0051	0.0714
92	0.8353	0.138	0.0115	0.0712	0.0059	0.077
93	0.941	0.0966	0.0081	0.0342	0.0029	0.0534
94	1.128	0.1389	0.0116	0.0787	0.0066	0.081
95	1.2514	0.2527	0.0211	0.2544	0.0212	0.1456
96	1.3628	0.1779	0.0148	0.1206	0.0101	0.1003
97	1.5627	0.3028	0.0252	0.3652	0.0304	0.1745

Figure 1

PNG link

Postscript link

PDF link

Figure 2

PNG link

Postscript link

PDF link

Parameters (Session):

par1 = 12 ; par2 = -0.5 ; par3 = 1 ; par4 = 0 ; par5 = 12 ; par6 = 0 ; par7 = 1 ; par8 = 1 ; par9 = 0 ; par10 = FALSE ;

Parameters (R input):

par1 = 12 ; par2 = -0.5 ; par3 = 1 ; par4 = 0 ; par5 = 12 ; par6 = 0 ; par7 = 1 ; par8 = 1 ; par9 = 0 ; par10 = FALSE ;

R code (references can be found in the software module):

par1 <- as.numeric(par1) #cut off periods
par2 <- as.numeric(par2) #lambda
par3 <- as.numeric(par3) #degree of non-seasonal differencing
par4 <- as.numeric(par4) #degree of seasonal differencing
par5 <- as.numeric(par5) #seasonal period
par6 <- as.numeric(par6) #p
par7 <- as.numeric(par7) #q
par8 <- as.numeric(par8) #P
par9 <- as.numeric(par9) #Q
if (par10 == 'TRUE') par10 <- TRUE
if (par10 == 'FALSE') par10 <- FALSE
if (par2 == 0) x <- log(x)
if (par2 != 0) x <- x^par2
lx <- length(x)
first <- lx - 2*par1
nx <- lx - par1
nx1 <- nx + 1
fx <- lx - nx
if (fx < 1) {
fx <- par5
nx1 <- lx + fx - 1
first <- lx - 2*fx
}
first <- 1
if (fx < 3) fx <- round(lx/10,0)
(arima.out <- arima(x[1:nx], order=c(par6,par3,par7), seasonal=list(order=c(par8,par4,par9), period=par5), include.mean=par10, method='ML'))
(forecast <- predict(arima.out,fx))
(lb <- forecast$pred - 1.96 * forecast$se)
(ub <- forecast$pred + 1.96 * forecast$se)
if (par2 == 0) {
x <- exp(x)
forecast$pred <- exp(forecast$pred)
lb <- exp(lb)
ub <- exp(ub)
}
if (par2 != 0) {
x <- x^(1/par2)
forecast$pred <- forecast$pred^(1/par2)
lb <- lb^(1/par2)
ub <- ub^(1/par2)
}
if (par2 < 0) {
olb <- lb
lb <- ub
ub <- olb
}
(actandfor <- c(x[1:nx], forecast$pred))
(perc.se <- (ub-forecast$pred)/1.96/forecast$pred)
bitmap(file='test1.png')
opar <- par(mar=c(4,4,2,2),las=1)
ylim <- c( min(x[first:nx],lb), max(x[first:nx],ub))
plot(x,ylim=ylim,type='n',xlim=c(first,lx))
usr <- par('usr')
rect(usr[1],usr[3],nx+1,usr[4],border=NA,col='lemonchiffon')
rect(nx1,usr[3],usr[2],usr[4],border=NA,col='lavender')
abline(h= (-3:3)*2 , col ='gray', lty =3)
polygon( c(nx1:lx,lx:nx1), c(lb,rev(ub)), col = 'orange', lty=2,border=NA)
lines(nx1:lx, lb , lty=2)
lines(nx1:lx, ub , lty=2)
lines(x, lwd=2)
lines(nx1:lx, forecast$pred , lwd=2 , col ='white')
box()
par(opar)
dev.off()
prob.dec <- array(NA, dim=fx)
prob.sdec <- array(NA, dim=fx)
prob.ldec <- array(NA, dim=fx)
prob.pval <- array(NA, dim=fx)
perf.pe <- array(0, dim=fx)
perf.mape <- array(0, dim=fx)
perf.se <- array(0, dim=fx)
perf.mse <- array(0, dim=fx)
perf.rmse <- array(0, dim=fx)
for (i in 1:fx) {
locSD <- (ub[i] - forecast$pred[i]) / 1.96
perf.pe[i] = (x[nx+i] - forecast$pred[i]) / forecast$pred[i]
perf.mape[i] = perf.mape[i] + abs(perf.pe[i])
perf.se[i] = (x[nx+i] - forecast$pred[i])^2
perf.mse[i] = perf.mse[i] + perf.se[i]
prob.dec[i] = pnorm((x[nx+i-1] - forecast$pred[i]) / locSD)
prob.sdec[i] = pnorm((x[nx+i-par5] - forecast$pred[i]) / locSD)
prob.ldec[i] = pnorm((x[nx] - forecast$pred[i]) / locSD)
prob.pval[i] = pnorm(abs(x[nx+i] - forecast$pred[i]) / locSD)
}
perf.mape = perf.mape / fx
perf.mse = perf.mse / fx
perf.rmse = sqrt(perf.mse)
bitmap(file='test2.png')
plot(forecast$pred, pch=19, type='b',main='ARIMA Extrapolation Forecast', ylab='Forecast and 95% CI', xlab='time',ylim=c(min(lb),max(ub)))
dum <- forecast$pred
dum[1:12] <- x[(nx+1):lx]
lines(dum, lty=1)
lines(ub,lty=3)
lines(lb,lty=3)
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Univariate ARIMA Extrapolation Forecast',9,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'time',1,header=TRUE)
a<-table.element(a,'Y[t]',1,header=TRUE)
a<-table.element(a,'F[t]',1,header=TRUE)
a<-table.element(a,'95% LB',1,header=TRUE)
a<-table.element(a,'95% UB',1,header=TRUE)
a<-table.element(a,'p-value
(H0: Y[t] = F[t])',1,header=TRUE)
a<-table.element(a,'P(F[t]>Y[t-1])',1,header=TRUE)
a<-table.element(a,'P(F[t]>Y[t-s])',1,header=TRUE)
mylab <- paste('P(F[t]>Y[',nx,sep='')
mylab <- paste(mylab,'])',sep='')
a<-table.element(a,mylab,1,header=TRUE)
a<-table.row.end(a)
for (i in (nx-par5):nx) {
a<-table.row.start(a)
a<-table.element(a,i,header=TRUE)
a<-table.element(a,x[i])
a<-table.element(a,'-')
a<-table.element(a,'-')
a<-table.element(a,'-')
a<-table.element(a,'-')
a<-table.element(a,'-')
a<-table.element(a,'-')
a<-table.element(a,'-')
a<-table.row.end(a)
}
for (i in 1:fx) {
a<-table.row.start(a)
a<-table.element(a,nx+i,header=TRUE)
a<-table.element(a,round(x[nx+i],4))
a<-table.element(a,round(forecast$pred[i],4))
a<-table.element(a,round(lb[i],4))
a<-table.element(a,round(ub[i],4))
a<-table.element(a,round((1-prob.pval[i]),4))
a<-table.element(a,round((1-prob.dec[i]),4))
a<-table.element(a,round((1-prob.sdec[i]),4))
a<-table.element(a,round((1-prob.ldec[i]),4))
a<-table.row.end(a)
}
a<-table.end(a)
table.save(a,file='mytable.tab')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Univariate ARIMA Extrapolation Forecast Performance',7,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'time',1,header=TRUE)
a<-table.element(a,'% S.E.',1,header=TRUE)
a<-table.element(a,'PE',1,header=TRUE)
a<-table.element(a,'MAPE',1,header=TRUE)
a<-table.element(a,'Sq.E',1,header=TRUE)
a<-table.element(a,'MSE',1,header=TRUE)
a<-table.element(a,'RMSE',1,header=TRUE)
a<-table.row.end(a)
for (i in 1:fx) {
a<-table.row.start(a)
a<-table.element(a,nx+i,header=TRUE)
a<-table.element(a,round(perc.se[i],4))
a<-table.element(a,round(perf.pe[i],4))
a<-table.element(a,round(perf.mape[i],4))
a<-table.element(a,round(perf.se[i],4))
a<-table.element(a,round(perf.mse[i],4))
a<-table.element(a,round(perf.rmse[i],4))
a<-table.row.end(a)
}
a<-table.end(a)
table.save(a,file='mytable1.tab')

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code