Free Statistics

of Irreproducible Research!

Author's title

Author*Unverified author*
R Software Module
Title produced by software
Date of computation
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/26/t12276988409q2iminafh395mw.htm/, Retrieved Sat, 01 Jun 2024 10:28:17 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=25614, Retrieved Sat, 01 Jun 2024 10:28:17 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact132
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
-     [Multiple Regression] [Q1 The Seatbeltlaw] [2007-11-14 19:27:43] [8cd6641b921d30ebe00b648d1481bba0]
F R  D  [Multiple Regression] [Toon Wouters] [2008-11-21 08:39:44] [6610d6fd8f463fb18a844c14dc2c3579]
F RMPD      [] [Seatbelt Law Ques...] [-0001-11-30 00:00:00] [7423c12da5de7dfcebe74d8d26e06090] [Current]
Feedback Forum
2008-11-30 19:21:43 [d41d8cd98f00b204e9800998ecf8427e] [reply
Je hebt de vraag goed beantwoord, alleen had je wel kunnen toelichten waarom we seasonal dummies en een lineaire trend hebben gebruikt.
Wanneer we logisch nadenken weten we dat we bij de the multiple regression model the seasonal dummies en de lineare trend moeten gebruiken. We kunnen zeker stellen dat er in de wintermaanden meer ongelukken gebeuren door het slechte weer. Er is ook een lange termijn trend omdat er elk jaar nieuwe technologieën worden uitgevonden die de auto veiliger maakt.
2008-11-30 21:54:12 [Gilliam Schoorel] [reply
Zeer goed antwoord en conclusie van de eerste bewerking. Je had misschien iets meer informatie kunnen geven over de verschillende data zelf. Zoals de lange termijn trend etc
2008-12-01 17:53:57 [Sandra Hofmans] [reply
De vraag is zeer goed beantwoord. Je legt uit wat alle variabelen betekenen en maakt ook de juiste conclusie.
De belangrijkste conclusie die we hieruit kunnen afleiden is dat indien x=0, men 226,39 minder bekomt. Dit betekent dus dat sinds de gordel is ingevoerd dit elke maand minstens 226 levens redt. Ook is het goed opgemerkt dat we hier een éénzijdige test moeten gebruiken, omdat we met zekerheid kunnen stellen dat het dragen van een gordel enkel een positief effect kan hebben. Hier zie je dat de p-value bijna overal 0 is, wat groter is dan de type I Error van 5%. Dit betekent dat het niet te wijten kan zijn toeval.
2008-12-01 17:56:46 [Sandra Hofmans] [reply
tabel:
Dit klopt. De R-square waarde geeft aan hoe het model de data weergeeft. Hoe meer deze de waarde van 1 benadert, hoe beter.
Als je wilt nagaan of deze waarde te wijten is aan toeval, kijken we naar de p-waarde. Deze bedraagt 0 hier en dus kleiner als de Alpha fout en men spreekt hier dus niet over toeval.

Actuals and interpolation:
Goed opgelost. Er is een dalende trend waar te nemen, bovendien merk je het niveauverschil op, wat duidt op de invoering van de wet. Ook zeg je dat de pieken het verschil in maanden voorstellen.

Residuals:
Deze grafiek geeft het verschil weer tussen de verschillende slachtoffers en de voorspelde slachtoffers, dit zijn dus de voorspellingsfouten. Normaal moet het gemiddelde hier constant zijn en gelijk aan nul. Het is goed opgemerkt dat dit hier echter niet het geval is. Dit kan er op wijzen dat we iets gemist hebben, verkeerde assumpties gebruikten.

Je ziet hier op 3 grafieken dat er niet te sprake is van een perfecte normaalverdeling.
Ten eerste op het histogram is te zien, dat er aan de staarten een scheefverdeling waar te nemen is.
Ook het density plot neemt niet de vorm aan van een normaalverdeling.
En ook op het residual normal QQ plot zie je dat de quantielen van de residu’s niet overeenkomen met deze van een normaalverdeling.

Residual lag plot:
Klopt, dit positief verband wijst op voorspelbaarheid.

Autocorrelation:
Klopt, je kan dus aan de hand van deze grafiek besluiten dat het model nog verbetert kan worden. Er mag namelijk geen sprake zijn van een patroon of autocorrelatie dus.
2008-12-01 19:24:20 [Peter Van Doninck] [reply
De commentaar klopt voor een groot deel. Voor de uitleg ivm de p-waarden zou ik wel willen toevoegen dat de student een dubbelzinnige formulering heeft. Het lijkt alsof ze 1,46% vergelijkt met 5%. Eenvoudig is het om rond de parameter een betrouwbaarheidsinterval te nemen, zijnde 2 keer de standaarddeviatie naar boven en naar onderen toe. Wanneer de null-hypothese hier niet invalt, wat dus hier zo is, dan kunnen we besluiten dat de parameter significant verschilt van nul.
2008-12-01 19:46:19 [Peter Van Doninck] [reply
De student maakt correct gebruik van de r-waarde. Bij het histogram kan ik toevoegen dat wanneer je dit vergelijkt met het histogram verkregen bij multiple regression en multiple regression met seasonal dummy's, dat er al een veel normalere verdeling waar te nemen is. Dit valt ook op bij de density plot. De student heeft ook goed weergegeven dat er nog autocorrelatie aanwezig is en dat deze positief is. Bij de lagplot kunnen we eveneens opmerken dat er voorspelbaarheid is op basis van het verleden. Bij de autocorrelatie van de residu's kunnen we zien dat het model nog voor verbeteringen vatbaar is.

Post a new message
Parameters (Session):
Parameters (R input):
R code (references can be found in the software module):