Free Statistics

of Irreproducible Research!

Author's title

Author*Unverified author*
R Software Modulerwasp_bootstrapplot.wasp
Title produced by softwareBlocked Bootstrap Plot - Central Tendency
Date of computationSat, 01 Nov 2008 11:54:11 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/01/t12255630577vra955g0sn2al5.htm/, Retrieved Mon, 20 May 2024 04:56:39 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=20452, Retrieved Mon, 20 May 2024 04:56:39 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact179
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Blocked Bootstrap Plot - Central Tendency] [workshop 3] [2007-10-26 12:36:24] [e9ffc5de6f8a7be62f22b142b5b6b1a8]
F    D    [Blocked Bootstrap Plot - Central Tendency] [WS2 Q4] [2008-11-01 17:54:11] [d41d8cd98f00b204e9800998ecf8427e] [Current]
F           [Blocked Bootstrap Plot - Central Tendency] [P1 Q4] [2008-11-03 21:47:23] [547636b63517c1c2916a747d66b36ebf]
Feedback Forum
2008-11-07 13:33:07 [Siem Van Opstal] [reply
Het is een moeilijke keuze. Bij de midrange is de spreiding het kleinst dus de betrouwbaarheid het grootst maar als er outliers zijn, zijn het ineens heel sterke. Bij het gemiddelde is het betrouwbaarheidsinterval iets groter maar al de gegevens blijven dicht bij het gemiddelde liggen, er zijn niet zo'n sterke outliers.
2008-11-07 15:20:11 [Sofie Vanbrabant] [reply
Jij zou kiezen voor de midrange. Dit is correct aangezien er weinig verschuiving is en een kleine spreiding zich voordoet. Er zijn wel veel outliers die wél relevant zijn en waar rekening mee gehouden moet worden.
Je kan daarom ook kiezen voor het rekenkundig gemiddelde.
2008-11-08 15:26:34 [Kim Huysmans] [reply
Het antwoord van de student is correct. Als gemiddelde kunnen we het beste de midrange nemen. Hier is de spreiding (of variantie) het kleinst. Maar de midrange is wel gevoelig voor outliers. Omdat deze outliers een probleem kunnen vormen kan je ook kiezen voor de mean. Hier is de spreiding dan wel groter, maar er zijn geen outliers dus is het gemiddelde iets zekerder. Beide antwoorden zijn correct.
  2008-11-10 22:33:58 [Nilay Erdogdu] [reply
Ik ben het volledig eens met deze student. De bootstrap is een methode die 500 keer het gemiddelde opnieuw berekend. Elke keer gaat de pc het gemiddelde eruit gooien, daarna terugleggen. Deze scatterplot is onze 500 keer.

simulation of meam, scatterplot is normaal verdeeld.
simulation of median, duidelijk patroon.
simulation of midrange, patroon wordt duidelijker.

Hoe groter de variantie, hoe minder nauwkeurig we ons gemiddelde hebben.
2008-11-09 16:48:50 [Kevin Engels] [reply
Het antwoord op Q4 is correct,de midrange is inderdaad de beste keuze omdat de spreiding hier het kleinst is en de twee betrouwbaarheidsintervallen dus het dichtst bij elkaar liggen.
2008-11-11 11:54:27 [Elias Van Deun] [reply
Het antwoord is correct, de midrange vertoont de kleinste spreiding. Maar deze is wel veel gevoeliger voor outliers dan pakweg de mean en median. Deze twee benaderingen hebben wel een grote spreiding waardoor de betrouwbaarheid daalt. Alle drie de benaderingen hebben zowel voor- als nadelen.
2008-11-11 13:06:06 [Bernard Femont] [reply
Goed antwoord van de student. Voor het gemiddelde te nemen kunnen we best gebruik maken van de midrange. De variantie is hier het minst groot. Er kan ook gekozen worden voor de mean indien bij de variantie een opgeblazen waarde(s) wordt verkregen door de gevoeligheid aan outliers. Bij de mean zijn er geen outlier maar is dan weer de spreiding groter... Zelf kiezen welke we nemen voor het gemiddelde
2008-11-11 22:44:26 [Joachim Van Hemelen] [reply
'Beste' estimator is hier een duaal begrip. “Beste” kan zowel als meest nauwkeurig, als meest zeker gemiddelde geïnterpreteerd worden.

Het meest nauwkeurige komt tot stand bij de mid-range, maar enkel als er geen outliers zijn. Outliers zijn hier dus zeer relevant.

Wordt er geopteerd voor het meest zekere gemiddelde, dan kan men als estimator best de mean nemen. Hier is de spreiding en het betrouwbaarheidsinterval veel groter, met gevolg dat er een kleinere nauwkeurigheid is.
2008-11-12 11:32:51 [Toon Nauwelaerts] [reply
Ok al is de midrange de minst grote spreiding toch kunnen de outliers gevaarlijk zijn om een juiste interpretatie te geven.

Post a new message
Dataseries X:
109,20
88,60
94,30
98,30
86,40
80,60
104,10
108,20
93,40
71,90
94,10
94,90
96,40
91,10
84,40
86,40
88,00
75,10
109,70
103,00
82,10
68,00
96,40
94,30
90,00
88,00
76,10
82,50
81,40
66,50
97,20
94,10
80,70
70,50
87,80
89,50
99,60
84,20
75,10
92,00
80,80
73,10
99,80
90,00
83,10
72,40
78,80
87,30
91,00
80,10
73,60
86,40
74,50
71,20
92,40
81,50
85,30
69,90
84,20
90,70
100,30




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time6 seconds
R Server'Herman Ole Andreas Wold' @ 193.190.124.10:1001

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 6 seconds \tabularnewline
R Server & 'Herman Ole Andreas Wold' @ 193.190.124.10:1001 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=20452&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]6 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Herman Ole Andreas Wold' @ 193.190.124.10:1001[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=20452&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=20452&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time6 seconds
R Server'Herman Ole Andreas Wold' @ 193.190.124.10:1001







Estimation Results of Blocked Bootstrap
statisticQ1EstimateQ3S.D.IQR
mean85.741803278688586.893442622950888.03278688524591.630840858479832.29098360655738
median86.487.3881.878440661462921.59999999999999
midrange88.188.188.850.8425231929515810.75

\begin{tabular}{lllllllll}
\hline
Estimation Results of Blocked Bootstrap \tabularnewline
statistic & Q1 & Estimate & Q3 & S.D. & IQR \tabularnewline
mean & 85.7418032786885 & 86.8934426229508 & 88.0327868852459 & 1.63084085847983 & 2.29098360655738 \tabularnewline
median & 86.4 & 87.3 & 88 & 1.87844066146292 & 1.59999999999999 \tabularnewline
midrange & 88.1 & 88.1 & 88.85 & 0.842523192951581 & 0.75 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=20452&T=1

[TABLE]
[ROW][C]Estimation Results of Blocked Bootstrap[/C][/ROW]
[ROW][C]statistic[/C][C]Q1[/C][C]Estimate[/C][C]Q3[/C][C]S.D.[/C][C]IQR[/C][/ROW]
[ROW][C]mean[/C][C]85.7418032786885[/C][C]86.8934426229508[/C][C]88.0327868852459[/C][C]1.63084085847983[/C][C]2.29098360655738[/C][/ROW]
[ROW][C]median[/C][C]86.4[/C][C]87.3[/C][C]88[/C][C]1.87844066146292[/C][C]1.59999999999999[/C][/ROW]
[ROW][C]midrange[/C][C]88.1[/C][C]88.1[/C][C]88.85[/C][C]0.842523192951581[/C][C]0.75[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=20452&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=20452&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Estimation Results of Blocked Bootstrap
statisticQ1EstimateQ3S.D.IQR
mean85.741803278688586.893442622950888.03278688524591.630840858479832.29098360655738
median86.487.3881.878440661462921.59999999999999
midrange88.188.188.850.8425231929515810.75



Parameters (Session):
par1 = 500 ; par2 = 12 ;
Parameters (R input):
par1 = 500 ; par2 = 12 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
if (par1 < 10) par1 = 10
if (par1 > 5000) par1 = 5000
if (par2 < 3) par2 = 3
if (par2 > length(x)) par2 = length(x)
library(lattice)
library(boot)
boot.stat <- function(s)
{
s.mean <- mean(s)
s.median <- median(s)
s.midrange <- (max(s) + min(s)) / 2
c(s.mean, s.median, s.midrange)
}
(r <- tsboot(x, boot.stat, R=par1, l=12, sim='fixed'))
bitmap(file='plot1.png')
plot(r$t[,1],type='p',ylab='simulated values',main='Simulation of Mean')
grid()
dev.off()
bitmap(file='plot2.png')
plot(r$t[,2],type='p',ylab='simulated values',main='Simulation of Median')
grid()
dev.off()
bitmap(file='plot3.png')
plot(r$t[,3],type='p',ylab='simulated values',main='Simulation of Midrange')
grid()
dev.off()
bitmap(file='plot4.png')
densityplot(~r$t[,1],col='black',main='Density Plot',xlab='mean')
dev.off()
bitmap(file='plot5.png')
densityplot(~r$t[,2],col='black',main='Density Plot',xlab='median')
dev.off()
bitmap(file='plot6.png')
densityplot(~r$t[,3],col='black',main='Density Plot',xlab='midrange')
dev.off()
z <- data.frame(cbind(r$t[,1],r$t[,2],r$t[,3]))
colnames(z) <- list('mean','median','midrange')
bitmap(file='plot7.png')
boxplot(z,notch=TRUE,ylab='simulated values',main='Bootstrap Simulation - Central Tendency')
grid()
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Estimation Results of Blocked Bootstrap',6,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'statistic',header=TRUE)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,'Estimate',header=TRUE)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,'S.D.',header=TRUE)
a<-table.element(a,'IQR',header=TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
q1 <- quantile(r$t[,1],0.25)[[1]]
q3 <- quantile(r$t[,1],0.75)[[1]]
a<-table.element(a,q1)
a<-table.element(a,r$t0[1])
a<-table.element(a,q3)
a<-table.element(a,sqrt(var(r$t[,1])))
a<-table.element(a,q3-q1)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
q1 <- quantile(r$t[,2],0.25)[[1]]
q3 <- quantile(r$t[,2],0.75)[[1]]
a<-table.element(a,q1)
a<-table.element(a,r$t0[2])
a<-table.element(a,q3)
a<-table.element(a,sqrt(var(r$t[,2])))
a<-table.element(a,q3-q1)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'midrange',header=TRUE)
q1 <- quantile(r$t[,3],0.25)[[1]]
q3 <- quantile(r$t[,3],0.75)[[1]]
a<-table.element(a,q1)
a<-table.element(a,r$t0[3])
a<-table.element(a,q3)
a<-table.element(a,sqrt(var(r$t[,3])))
a<-table.element(a,q3-q1)
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')