Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*Unverified author*

R Software Module

rwasp_bootstrapplot.wasp

Title produced by software

Blocked Bootstrap Plot - Central Tendency

Date of computation

Sat, 01 Nov 2008 11:54:11 -0600

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/01/t12255630577vra955g0sn2al5.htm/, Retrieved Sun, 13 Jul 2025 04:25:11 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=20452, Retrieved Sun, 13 Jul 2025 04:25:11 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

248

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F     [Blocked Bootstrap Plot - Central Tendency] [workshop 3] [2007-10-26 12:36:24] [e9ffc5de6f8a7be62f22b142b5b6b1a8]
F    D    [Blocked Bootstrap Plot - Central Tendency] [WS2 Q4] [2008-11-01 17:54:11] [d41d8cd98f00b204e9800998ecf8427e] [Current]
F           [Blocked Bootstrap Plot - Central Tendency] [P1 Q4] [2008-11-03 21:47:23] [547636b63517c1c2916a747d66b36ebf] 

Feedback Forum

2008-11-07 13:33:07 [Siem Van Opstal] [reply] 
Het is een moeilijke keuze. Bij de midrange is de spreiding het kleinst dus de betrouwbaarheid het grootst maar als er outliers zijn, zijn het ineens heel sterke. Bij het gemiddelde is het betrouwbaarheidsinterval iets groter maar al de gegevens blijven dicht bij het gemiddelde liggen, er zijn niet zo'n sterke outliers.
2008-11-07 15:20:11 [Sofie Vanbrabant] [reply] 
Jij zou kiezen voor de midrange. Dit is correct aangezien er weinig verschuiving is en een kleine spreiding zich voordoet. Er zijn wel veel outliers die wél relevant zijn en waar rekening mee gehouden moet worden. 
Je kan daarom ook kiezen voor het rekenkundig gemiddelde.
2008-11-08 15:26:34 [Kim Huysmans] [reply] 
Het antwoord van de student is correct. Als gemiddelde kunnen we het beste de midrange nemen. Hier is de spreiding (of variantie) het kleinst. Maar de midrange is wel gevoelig voor outliers. Omdat deze outliers een probleem kunnen vormen kan je ook kiezen voor de mean. Hier is de spreiding dan wel groter, maar er zijn geen outliers dus is het gemiddelde iets zekerder. Beide antwoorden zijn correct.
  2008-11-10 22:33:58 [Nilay Erdogdu] [reply] 
Ik ben het volledig eens met deze student. De bootstrap is een methode die 500 keer het gemiddelde opnieuw berekend. Elke keer gaat de pc het gemiddelde eruit gooien, daarna terugleggen. Deze scatterplot is onze 500 keer.  
 
simulation of meam, scatterplot is normaal verdeeld. 
simulation of median, duidelijk patroon. 
simulation of midrange, patroon wordt duidelijker. 
 
Hoe groter de variantie, hoe minder nauwkeurig we ons gemiddelde hebben.
2008-11-09 16:48:50 [Kevin Engels] [reply] 
Het antwoord op Q4 is correct,de midrange is inderdaad de beste keuze omdat de spreiding hier het kleinst is en de twee betrouwbaarheidsintervallen dus het dichtst bij elkaar liggen.
2008-11-11 11:54:27 [Elias Van Deun] [reply] 
Het antwoord is correct, de midrange vertoont de kleinste spreiding. Maar deze is wel veel gevoeliger voor outliers dan pakweg de mean en median. Deze twee benaderingen hebben wel een grote spreiding waardoor de betrouwbaarheid daalt. Alle drie de benaderingen hebben zowel voor- als nadelen.
2008-11-11 13:06:06 [Bernard Femont] [reply] 
Goed antwoord van de student. Voor het gemiddelde te nemen kunnen we best gebruik maken van de midrange. De variantie is hier het minst groot. Er kan ook gekozen worden voor de mean indien bij de variantie een opgeblazen waarde(s) wordt verkregen door de gevoeligheid aan outliers. Bij de mean zijn er geen outlier maar is dan weer de spreiding groter... Zelf kiezen welke we nemen voor het gemiddelde 
2008-11-11 22:44:26 [Joachim Van Hemelen] [reply] 
'Beste' estimator is hier een duaal begrip. “Beste” kan zowel als meest nauwkeurig, als meest zeker gemiddelde geïnterpreteerd worden. 
 
Het meest nauwkeurige komt tot stand bij de mid-range, maar enkel als er geen outliers zijn. Outliers zijn hier dus zeer relevant. 
 
Wordt er geopteerd voor het meest zekere gemiddelde, dan kan men als estimator best de mean nemen. Hier is de spreiding en het betrouwbaarheidsinterval veel groter, met gevolg dat er een kleinere nauwkeurigheid is. 
2008-11-12 11:32:51 [Toon Nauwelaerts] [reply] 
Ok al is de midrange de minst grote spreiding toch kunnen de outliers gevaarlijk zijn om een juiste interpretatie te geven.

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	6 seconds
R Server	'Herman Ole Andreas Wold' @ 193.190.124.10:1001

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 6 seconds \tabularnewline
R Server & 'Herman Ole Andreas Wold' @ 193.190.124.10:1001 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=20452&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]6 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Herman Ole Andreas Wold' @ 193.190.124.10:1001[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=20452&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=20452&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	6 seconds
R Server	'Herman Ole Andreas Wold' @ 193.190.124.10:1001

Estimation Results of Blocked Bootstrap
statistic	Q1	Estimate	Q3	S.D.	IQR
mean	85.7418032786885	86.8934426229508	88.0327868852459	1.63084085847983	2.29098360655738
median	86.4	87.3	88	1.87844066146292	1.59999999999999
midrange	88.1	88.1	88.85	0.842523192951581	0.75

\begin{tabular}{lllllllll}
\hline
Estimation Results of Blocked Bootstrap \tabularnewline
statistic & Q1 & Estimate & Q3 & S.D. & IQR \tabularnewline
mean & 85.7418032786885 & 86.8934426229508 & 88.0327868852459 & 1.63084085847983 & 2.29098360655738 \tabularnewline
median & 86.4 & 87.3 & 88 & 1.87844066146292 & 1.59999999999999 \tabularnewline
midrange & 88.1 & 88.1 & 88.85 & 0.842523192951581 & 0.75 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=20452&T=1

[TABLE]
[ROW][C]Estimation Results of Blocked Bootstrap[/C][/ROW]
[ROW][C]statistic[/C][C]Q1[/C][C]Estimate[/C][C]Q3[/C][C]S.D.[/C][C]IQR[/C][/ROW]
[ROW][C]mean[/C][C]85.7418032786885[/C][C]86.8934426229508[/C][C]88.0327868852459[/C][C]1.63084085847983[/C][C]2.29098360655738[/C][/ROW]
[ROW][C]median[/C][C]86.4[/C][C]87.3[/C][C]88[/C][C]1.87844066146292[/C][C]1.59999999999999[/C][/ROW]
[ROW][C]midrange[/C][C]88.1[/C][C]88.1[/C][C]88.85[/C][C]0.842523192951581[/C][C]0.75[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=20452&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=20452&T=1

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Estimation Results of Blocked Bootstrap
statistic	Q1	Estimate	Q3	S.D.	IQR
mean	85.7418032786885	86.8934426229508	88.0327868852459	1.63084085847983	2.29098360655738
median	86.4	87.3	88	1.87844066146292	1.59999999999999
midrange	88.1	88.1	88.85	0.842523192951581	0.75

Figure 1

PNG link

Postscript link

PDF link

Figure 2

PNG link

Postscript link

PDF link

Figure 3

PNG link

Postscript link

PDF link

Figure 4

PNG link

Postscript link

PDF link

Figure 5

PNG link

Postscript link

PDF link

Figure 6

PNG link

Postscript link

PDF link

Figure 7

PNG link

Postscript link

PDF link

Parameters (Session):

par1 = 500 ; par2 = 12 ;

Parameters (R input):

par1 = 500 ; par2 = 12 ;

R code (references can be found in the software module):

par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
if (par1 < 10) par1 = 10
if (par1 > 5000) par1 = 5000
if (par2 < 3) par2 = 3
if (par2 > length(x)) par2 = length(x)
library(lattice)
library(boot)
boot.stat <- function(s)
{
s.mean <- mean(s)
s.median <- median(s)
s.midrange <- (max(s) + min(s)) / 2
c(s.mean, s.median, s.midrange)
}
(r <- tsboot(x, boot.stat, R=par1, l=12, sim='fixed'))
bitmap(file='plot1.png')
plot(r$t[,1],type='p',ylab='simulated values',main='Simulation of Mean')
grid()
dev.off()
bitmap(file='plot2.png')
plot(r$t[,2],type='p',ylab='simulated values',main='Simulation of Median')
grid()
dev.off()
bitmap(file='plot3.png')
plot(r$t[,3],type='p',ylab='simulated values',main='Simulation of Midrange')
grid()
dev.off()
bitmap(file='plot4.png')
densityplot(~r$t[,1],col='black',main='Density Plot',xlab='mean')
dev.off()
bitmap(file='plot5.png')
densityplot(~r$t[,2],col='black',main='Density Plot',xlab='median')
dev.off()
bitmap(file='plot6.png')
densityplot(~r$t[,3],col='black',main='Density Plot',xlab='midrange')
dev.off()
z <- data.frame(cbind(r$t[,1],r$t[,2],r$t[,3]))
colnames(z) <- list('mean','median','midrange')
bitmap(file='plot7.png')
boxplot(z,notch=TRUE,ylab='simulated values',main='Bootstrap Simulation - Central Tendency')
grid()
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Estimation Results of Blocked Bootstrap',6,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'statistic',header=TRUE)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,'Estimate',header=TRUE)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,'S.D.',header=TRUE)
a<-table.element(a,'IQR',header=TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
q1 <- quantile(r$t[,1],0.25)[[1]]
q3 <- quantile(r$t[,1],0.75)[[1]]
a<-table.element(a,q1)
a<-table.element(a,r$t0[1])
a<-table.element(a,q3)
a<-table.element(a,sqrt(var(r$t[,1])))
a<-table.element(a,q3-q1)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
q1 <- quantile(r$t[,2],0.25)[[1]]
q3 <- quantile(r$t[,2],0.75)[[1]]
a<-table.element(a,q1)
a<-table.element(a,r$t0[2])
a<-table.element(a,q3)
a<-table.element(a,sqrt(var(r$t[,2])))
a<-table.element(a,q3-q1)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'midrange',header=TRUE)
q1 <- quantile(r$t[,3],0.25)[[1]]
q3 <- quantile(r$t[,3],0.75)[[1]]
a<-table.element(a,q1)
a<-table.element(a,r$t0[3])
a<-table.element(a,q3)
a<-table.element(a,sqrt(var(r$t[,3])))
a<-table.element(a,q3-q1)
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code