Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*The author of this computation has been verified*

R Software Module

rwasp_smp.wasp

Title produced by software

Standard Deviation-Mean Plot

Date of computation

Mon, 08 Dec 2008 11:21:20 -0700

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Dec/08/t1228760539j69f789kpqs0t9y.htm/, Retrieved Thu, 16 May 2024 16:25:31 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=30643, Retrieved Thu, 16 May 2024 16:25:31 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

146

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F       [Standard Deviation-Mean Plot] [Q1 Uitvoer EU - SMP] [2008-12-08 18:21:20] [8da7502cfecb272886bc60b3f290b8b8] [Current]
F   PD    [Standard Deviation-Mean Plot] [Q1 Uitvoer EU - SMP] [2008-12-08 18:35:03] [9e54d1454d464f1bf9ee4a54d5d56945] 

Feedback Forum

2008-12-14 09:28:05 [Kristof Van Esbroeck] [reply] 
Blijkbaar heeft student de taak trachten op te lossen aan de hand van de eigen datareeks. Deze werd echter niet in het document opgenomen. Dit maakt een reproductie, interpretatie en analyse uiteraard niet mogelijk. 
 
Ik maak een reproductie van Step 1 op basis van de Unemployment data. 
 
 
http://www.freestatistics.org/blog/index.php?v=date/2008/Dec/14/t1229240118n4b6am5ynn7a5bl.htm 
 
We trachten in Step 1 de optimale lambawaarde te berekenen. 
 
Uit de tabel Regression: ln S.E.(k) = alpha + beta * ln Mean(k) kunnen we een lamba waarde van 0.467057973925013 afleiden. 
 
Als we 1 in vermindering hadden gebracht met de Beta waarde had dit ook geresulteerd in de optimale Lamba Coëfficiënt. Nl, (1 - 0.532942026074987) is gelijk aan 0.467057973925013. 
 
Op de grafische weergave van de Standard Deviation – Mean Plot noteren we op de x as het gemiddelde en op y as de standaard fout. 
2008-12-14 13:26:18 [Steven Hulsmans] [reply] 
De tijdreeks wordt opgedeeld in secties van 12 waarnemingen, dus iedere stip op de grafieken representeert 1 jaar. We kunnen zien dat er geen echte outlier aanwezig is en alle punten kort tegen de regressierechte liggen. De p value heeft betrekking op de beta coefficiënt. 
2008-12-15 21:13:27 [Inge Meelberghs] [reply] 
Je hebt twee keer de mean plot berekent. 1 keer waarbij je de seizonale periode op 12 hebt gezet en de andere keer op 4 doordat je anders te weinig observaties in je scatterplot had. Het is inderdaad zo dat je de seizonaliteitsparameter op 12 moet zetten omdat het hier gaat om maandelijkse gegevens. Daarom weet ik zelf niet of je dit dan zomaar van 12 naar 4 mag veranderen. Misschien moet je daar eens achter luistere in het college... 
 
Uit de eerste tabel van de SMP kunnen we de beta waarde en de p-waarde aflezen. De p-waarde heeft betrekking op de beta waarde van de regressie rechte. Hier wordt de beta dus eigenlijk getoetst. Aan de hand van deze waarde kunnen we ook nagaan of de helling positief of negatief is en of deze te wijten is aan toeval ?  
In dit geval bedraagt β 0.129706903428327 wat wil zeggen de rechte dus  een stijgend verloop aanneemt. De P-waarde is vrij klein, 0.0704769404145038. Deze is dus > dan 5% wat ervoor zorgt dat de beta waarde niet significant is van 0. (aan de eerste  voorwaarde is in dit geval dus niet voldaan) 
 
Wat je over de scatterplot zelf zegt klopt. Aan de rechterkant van de grafiek zien we duidelijk een outlier die we niet mogen negeren. 
Als outliers in de scatterplot meer naar links of rechts wijken moeten we opletten doordat deze dan  een invloed hebben op het verloop van de regressierechte. In deze berekening is dit het geval waardoor er niet aan de tweede voorwaarde is voldaan. 
 
Uit de tweede tabel kunnen we dan de lambda waarde aflezen die -0.2659977660802 bedraagt. Maar doordat er niet aan de twee voorwaarden ( beta significant van 0 en geen invloedrijke outliers) is voldaan mogen we deze niet als optimale lambda waarde aannemen en moeten we 1 nemen.

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	2 seconds
R Server	'Sir Ronald Aylmer Fisher' @ 193.190.124.24

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'Sir Ronald Aylmer Fisher' @ 193.190.124.24 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=30643&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Sir Ronald Aylmer Fisher' @ 193.190.124.24[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=30643&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=30643&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	2 seconds
R Server	'Sir Ronald Aylmer Fisher' @ 193.190.124.24

Standard Deviation-Mean Plot
Section	Mean	Standard Deviation	Range
1	11564	970.466633776106	3472.6
2	12027.5083333333	1309.71147583132	4835.8
3	13213.9333333333	1120.04514871121	4184.5
4	13906.425	1341.16267681509	4577
5	14615.475	1158.97032366509	3581
6	16235.825	1804.90211022648	5587.6

\begin{tabular}{lllllllll}
\hline
Standard Deviation-Mean Plot \tabularnewline
Section & Mean & Standard Deviation & Range \tabularnewline
1 & 11564 & 970.466633776106 & 3472.6 \tabularnewline
2 & 12027.5083333333 & 1309.71147583132 & 4835.8 \tabularnewline
3 & 13213.9333333333 & 1120.04514871121 & 4184.5 \tabularnewline
4 & 13906.425 & 1341.16267681509 & 4577 \tabularnewline
5 & 14615.475 & 1158.97032366509 & 3581 \tabularnewline
6 & 16235.825 & 1804.90211022648 & 5587.6 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=30643&T=1

[TABLE]
[ROW][C]Standard Deviation-Mean Plot[/C][/ROW]
[ROW][C]Section[/C][C]Mean[/C][C]Standard Deviation[/C][C]Range[/C][/ROW]
[ROW][C]1[/C][C]11564[/C][C]970.466633776106[/C][C]3472.6[/C][/ROW]
[ROW][C]2[/C][C]12027.5083333333[/C][C]1309.71147583132[/C][C]4835.8[/C][/ROW]
[ROW][C]3[/C][C]13213.9333333333[/C][C]1120.04514871121[/C][C]4184.5[/C][/ROW]
[ROW][C]4[/C][C]13906.425[/C][C]1341.16267681509[/C][C]4577[/C][/ROW]
[ROW][C]5[/C][C]14615.475[/C][C]1158.97032366509[/C][C]3581[/C][/ROW]
[ROW][C]6[/C][C]16235.825[/C][C]1804.90211022648[/C][C]5587.6[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=30643&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=30643&T=1

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Standard Deviation-Mean Plot
Section	Mean	Standard Deviation	Range
1	11564	970.466633776106	3472.6
2	12027.5083333333	1309.71147583132	4835.8
3	13213.9333333333	1120.04514871121	4184.5
4	13906.425	1341.16267681509	4577
5	14615.475	1158.97032366509	3581
6	16235.825	1804.90211022648	5587.6

Regression: S.E.(k) = alpha + beta * Mean(k)
alpha	-479.007902186092
beta	0.129706903428327
S.D.	0.0529506115773352
T-STAT	2.44958272557226
p-value	0.0704769404145038

\begin{tabular}{lllllllll}
\hline
Regression: S.E.(k) = alpha + beta * Mean(k) \tabularnewline
alpha & -479.007902186092 \tabularnewline
beta & 0.129706903428327 \tabularnewline
S.D. & 0.0529506115773352 \tabularnewline
T-STAT & 2.44958272557226 \tabularnewline
p-value & 0.0704769404145038 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=30643&T=2

[TABLE]
[ROW][C]Regression: S.E.(k) = alpha + beta * Mean(k)[/C][/ROW]
[ROW][C]alpha[/C][C]-479.007902186092[/C][/ROW]
[ROW][C]beta[/C][C]0.129706903428327[/C][/ROW]
[ROW][C]S.D.[/C][C]0.0529506115773352[/C][/ROW]
[ROW][C]T-STAT[/C][C]2.44958272557226[/C][/ROW]
[ROW][C]p-value[/C][C]0.0704769404145038[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=30643&T=2

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=30643&T=2

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Regression: S.E.(k) = alpha + beta * Mean(k)
alpha	-479.007902186092
beta	0.129706903428327
S.D.	0.0529506115773352
T-STAT	2.44958272557226
p-value	0.0704769404145038

Regression: ln S.E.(k) = alpha + beta * ln Mean(k)
alpha	-4.90204779959973
beta	1.26599776608020
S.D.	0.553985999793507
T-STAT	2.28525227451974
p-value	0.0842969392041781
Lambda	-0.265997766080202

\begin{tabular}{lllllllll}
\hline
Regression: ln S.E.(k) = alpha + beta * ln Mean(k) \tabularnewline
alpha & -4.90204779959973 \tabularnewline
beta & 1.26599776608020 \tabularnewline
S.D. & 0.553985999793507 \tabularnewline
T-STAT & 2.28525227451974 \tabularnewline
p-value & 0.0842969392041781 \tabularnewline
Lambda & -0.265997766080202 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=30643&T=3

[TABLE]
[ROW][C]Regression: ln S.E.(k) = alpha + beta * ln Mean(k)[/C][/ROW]
[ROW][C]alpha[/C][C]-4.90204779959973[/C][/ROW]
[ROW][C]beta[/C][C]1.26599776608020[/C][/ROW]
[ROW][C]S.D.[/C][C]0.553985999793507[/C][/ROW]
[ROW][C]T-STAT[/C][C]2.28525227451974[/C][/ROW]
[ROW][C]p-value[/C][C]0.0842969392041781[/C][/ROW]
[ROW][C]Lambda[/C][C]-0.265997766080202[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=30643&T=3

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=30643&T=3

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Regression: ln S.E.(k) = alpha + beta * ln Mean(k)
alpha	-4.90204779959973
beta	1.26599776608020
S.D.	0.553985999793507
T-STAT	2.28525227451974
p-value	0.0842969392041781
Lambda	-0.265997766080202

Figure 1

PNG link

Postscript link

PDF link

Figure 2

PNG link

Postscript link

PDF link

Parameters (Session):

par1 = 12 ;

Parameters (R input):

par1 = 12 ;

R code (references can be found in the software module):

par1 <- as.numeric(par1)
(n <- length(x))
(np <- floor(n / par1))
arr <- array(NA,dim=c(par1,np))
j <- 0
k <- 1
for (i in 1:(np*par1))
{
j = j + 1
arr[j,k] <- x[i]
if (j == par1) {
j = 0
k=k+1
}
}
arr
arr.mean <- array(NA,dim=np)
arr.sd <- array(NA,dim=np)
arr.range <- array(NA,dim=np)
for (j in 1:np)
{
arr.mean[j] <- mean(arr[,j],na.rm=TRUE)
arr.sd[j] <- sd(arr[,j],na.rm=TRUE)
arr.range[j] <- max(arr[,j],na.rm=TRUE) - min(arr[,j],na.rm=TRUE)
}
arr.mean
arr.sd
arr.range
(lm1 <- lm(arr.sd~arr.mean))
(lnlm1 <- lm(log(arr.sd)~log(arr.mean)))
(lm2 <- lm(arr.range~arr.mean))
bitmap(file='test1.png')
plot(arr.mean,arr.sd,main='Standard Deviation-Mean Plot',xlab='mean',ylab='standard deviation')
dev.off()
bitmap(file='test2.png')
plot(arr.mean,arr.range,main='Range-Mean Plot',xlab='mean',ylab='range')
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Standard Deviation-Mean Plot',4,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Section',header=TRUE)
a<-table.element(a,'Mean',header=TRUE)
a<-table.element(a,'Standard Deviation',header=TRUE)
a<-table.element(a,'Range',header=TRUE)
a<-table.row.end(a)
for (j in 1:np) {
a<-table.row.start(a)
a<-table.element(a,j,header=TRUE)
a<-table.element(a,arr.mean[j])
a<-table.element(a,arr.sd[j] )
a<-table.element(a,arr.range[j] )
a<-table.row.end(a)
}
a<-table.end(a)
table.save(a,file='mytable.tab')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Regression: S.E.(k) = alpha + beta * Mean(k)',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'alpha',header=TRUE)
a<-table.element(a,lm1$coefficients[[1]])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'beta',header=TRUE)
a<-table.element(a,lm1$coefficients[[2]])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'S.D.',header=TRUE)
a<-table.element(a,summary(lm1)$coefficients[2,2])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'T-STAT',header=TRUE)
a<-table.element(a,summary(lm1)$coefficients[2,3])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'p-value',header=TRUE)
a<-table.element(a,summary(lm1)$coefficients[2,4])
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable1.tab')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Regression: ln S.E.(k) = alpha + beta * ln Mean(k)',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'alpha',header=TRUE)
a<-table.element(a,lnlm1$coefficients[[1]])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'beta',header=TRUE)
a<-table.element(a,lnlm1$coefficients[[2]])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'S.D.',header=TRUE)
a<-table.element(a,summary(lnlm1)$coefficients[2,2])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'T-STAT',header=TRUE)
a<-table.element(a,summary(lnlm1)$coefficients[2,3])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'p-value',header=TRUE)
a<-table.element(a,summary(lnlm1)$coefficients[2,4])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Lambda',header=TRUE)
a<-table.element(a,1-lnlm1$coefficients[[2]])
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable2.tab')

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code