Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_smp.wasp
Title produced by softwareStandard Deviation-Mean Plot
Date of computationMon, 08 Dec 2008 11:21:20 -0700
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Dec/08/t1228760539j69f789kpqs0t9y.htm/, Retrieved Thu, 16 May 2024 16:25:31 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=30643, Retrieved Thu, 16 May 2024 16:25:31 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact146
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F       [Standard Deviation-Mean Plot] [Q1 Uitvoer EU - SMP] [2008-12-08 18:21:20] [8da7502cfecb272886bc60b3f290b8b8] [Current]
F   PD    [Standard Deviation-Mean Plot] [Q1 Uitvoer EU - SMP] [2008-12-08 18:35:03] [9e54d1454d464f1bf9ee4a54d5d56945]
Feedback Forum
2008-12-14 09:28:05 [Kristof Van Esbroeck] [reply
Blijkbaar heeft student de taak trachten op te lossen aan de hand van de eigen datareeks. Deze werd echter niet in het document opgenomen. Dit maakt een reproductie, interpretatie en analyse uiteraard niet mogelijk.

Ik maak een reproductie van Step 1 op basis van de Unemployment data.


http://www.freestatistics.org/blog/index.php?v=date/2008/Dec/14/t1229240118n4b6am5ynn7a5bl.htm

We trachten in Step 1 de optimale lambawaarde te berekenen.

Uit de tabel Regression: ln S.E.(k) = alpha + beta * ln Mean(k) kunnen we een lamba waarde van 0.467057973925013 afleiden.

Als we 1 in vermindering hadden gebracht met de Beta waarde had dit ook geresulteerd in de optimale Lamba Coëfficiënt. Nl, (1 - 0.532942026074987) is gelijk aan 0.467057973925013.

Op de grafische weergave van de Standard Deviation – Mean Plot noteren we op de x as het gemiddelde en op y as de standaard fout.
2008-12-14 13:26:18 [Steven Hulsmans] [reply
De tijdreeks wordt opgedeeld in secties van 12 waarnemingen, dus iedere stip op de grafieken representeert 1 jaar. We kunnen zien dat er geen echte outlier aanwezig is en alle punten kort tegen de regressierechte liggen. De p value heeft betrekking op de beta coefficiënt.
2008-12-15 21:13:27 [Inge Meelberghs] [reply
Je hebt twee keer de mean plot berekent. 1 keer waarbij je de seizonale periode op 12 hebt gezet en de andere keer op 4 doordat je anders te weinig observaties in je scatterplot had. Het is inderdaad zo dat je de seizonaliteitsparameter op 12 moet zetten omdat het hier gaat om maandelijkse gegevens. Daarom weet ik zelf niet of je dit dan zomaar van 12 naar 4 mag veranderen. Misschien moet je daar eens achter luistere in het college...

Uit de eerste tabel van de SMP kunnen we de beta waarde en de p-waarde aflezen. De p-waarde heeft betrekking op de beta waarde van de regressie rechte. Hier wordt de beta dus eigenlijk getoetst. Aan de hand van deze waarde kunnen we ook nagaan of de helling positief of negatief is en of deze te wijten is aan toeval ?
In dit geval bedraagt β 0.129706903428327 wat wil zeggen de rechte dus een stijgend verloop aanneemt. De P-waarde is vrij klein, 0.0704769404145038. Deze is dus > dan 5% wat ervoor zorgt dat de beta waarde niet significant is van 0. (aan de eerste voorwaarde is in dit geval dus niet voldaan)

Wat je over de scatterplot zelf zegt klopt. Aan de rechterkant van de grafiek zien we duidelijk een outlier die we niet mogen negeren.
Als outliers in de scatterplot meer naar links of rechts wijken moeten we opletten doordat deze dan een invloed hebben op het verloop van de regressierechte. In deze berekening is dit het geval waardoor er niet aan de tweede voorwaarde is voldaan.

Uit de tweede tabel kunnen we dan de lambda waarde aflezen die -0.2659977660802 bedraagt. Maar doordat er niet aan de twee voorwaarden ( beta significant van 0 en geen invloedrijke outliers) is voldaan mogen we deze niet als optimale lambda waarde aannemen en moeten we 1 nemen.

Post a new message
Dataseries X:
11178,4
9516,4
12102,8
12989,0
11610,2
10205,5
11356,2
11307,1
12648,6
11947,2
11714,1
12192,5
11268,8
9097,4
12639,8
13040,1
11687,3
11191,7
11391,9
11793,1
13933,2
12778,1
11810,3
13698,4
11956,6
10723,8
13938,9
13979,8
13807,4
12973,9
12509,8
12934,1
14908,3
13772,1
13012,6
14049,9
11816,5
11593,2
14466,2
13615,9
14733,9
13880,7
13527,5
13584,0
16170,2
13260,6
14741,9
15486,5
13154,5
12621,2
15031,6
15452,4
15428
13105,9
14716,8
14180,0
16202,2
14392,4
15140,6
15960,1
14351,3
13230,2
15202,1
17157,3
16159,1
13405,7
17224,7
17338,4
17370,6
18817,8
16593,2
17979,5
17015,2




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Sir Ronald Aylmer Fisher' @ 193.190.124.24

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'Sir Ronald Aylmer Fisher' @ 193.190.124.24 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=30643&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Sir Ronald Aylmer Fisher' @ 193.190.124.24[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=30643&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=30643&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Sir Ronald Aylmer Fisher' @ 193.190.124.24







Standard Deviation-Mean Plot
SectionMeanStandard DeviationRange
111564970.4666337761063472.6
212027.50833333331309.711475831324835.8
313213.93333333331120.045148711214184.5
413906.4251341.162676815094577
514615.4751158.970323665093581
616235.8251804.902110226485587.6

\begin{tabular}{lllllllll}
\hline
Standard Deviation-Mean Plot \tabularnewline
Section & Mean & Standard Deviation & Range \tabularnewline
1 & 11564 & 970.466633776106 & 3472.6 \tabularnewline
2 & 12027.5083333333 & 1309.71147583132 & 4835.8 \tabularnewline
3 & 13213.9333333333 & 1120.04514871121 & 4184.5 \tabularnewline
4 & 13906.425 & 1341.16267681509 & 4577 \tabularnewline
5 & 14615.475 & 1158.97032366509 & 3581 \tabularnewline
6 & 16235.825 & 1804.90211022648 & 5587.6 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=30643&T=1

[TABLE]
[ROW][C]Standard Deviation-Mean Plot[/C][/ROW]
[ROW][C]Section[/C][C]Mean[/C][C]Standard Deviation[/C][C]Range[/C][/ROW]
[ROW][C]1[/C][C]11564[/C][C]970.466633776106[/C][C]3472.6[/C][/ROW]
[ROW][C]2[/C][C]12027.5083333333[/C][C]1309.71147583132[/C][C]4835.8[/C][/ROW]
[ROW][C]3[/C][C]13213.9333333333[/C][C]1120.04514871121[/C][C]4184.5[/C][/ROW]
[ROW][C]4[/C][C]13906.425[/C][C]1341.16267681509[/C][C]4577[/C][/ROW]
[ROW][C]5[/C][C]14615.475[/C][C]1158.97032366509[/C][C]3581[/C][/ROW]
[ROW][C]6[/C][C]16235.825[/C][C]1804.90211022648[/C][C]5587.6[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=30643&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=30643&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Standard Deviation-Mean Plot
SectionMeanStandard DeviationRange
111564970.4666337761063472.6
212027.50833333331309.711475831324835.8
313213.93333333331120.045148711214184.5
413906.4251341.162676815094577
514615.4751158.970323665093581
616235.8251804.902110226485587.6







Regression: S.E.(k) = alpha + beta * Mean(k)
alpha-479.007902186092
beta0.129706903428327
S.D.0.0529506115773352
T-STAT2.44958272557226
p-value0.0704769404145038

\begin{tabular}{lllllllll}
\hline
Regression: S.E.(k) = alpha + beta * Mean(k) \tabularnewline
alpha & -479.007902186092 \tabularnewline
beta & 0.129706903428327 \tabularnewline
S.D. & 0.0529506115773352 \tabularnewline
T-STAT & 2.44958272557226 \tabularnewline
p-value & 0.0704769404145038 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=30643&T=2

[TABLE]
[ROW][C]Regression: S.E.(k) = alpha + beta * Mean(k)[/C][/ROW]
[ROW][C]alpha[/C][C]-479.007902186092[/C][/ROW]
[ROW][C]beta[/C][C]0.129706903428327[/C][/ROW]
[ROW][C]S.D.[/C][C]0.0529506115773352[/C][/ROW]
[ROW][C]T-STAT[/C][C]2.44958272557226[/C][/ROW]
[ROW][C]p-value[/C][C]0.0704769404145038[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=30643&T=2

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=30643&T=2

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Regression: S.E.(k) = alpha + beta * Mean(k)
alpha-479.007902186092
beta0.129706903428327
S.D.0.0529506115773352
T-STAT2.44958272557226
p-value0.0704769404145038







Regression: ln S.E.(k) = alpha + beta * ln Mean(k)
alpha-4.90204779959973
beta1.26599776608020
S.D.0.553985999793507
T-STAT2.28525227451974
p-value0.0842969392041781
Lambda-0.265997766080202

\begin{tabular}{lllllllll}
\hline
Regression: ln S.E.(k) = alpha + beta * ln Mean(k) \tabularnewline
alpha & -4.90204779959973 \tabularnewline
beta & 1.26599776608020 \tabularnewline
S.D. & 0.553985999793507 \tabularnewline
T-STAT & 2.28525227451974 \tabularnewline
p-value & 0.0842969392041781 \tabularnewline
Lambda & -0.265997766080202 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=30643&T=3

[TABLE]
[ROW][C]Regression: ln S.E.(k) = alpha + beta * ln Mean(k)[/C][/ROW]
[ROW][C]alpha[/C][C]-4.90204779959973[/C][/ROW]
[ROW][C]beta[/C][C]1.26599776608020[/C][/ROW]
[ROW][C]S.D.[/C][C]0.553985999793507[/C][/ROW]
[ROW][C]T-STAT[/C][C]2.28525227451974[/C][/ROW]
[ROW][C]p-value[/C][C]0.0842969392041781[/C][/ROW]
[ROW][C]Lambda[/C][C]-0.265997766080202[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=30643&T=3

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=30643&T=3

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Regression: ln S.E.(k) = alpha + beta * ln Mean(k)
alpha-4.90204779959973
beta1.26599776608020
S.D.0.553985999793507
T-STAT2.28525227451974
p-value0.0842969392041781
Lambda-0.265997766080202



Parameters (Session):
par1 = 12 ;
Parameters (R input):
par1 = 12 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
(n <- length(x))
(np <- floor(n / par1))
arr <- array(NA,dim=c(par1,np))
j <- 0
k <- 1
for (i in 1:(np*par1))
{
j = j + 1
arr[j,k] <- x[i]
if (j == par1) {
j = 0
k=k+1
}
}
arr
arr.mean <- array(NA,dim=np)
arr.sd <- array(NA,dim=np)
arr.range <- array(NA,dim=np)
for (j in 1:np)
{
arr.mean[j] <- mean(arr[,j],na.rm=TRUE)
arr.sd[j] <- sd(arr[,j],na.rm=TRUE)
arr.range[j] <- max(arr[,j],na.rm=TRUE) - min(arr[,j],na.rm=TRUE)
}
arr.mean
arr.sd
arr.range
(lm1 <- lm(arr.sd~arr.mean))
(lnlm1 <- lm(log(arr.sd)~log(arr.mean)))
(lm2 <- lm(arr.range~arr.mean))
bitmap(file='test1.png')
plot(arr.mean,arr.sd,main='Standard Deviation-Mean Plot',xlab='mean',ylab='standard deviation')
dev.off()
bitmap(file='test2.png')
plot(arr.mean,arr.range,main='Range-Mean Plot',xlab='mean',ylab='range')
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Standard Deviation-Mean Plot',4,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Section',header=TRUE)
a<-table.element(a,'Mean',header=TRUE)
a<-table.element(a,'Standard Deviation',header=TRUE)
a<-table.element(a,'Range',header=TRUE)
a<-table.row.end(a)
for (j in 1:np) {
a<-table.row.start(a)
a<-table.element(a,j,header=TRUE)
a<-table.element(a,arr.mean[j])
a<-table.element(a,arr.sd[j] )
a<-table.element(a,arr.range[j] )
a<-table.row.end(a)
}
a<-table.end(a)
table.save(a,file='mytable.tab')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Regression: S.E.(k) = alpha + beta * Mean(k)',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'alpha',header=TRUE)
a<-table.element(a,lm1$coefficients[[1]])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'beta',header=TRUE)
a<-table.element(a,lm1$coefficients[[2]])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'S.D.',header=TRUE)
a<-table.element(a,summary(lm1)$coefficients[2,2])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'T-STAT',header=TRUE)
a<-table.element(a,summary(lm1)$coefficients[2,3])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'p-value',header=TRUE)
a<-table.element(a,summary(lm1)$coefficients[2,4])
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable1.tab')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Regression: ln S.E.(k) = alpha + beta * ln Mean(k)',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'alpha',header=TRUE)
a<-table.element(a,lnlm1$coefficients[[1]])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'beta',header=TRUE)
a<-table.element(a,lnlm1$coefficients[[2]])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'S.D.',header=TRUE)
a<-table.element(a,summary(lnlm1)$coefficients[2,2])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'T-STAT',header=TRUE)
a<-table.element(a,summary(lnlm1)$coefficients[2,3])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'p-value',header=TRUE)
a<-table.element(a,summary(lnlm1)$coefficients[2,4])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Lambda',header=TRUE)
a<-table.element(a,1-lnlm1$coefficients[[2]])
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable2.tab')