Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_boxcoxlin.wasp
Title produced by softwareBox-Cox Linearity Plot
Date of computationThu, 13 Nov 2008 18:25:48 -0700
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/14/t12266260550a3gx630u5rto2a.htm/, Retrieved Sun, 19 May 2024 11:10:09 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=24899, Retrieved Sun, 19 May 2024 11:10:09 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact252
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F       [Box-Cox Linearity Plot] [Box-cox linearity...] [2008-11-14 01:25:48] [9f72e095d5529918bf5b0810c01bf6ce] [Current]
Feedback Forum
2008-11-15 14:06:04 [Maarten Van Gucht] [reply
De studente heeft geen commentaar of geen grafieken gekopieerd in het word document. Maar de berekening zijn via de link wel goed gedaan. In de box-cox linearity plot krijg je ofwel een stijgende of een dalende lijn.
In een scatterplot krijg je meestal 1 rechte door de waarnemingen heen. Deze is de regressilijn (de optimale lijn door de punten) maar deze is altijd recht. De box-cox transponeert! => voor een beter verband. Wat we meestal hopen te zien is een stijgende kromme. Dit wil zeggen dat er een maximum is (meestal in 2).
De waarden op de X-as varieren tussen de -2 en de 2. Op de Y-as staat de correlatie. hoe kleiner de correlatie, des te minder wijziging in de getransponeerde scatterplot. In het voorbeeld van deze studente is de correlatie zeer klein dus de wijzigin in de getransponeerde scatterplot is ook zeer klein.
2008-11-19 13:44:33 [Sam De Cuyper] [reply
Weer geen interpretatie aan de berekeningen gegeven. De box-cox linearity plot geeft de weegave van het verband tussen 2 variabelen die met elkaar in verband staan. Het resultaat is een stijgende of een dalende rechte (bestudeerd wetmatigheid) met geconcentreerde punten. Het is de bedoeling om de variabelen te transformeren (X-variabele) en zo de scatterplot meer lineair te maken. Nu kan echter de vraag gesteld worden of de transfomatie nuttig is. Indien de grafiek een maximum vertoont zal de waarde van het maximum gekozen worden als lambda. Na transformatie is er visueel weinig verschil te merken, waardoor de transformatie onnuttig is. Ze heeft geen of toch zeer weinig effect.
2008-11-23 13:01:38 [An Knapen] [reply
Box-Cox linearity plot wordt gebruikt om twee variabelen met elkaar in verband te brengen. We laten lambda hierbij schommelen tussen -2 en 2. De correlatie wordt afgelezen op de y-as. Om te weten welke de regressielijn het dichtst benadert, gaan we op zoek naar het maximum. Aangeizen deze grafiek de vorm heeft van een parabool bevindt het maximum zich dus in de top.
In dit voorbeeld bevindt het maximum zich bij lambda gelijk aan 1.48. De correlatie is dan gelijk aan 0.766381226757028

Nadien gaat er een transformatie plaatsvinden om zo een beter verband te krijgen tussen de variabelen(=sterker lineair verband)We kunnen vaststellen dat door gebruik te maken van deze transformatie, het verband slechts weinig verandert.
2008-11-23 15:05:46 [c97d2ae59c98cf77a04815c1edffab5a] [reply
De student heeft wel een conclusie gevormd, maar geen grafieken weergegeven. Ik zou deze conclusie toch nog iets uitbreiden:
uitleg over de boc cox linearity plot:
Men gaat de lambda (=parameter) laten variëren tussen -2 en 2 (zie grafiek) en al deze transformaties toepassen op x. De correlatie tussen de getransformeerde x en (oorsponkelijke) y wordt elke keer berekend en we hopen dat de curve een maximum vertoont, wat wijst op de beste correlatie(na transformatie van x). We hebben het maximum bereikt in het hoogste punt, maar we moeten ons ook afvragen of lambda na dit punt nog zou stijgen. stel dat dit het geval zou zijn, dan kunnen we besluiten dat onze inspanning nutteloos was.
bij deze tijdsreeks vinden we een maximale correlatie van 0,77 voor een lambda van 1,48. de verbetering van de correlatie is wel minimaal bij de variëring van lambda nl een verbetering van O,022.(zie schaal y-as)
2008-11-24 02:49:35 [Anna Hayan] [reply
De studente heeft geen interpretatie gegeven. De berekeningen kloppen wel. Hierbij volgen er nog enkele aanvullingen.
de box-cox linearity plot geeft weer ofwel een stijgende of een dalende lijn.
De rechte regressilijn is de optimale lijn door de punten. Indien de box-cox tranformeert kunnen we dan van een beter verbandspreken. Er is bijvoorbeeld kromme een maximum is in 2, dus meestal in de top.
In dit voorbeeld is het maximum zich bij lambda gelijk aan 1.48. De correlatie is gelijk aan 0.766381226757028. . De correlatie is dan gelijk aan 0.766381226757028. De verbetering van de correlatie is wel miniem bij de wijziging van lambda. ( Op de schaal van de y-as zien we de waarde 0,022.)
2008-11-24 22:50:04 [Jessica Alves Pires] [reply
Juiste berekening. Hier staat wel een interpretatie bij omdat ik de theorie hierover heb teruggevonden. Mijn stelling, dat de transformatie niet veel effect heeft, klopt. Verder staat de theorie hierboven goed uitgelegd en is de aanvullende informatie ook goed.

Post a new message
Dataseries X:
1.1372
1.1139
1.1222
1.1692
1.1702
1.2286
1.2613
1.2646
1.2262
1.1985
1.2007
1.2138
1.2266
1.2176
1.2218
1.249
1.2991
1.3408
1.3119
1.3014
1.3201
1.2938
1.2694
1.2165
1.2037
1.2292
1.2256
1.2015
1.1786
1.1856
1.2103
1.1938
1.202
1.2271
1.277
1.265
1.2684
1.2811
1.2727
1.2611
1.2881
1.3213
1.2999
1.3074
1.3242
1.3516
1.3511
1.3419
1.3716
1.3622
1.3896
1.4227
1.4684
1.457
1.4718
1.4748
1.5527
1.575
1.5557
1.5553
1.577
Dataseries Y:
9924
10371
10846
10413
10709
10662
10570
10297
10635
10872
10296
10383
10431
10574
10653
10805
10872
10625
10407
10463
10556
10646
10702
11353
11346
11451
11964
12574
13031
13812
14544
14931
14886
16005
17064
15168
16050
15839
15137
14954
15648
15305
15579
16348
15928
16171
15937
15713
15594
15683
16438
17032
17696
17745
19394
20148
20108
18584
18441
18391
19178




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=24899&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=24899&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=24899&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135







Box-Cox Linearity Plot
# observations x61
maximum correlation0.766381226757028
optimal lambda(x)1.48
Residual SD (orginial)2021.67167077011
Residual SD (transformed)2020.74754514369

\begin{tabular}{lllllllll}
\hline
Box-Cox Linearity Plot \tabularnewline
# observations x & 61 \tabularnewline
maximum correlation & 0.766381226757028 \tabularnewline
optimal lambda(x) & 1.48 \tabularnewline
Residual SD (orginial) & 2021.67167077011 \tabularnewline
Residual SD (transformed) & 2020.74754514369 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=24899&T=1

[TABLE]
[ROW][C]Box-Cox Linearity Plot[/C][/ROW]
[ROW][C]# observations x[/C][C]61[/C][/ROW]
[ROW][C]maximum correlation[/C][C]0.766381226757028[/C][/ROW]
[ROW][C]optimal lambda(x)[/C][C]1.48[/C][/ROW]
[ROW][C]Residual SD (orginial)[/C][C]2021.67167077011[/C][/ROW]
[ROW][C]Residual SD (transformed)[/C][C]2020.74754514369[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=24899&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=24899&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Box-Cox Linearity Plot
# observations x61
maximum correlation0.766381226757028
optimal lambda(x)1.48
Residual SD (orginial)2021.67167077011
Residual SD (transformed)2020.74754514369



Parameters (Session):
Parameters (R input):
R code (references can be found in the software module):
n <- length(x)
c <- array(NA,dim=c(401))
l <- array(NA,dim=c(401))
mx <- 0
mxli <- -999
for (i in 1:401)
{
l[i] <- (i-201)/100
if (l[i] != 0)
{
x1 <- (x^l[i] - 1) / l[i]
} else {
x1 <- log(x)
}
c[i] <- cor(x1,y)
if (mx < abs(c[i]))
{
mx <- abs(c[i])
mxli <- l[i]
}
}
c
mx
mxli
if (mxli != 0)
{
x1 <- (x^mxli - 1) / mxli
} else {
x1 <- log(x)
}
r<-lm(y~x)
se <- sqrt(var(r$residuals))
r1 <- lm(y~x1)
se1 <- sqrt(var(r1$residuals))
bitmap(file='test1.png')
plot(l,c,main='Box-Cox Linearity Plot',xlab='Lambda',ylab='correlation')
grid()
dev.off()
bitmap(file='test2.png')
plot(x,y,main='Linear Fit of Original Data',xlab='x',ylab='y')
abline(r)
grid()
mtext(paste('Residual Standard Deviation = ',se))
dev.off()
bitmap(file='test3.png')
plot(x1,y,main='Linear Fit of Transformed Data',xlab='x',ylab='y')
abline(r1)
grid()
mtext(paste('Residual Standard Deviation = ',se1))
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Box-Cox Linearity Plot',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations x',header=TRUE)
a<-table.element(a,n)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum correlation',header=TRUE)
a<-table.element(a,mx)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'optimal lambda(x)',header=TRUE)
a<-table.element(a,mxli)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Residual SD (orginial)',header=TRUE)
a<-table.element(a,se)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Residual SD (transformed)',header=TRUE)
a<-table.element(a,se1)
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')