Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*The author of this computation has been verified*

R Software Module

rwasp_boxcoxlin.wasp

Title produced by software

Box-Cox Linearity Plot

Date of computation

Thu, 13 Nov 2008 18:25:48 -0700

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/14/t12266260550a3gx630u5rto2a.htm/, Retrieved Sun, 19 May 2024 11:10:09 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=24899, Retrieved Sun, 19 May 2024 11:10:09 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

252

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F       [Box-Cox Linearity Plot] [Box-cox linearity...] [2008-11-14 01:25:48] [9f72e095d5529918bf5b0810c01bf6ce] [Current]

Feedback Forum

2008-11-15 14:06:04 [Maarten Van Gucht] [reply] 
De studente heeft geen commentaar of geen grafieken gekopieerd in het word document. Maar de berekening zijn via de link wel goed gedaan. In de box-cox linearity plot krijg je ofwel een stijgende of een dalende lijn.  
In een scatterplot krijg je meestal 1 rechte door de waarnemingen heen. Deze is de regressilijn (de optimale lijn door de punten) maar deze is altijd recht. De box-cox transponeert! => voor een beter verband. Wat we meestal hopen te zien is een stijgende kromme. Dit wil zeggen dat er een maximum is (meestal in 2). 
De waarden op de X-as varieren tussen de -2 en de 2. Op de Y-as staat de correlatie. hoe kleiner de correlatie, des te minder wijziging in de getransponeerde scatterplot. In het voorbeeld van deze studente is de correlatie zeer klein dus de wijzigin in de getransponeerde scatterplot is ook zeer klein. 
2008-11-19 13:44:33 [Sam De Cuyper] [reply] 
Weer geen interpretatie aan de berekeningen gegeven. De box-cox linearity plot geeft de weegave van het verband tussen 2 variabelen die met elkaar in verband staan. Het resultaat is een stijgende of een dalende rechte (bestudeerd wetmatigheid) met geconcentreerde punten. Het is de bedoeling om de variabelen te transformeren (X-variabele) en zo de scatterplot meer lineair te maken. Nu kan echter de vraag gesteld worden of de transfomatie nuttig is. Indien de grafiek een maximum vertoont zal de waarde van het maximum gekozen worden als lambda. Na transformatie is er visueel weinig verschil te merken, waardoor de transformatie onnuttig is. Ze heeft geen of toch zeer weinig effect.
2008-11-23 13:01:38 [An Knapen] [reply] 
Box-Cox linearity plot wordt gebruikt om twee variabelen met elkaar in verband te brengen. We laten lambda hierbij schommelen tussen -2 en 2. De correlatie wordt afgelezen op de y-as. Om te weten welke de regressielijn het dichtst benadert, gaan we op zoek naar het maximum. Aangeizen deze grafiek de vorm heeft van een parabool bevindt het maximum zich dus in de top.  
In dit voorbeeld bevindt het maximum zich bij lambda gelijk aan  1.48. De correlatie is dan gelijk aan 0.766381226757028  
 
Nadien gaat er een transformatie plaatsvinden om zo een beter verband te krijgen tussen de variabelen(=sterker lineair verband)We kunnen vaststellen dat door gebruik te maken van deze transformatie, het verband slechts weinig verandert. 
2008-11-23 15:05:46 [c97d2ae59c98cf77a04815c1edffab5a] [reply] 
De student heeft wel een conclusie gevormd, maar geen grafieken weergegeven. Ik zou deze conclusie toch nog iets uitbreiden: 
uitleg over de boc cox linearity plot:  
Men gaat de lambda (=parameter) laten variëren tussen -2 en 2 (zie grafiek) en al deze transformaties toepassen op x. De correlatie tussen de getransformeerde x en (oorsponkelijke) y wordt elke keer berekend en we hopen dat de curve een maximum vertoont, wat wijst op de beste correlatie(na transformatie van x). We hebben het maximum bereikt in het hoogste punt, maar we moeten ons ook afvragen of lambda na dit punt nog zou stijgen. stel dat dit het geval zou zijn, dan kunnen we besluiten dat onze inspanning nutteloos was. 
bij deze tijdsreeks vinden we een maximale correlatie van 0,77 voor een lambda van 1,48. de verbetering van de correlatie is wel minimaal bij de variëring van lambda nl een verbetering van O,022.(zie schaal y-as)
2008-11-24 02:49:35 [Anna Hayan] [reply] 
De studente heeft geen interpretatie gegeven. De berekeningen kloppen wel. Hierbij volgen er nog enkele aanvullingen. 
 de box-cox linearity plot geeft weer  ofwel een stijgende of een dalende lijn.  
De rechte regressilijn is de optimale lijn door de punten. Indien de box-cox tranformeert kunnen we dan van een beter verbandspreken. Er is bijvoorbeeld  kromme een maximum is in 2, dus meestal in de top. 
In dit voorbeeld is het maximum zich bij lambda gelijk aan 1.48. De correlatie is gelijk aan 0.766381226757028. . De correlatie is dan gelijk aan 0.766381226757028. De verbetering van de correlatie is wel miniem bij de wijziging van lambda. ( Op de schaal van de y-as zien we de waarde 0,022.) 
2008-11-24 22:50:04 [Jessica Alves Pires] [reply] 
Juiste berekening. Hier staat wel een interpretatie bij omdat ik de theorie hierover heb teruggevonden. Mijn stelling, dat de transformatie niet veel effect heeft, klopt. Verder staat de theorie hierboven goed uitgelegd en is de aanvullende informatie ook goed.

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

Dataseries Y:

Download CSV

Histogram

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	2 seconds
R Server	'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=24899&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=24899&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=24899&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	2 seconds
R Server	'Gwilym Jenkins' @ 72.249.127.135

Box-Cox Linearity Plot
# observations x	61
maximum correlation	0.766381226757028
optimal lambda(x)	1.48
Residual SD (orginial)	2021.67167077011
Residual SD (transformed)	2020.74754514369

\begin{tabular}{lllllllll}
\hline
Box-Cox Linearity Plot \tabularnewline
# observations x & 61 \tabularnewline
maximum correlation & 0.766381226757028 \tabularnewline
optimal lambda(x) & 1.48 \tabularnewline
Residual SD (orginial) & 2021.67167077011 \tabularnewline
Residual SD (transformed) & 2020.74754514369 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=24899&T=1

[TABLE]
[ROW][C]Box-Cox Linearity Plot[/C][/ROW]
[ROW][C]# observations x[/C][C]61[/C][/ROW]
[ROW][C]maximum correlation[/C][C]0.766381226757028[/C][/ROW]
[ROW][C]optimal lambda(x)[/C][C]1.48[/C][/ROW]
[ROW][C]Residual SD (orginial)[/C][C]2021.67167077011[/C][/ROW]
[ROW][C]Residual SD (transformed)[/C][C]2020.74754514369[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=24899&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=24899&T=1

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Box-Cox Linearity Plot
# observations x	61
maximum correlation	0.766381226757028
optimal lambda(x)	1.48
Residual SD (orginial)	2021.67167077011
Residual SD (transformed)	2020.74754514369

Figure 1

PNG link

Postscript link

PDF link

Figure 2

PNG link

Postscript link

PDF link

Figure 3

PNG link

Postscript link

PDF link

Parameters (Session):

Parameters (R input):

R code (references can be found in the software module):

n <- length(x)
c <- array(NA,dim=c(401))
l <- array(NA,dim=c(401))
mx <- 0
mxli <- -999
for (i in 1:401)
{
l[i] <- (i-201)/100
if (l[i] != 0)
{
x1 <- (x^l[i] - 1) / l[i]
} else {
x1 <- log(x)
}
c[i] <- cor(x1,y)
if (mx < abs(c[i]))
{
mx <- abs(c[i])
mxli <- l[i]
}
}
c
mx
mxli
if (mxli != 0)
{
x1 <- (x^mxli - 1) / mxli
} else {
x1 <- log(x)
}
r<-lm(y~x)
se <- sqrt(var(r$residuals))
r1 <- lm(y~x1)
se1 <- sqrt(var(r1$residuals))
bitmap(file='test1.png')
plot(l,c,main='Box-Cox Linearity Plot',xlab='Lambda',ylab='correlation')
grid()
dev.off()
bitmap(file='test2.png')
plot(x,y,main='Linear Fit of Original Data',xlab='x',ylab='y')
abline(r)
grid()
mtext(paste('Residual Standard Deviation = ',se))
dev.off()
bitmap(file='test3.png')
plot(x1,y,main='Linear Fit of Transformed Data',xlab='x',ylab='y')
abline(r1)
grid()
mtext(paste('Residual Standard Deviation = ',se1))
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Box-Cox Linearity Plot',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations x',header=TRUE)
a<-table.element(a,n)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum correlation',header=TRUE)
a<-table.element(a,mx)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'optimal lambda(x)',header=TRUE)
a<-table.element(a,mxli)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Residual SD (orginial)',header=TRUE)
a<-table.element(a,se)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Residual SD (transformed)',header=TRUE)
a<-table.element(a,se1)
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code