Free Statistics

of Irreproducible Research!

Author's title

Author*Unverified author*
R Software Modulerwasp_pairs.wasp
Title produced by softwareKendall tau Correlation Matrix
Date of computationThu, 06 Nov 2008 08:16:42 -0700
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/06/t12259847758djv7xl0d10h18e.htm/, Retrieved Mon, 20 May 2024 11:41:41 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=22254, Retrieved Mon, 20 May 2024 11:41:41 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact192
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Notched Boxplots] [hypothesis testin...] [2008-11-05 17:58:44] [ad0ba236827d3670a23de17d480bce47]
F RMPD    [Kendall tau Correlation Matrix] [Hypothesis testin...] [2008-11-06 15:16:42] [c8dc05b1cdf5010d9a4f2d773adefb82] [Current]
Feedback Forum
2008-11-10 14:33:45 [Jasmine Hendrikx] [reply
Evaluatie Q1:

De student heeft gebruik gemaakt van de juiste module, namelijk ‘de Kendall tau correlatie’. Zo kunnen we de verbanden bestuderen tussen alle variabelen in 1 keer. Deze methode is veel robuuster en ondervindt minder invloed van outliers. De student heeft echter geen antwoord gegeven op de vraag wat nu de beste predictor is voor RNR. Als oplossing heeft hij slechts gezegd dat men rijen en kolommen moet wisselen en heeft hij beschreven wat er juist op een kendall tau correlation te vinden is. De conclusie zou dus moeten zijn dat RCF (cashflow) de beste predictor is voor RNR. Als we kijken naar de scatterplots, dan zien we dat RCF en RNR een lineair verband vertonen, wat dus wijst op een sterke correlatie. De kans dat dit aan toeval kan toegeschreven worden is 1%. Dit is kleiner dan 5%, dus het is significant. Uit de tabel kunnen we afleiden dat de correlatiecoëfficiënt 0.81 bedraagt, wat dus erg goed is, want hoe dichter dit getal bij 1 ligt, hoe meer men van een verband kan spreken. Deze correlatiecoëfficiënt is ook de hoogste van alle andere correlatiecoëfficiënten. We zien hier ook dat de p-waarde bij het verband tussen RNR en RCF het laagste is (namelijk 0.01). Uit dit alles kunnen we dus afleiden dat RCF de beste predictor is voor RNR.
2008-11-10 14:53:01 [Gert-Jan Geudens] [reply
Het antwoord van de student(e) is correct. Al is hij/zij wel vergeten te vermelden dat we het lineair positief verband ook kunnen aflezen van de scatterplot. Ik zou ook nog graag willen opmerken dat wanneer de p-waarde lager is dan 0.05, dat we dan van significantie kunnen spreken. Zoals de student reeds aangaf is er sprake van een een correlatie van 0.8 wat zeer goed is en dat de p-waarde gelijk is aan 0.01. Hieruit kunnen we dus concluderen dat RCF en significant goede indicator is voor RNR.
2008-11-12 09:40:02 [Kelly Deckx] [reply
De berekening is juist, maar je hebt geen antwoord op de vraag gegeven. Er is hier een sterk verband tussen de RNR en de RCF, dit kunnen we merken aan de bijna rechte lijn in de grafiek, en natuurlijk de 0.01. Het komt bijna niet voor in de analyse van een jaarrekening dat de cashflow de beste voorspeller zou zijn van het rendement, maar dit is hier wel het geval.
2008-11-12 10:07:51 [Maarten Van Gucht] [reply
Q1: de student heeft gebruik gemaakt van de goede methode, een Kendall tau correlation. Met deze methode kunnen we verbanden bestuderen tussen alle variabelen in 1 keer.
De student verwoord de conclusie goed, doordat de p-waarde van de RNR,RCF de kleinste waarde heeft betekent dit dat de RNR en de RCF een goede correlatie hebben. De cijfers wijzen namelijk op de probabiliteit. Hoe sterk is het verband aan het toeval toe te schrijven? Hoe lager de probabiliteit dus, hoe hoger de correlatie. Het is wel belangrijk om op te merken dat de cijfers niet gelijk zijn aan het correlatiecoefficient. De student heeft gebruik gemaakt van de Kendall tau Correlation, wat een goede oplossing weergeeft.
2008-11-12 10:58:28 [Stef Vermeiren] [reply
De student heeft een correct antwoord gegeven.

De kendall tau matrix is een methode die veel robuuster is en minder onderhevig is aan outliers.

Er kan ook nog vermeld worden dat de p-value kleiner moet zijn dan 0.05.
2008-11-12 11:14:57 [Bénédicte Soens] [reply
Er wordt bij deze oplossing wel duidelijk vermeld wat er gebeurt maar de conclusie die je eruit kan trekken wordt niet weergegeven. Zo kan je stellen dat er een correlatie van 0,01 is tussen RNR en RCF en dit is dus zeer laag. Doordat deze zo laag is kan je zeggen dat er weinig kans op toeval is. Dus RCF is de beste predictor voor RNR.
Hoe lager dit procent, hoe minder toeval, dus hoe beter.

Post a new message
Dataseries X:
4,2	4,8	20,8	0,9	39,6
2,6	-4,2	17,1	0,85	36,1
3	1,6	22,3	0,83	34,4
3,8	5,2	25,1	0,84	33,4
4	9,2	27,7	0,85	34,8
3,5	4,6	24,9	0,83	33,7
4,1	10,6	29,5	0,83	36,3




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time1 seconds
R Server'George Udny Yule' @ 72.249.76.132
R Framework error message
The field 'Names of X columns' contains a hard return which cannot be interpreted.
Please, resubmit your request without hard returns in the 'Names of X columns'.

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 1 seconds \tabularnewline
R Server & 'George Udny Yule' @ 72.249.76.132 \tabularnewline
R Framework error message & 
The field 'Names of X columns' contains a hard return which cannot be interpreted.
Please, resubmit your request without hard returns in the 'Names of X columns'.
\tabularnewline \hline \end{tabular} %Source: https://freestatistics.org/blog/index.php?pk=22254&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]1 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'George Udny Yule' @ 72.249.76.132[/C][/ROW]
[ROW][C]R Framework error message[/C][C]
The field 'Names of X columns' contains a hard return which cannot be interpreted.
Please, resubmit your request without hard returns in the 'Names of X columns'.
[/C][/ROW] [/TABLE] Source: https://freestatistics.org/blog/index.php?pk=22254&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=22254&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time1 seconds
R Server'George Udny Yule' @ 72.249.76.132
R Framework error message
The field 'Names of X columns' contains a hard return which cannot be interpreted.
Please, resubmit your request without hard returns in the 'Names of X columns'.







Kendall tau rank correlations for all pairs of data series
pairtaup-value
tau( RNVM , RNR )0.7142857142857140.0301587301587301
tau( RNVM , RCF )0.5238095238095240.136111111111111
tau( RNVM , RLEZ )0.2646280620124820.427262856745706
tau( RNVM , REV )0.3333333333333330.381349206349206
tau( RNR , RCF )0.809523809523810.0107142857142857
tau( RNR , RLEZ )-0.05292561240249630.873844698517373
tau( RNR , REV )0.04761904761904761
tau( RCF , RLEZ )-0.2646280620124820.427262856745706
tau( RCF , REV )-0.1428571428571430.772619047619048
tau( RLEZ , REV )0.3704792868174740.266379923342483

\begin{tabular}{lllllllll}
\hline
Kendall tau rank correlations for all pairs of data series \tabularnewline
pair & tau & p-value \tabularnewline
tau( RNVM , RNR ) & 0.714285714285714 & 0.0301587301587301 \tabularnewline
tau( RNVM , RCF ) & 0.523809523809524 & 0.136111111111111 \tabularnewline
tau( RNVM , RLEZ ) & 0.264628062012482 & 0.427262856745706 \tabularnewline
tau( RNVM , REV
 ) & 0.333333333333333 & 0.381349206349206 \tabularnewline
tau( RNR , RCF ) & 0.80952380952381 & 0.0107142857142857 \tabularnewline
tau( RNR , RLEZ ) & -0.0529256124024963 & 0.873844698517373 \tabularnewline
tau( RNR , REV
 ) & 0.0476190476190476 & 1 \tabularnewline
tau( RCF , RLEZ ) & -0.264628062012482 & 0.427262856745706 \tabularnewline
tau( RCF , REV
 ) & -0.142857142857143 & 0.772619047619048 \tabularnewline
tau( RLEZ , REV
 ) & 0.370479286817474 & 0.266379923342483 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=22254&T=1

[TABLE]
[ROW][C]Kendall tau rank correlations for all pairs of data series[/C][/ROW]
[ROW][C]pair[/C][C]tau[/C][C]p-value[/C][/ROW]
[ROW][C]tau( RNVM , RNR )[/C][C]0.714285714285714[/C][C]0.0301587301587301[/C][/ROW]
[ROW][C]tau( RNVM , RCF )[/C][C]0.523809523809524[/C][C]0.136111111111111[/C][/ROW]
[ROW][C]tau( RNVM , RLEZ )[/C][C]0.264628062012482[/C][C]0.427262856745706[/C][/ROW]
[ROW][C]tau( RNVM , REV
 )[/C][C]0.333333333333333[/C][C]0.381349206349206[/C][/ROW]
[ROW][C]tau( RNR , RCF )[/C][C]0.80952380952381[/C][C]0.0107142857142857[/C][/ROW]
[ROW][C]tau( RNR , RLEZ )[/C][C]-0.0529256124024963[/C][C]0.873844698517373[/C][/ROW]
[ROW][C]tau( RNR , REV
 )[/C][C]0.0476190476190476[/C][C]1[/C][/ROW]
[ROW][C]tau( RCF , RLEZ )[/C][C]-0.264628062012482[/C][C]0.427262856745706[/C][/ROW]
[ROW][C]tau( RCF , REV
 )[/C][C]-0.142857142857143[/C][C]0.772619047619048[/C][/ROW]
[ROW][C]tau( RLEZ , REV
 )[/C][C]0.370479286817474[/C][C]0.266379923342483[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=22254&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=22254&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Kendall tau rank correlations for all pairs of data series
pairtaup-value
tau( RNVM , RNR )0.7142857142857140.0301587301587301
tau( RNVM , RCF )0.5238095238095240.136111111111111
tau( RNVM , RLEZ )0.2646280620124820.427262856745706
tau( RNVM , REV )0.3333333333333330.381349206349206
tau( RNR , RCF )0.809523809523810.0107142857142857
tau( RNR , RLEZ )-0.05292561240249630.873844698517373
tau( RNR , REV )0.04761904761904761
tau( RCF , RLEZ )-0.2646280620124820.427262856745706
tau( RCF , REV )-0.1428571428571430.772619047619048
tau( RLEZ , REV )0.3704792868174740.266379923342483



Parameters (Session):
Parameters (R input):
R code (references can be found in the software module):
panel.tau <- function(x, y, digits=2, prefix='', cex.cor)
{
usr <- par('usr'); on.exit(par(usr))
par(usr = c(0, 1, 0, 1))
rr <- cor.test(x, y, method='kendall')
r <- round(rr$p.value,2)
txt <- format(c(r, 0.123456789), digits=digits)[1]
txt <- paste(prefix, txt, sep='')
if(missing(cex.cor)) cex <- 0.5/strwidth(txt)
text(0.5, 0.5, txt, cex = cex)
}
panel.hist <- function(x, ...)
{
usr <- par('usr'); on.exit(par(usr))
par(usr = c(usr[1:2], 0, 1.5) )
h <- hist(x, plot = FALSE)
breaks <- h$breaks; nB <- length(breaks)
y <- h$counts; y <- y/max(y)
rect(breaks[-nB], 0, breaks[-1], y, col='grey', ...)
}
bitmap(file='test1.png')
pairs(t(y),diag.panel=panel.hist, upper.panel=panel.smooth, lower.panel=panel.tau, main=main)
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Kendall tau rank correlations for all pairs of data series',3,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'pair',1,TRUE)
a<-table.element(a,'tau',1,TRUE)
a<-table.element(a,'p-value',1,TRUE)
a<-table.row.end(a)
n <- length(y[,1])
n
cor.test(y[1,],y[2,],method='kendall')
for (i in 1:(n-1))
{
for (j in (i+1):n)
{
a<-table.row.start(a)
dum <- paste('tau(',dimnames(t(x))[[2]][i])
dum <- paste(dum,',')
dum <- paste(dum,dimnames(t(x))[[2]][j])
dum <- paste(dum,')')
a<-table.element(a,dum,header=TRUE)
r <- cor.test(y[i,],y[j,],method='kendall')
a<-table.element(a,r$estimate)
a<-table.element(a,r$p.value)
a<-table.row.end(a)
}
}
a<-table.end(a)
table.save(a,file='mytable.tab')