Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*The author of this computation has been verified*

R Software Module

rwasp_bidensity.wasp

Title produced by software

Bivariate Kernel Density Estimation

Date of computation

Sun, 09 Nov 2008 09:00:29 -0700

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/09/t1226246555dy5y79ff551ecex.htm/, Retrieved Sun, 19 May 2024 11:17:52 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=22767, Retrieved Sun, 19 May 2024 11:17:52 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

187

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F     [Bivariate Kernel Density Estimation] [Bivariate Density] [2008-11-08 12:21:31] [82d201ca7b4e7cd2c6f885d29b5b6937]
F         [Bivariate Kernel Density Estimation] [bivariate density] [2008-11-09 16:00:29] [d6e9f26c3644bfc30f06303d9993b878] [Current]

Feedback Forum

2008-11-14 10:30:01 [Ciska Tanghe] [reply] 
Hoe interpreteer je deze grafiek?
2008-11-19 14:44:29 [Gregory Van Overmeiren] [reply] 
Hier gaat men de scatterplot hertekenen en gebruik maken van hoogtelijnen. De densiteit is zeer hoog te noemen in het wit-roze gedeelte van je grafiek. In het groene gedeelte is deze echter zwak te noemen.
2008-11-20 09:46:39 [An De Koninck] [reply] 
De student heeft wel de link opgemaakt, maar geen conclusie getrokken. 
Als je naar de grafiek kijkt zie je duidelijk dat er sprake is van 1 cluster met hoogtelijnen die vrij dicht bij elkaar liggen. Veel punten zijn gecentraliseerd in het midden, namelijk in de rode zone waar de grootste dichtheid is. 
Wel oppassen voor de 2 outliers die je rechts bovenaan in de grafiek ziet verschijnen. Deze 2 punten behoren niet tot de cluster, dus hebben een heel andere dichtheid dan de punten in de cluster. 
Er wordt een diagonale lijn getrokken door de grafiek die lichtjes neerwaarts loopt. Er liggen maar wenig punten op de rechte, maar de punten in de rode en gele zone liggen er vrij dicht bij.
2008-11-21 17:54:57 [Michael Van Spaandonck] [reply] 
We zien een Bivariate Kernel Density plot voor 2 reeksen met een zo goed als onbestaand verband. 
Hier gaat men de scatterplot hertekenen en gebruik maken van hoogtelijnen. De densiteit is hoog in het wit-roze gedeelte van de grafiek, en laag in het groene gedeelte. Men ziet slchts 1 enkele cluster en 2 outliers. 
 
De regressielijn loopt als gevolg van het praktisch onbestaande verband vrijwel horizontaal, en daarom ook benadert het overgrote deel van de punten de regressielijn niet langsheen diens lengte. 
De verschillende hoogtelijnen volgen de regressielijn niet langsheen diens lengte. 
 
We kunnen besluiten dat er sprake is van 2 reeksen met een zo goed als onbestaand verband en een zeer beperkt aantal outliers (2), waardoor er slechts 1 cluster te zien is.
2008-11-23 21:41:54 [Isabel Wilms] [reply] 
bivariate density: is een andere weergave van de scatterplot, dit met hoogtelijnen. Op deze hoogtelijnen zijn observaties geplaatst. Het gebied waar de concentratie van observaties hoog is, is wit-roze. Hier zien we dan een cluster. Waar de observaties een lagere densiteit hebben, en de hoogtelijnen dus ook verder uit elkaar liggen, is het gebied groen.  
De regressielijn toont ook het verband aan. Wanneer deze bv horizontaal verloopt en er geen punten op liggen, is er geen verband. 
Er zijn hier 2 outliers en 1 cluster, 1 horizontale regressielijn waar bijna geen punten opliggen, dit wijs dus op zo goed als geen verband.
2008-11-24 15:35:26 [Bernard Femont] [reply] 
e student heeft wel de link opgemaakt, maar geen conclusie getrokken. Deze methode geeft clusters weer. In het midden van elke cluster ligt de intensiteit van de punten (observaties) heel dicht. Hoe verder je gaat van het midden, hoe minder de intensiteit. Hoe dichter de clusters bij elkaar liggen, hoe groter de correlatie. Dit kan zowel een negatieve als positieve correlatie zijn. Je kan hierbij slechts 2 variabelen vergelijken. Deze grafiek geeft adhv de hoogtelijnen weer waar de meeste punten gelegen zijn. Het roos - oranje gedeelte geeft weer waar de punten heel geconcentreerd zijn of zelfs perfect op elkaar liggen.We kunnen dan ook aflezen op de grafiek en in de tabel dat er bijna geen correlatie is tussen de 2 reeksen onderling. deze is namelijk -0.08277. En een zeer beperkt aantal outliers (2), waardoor er slechts 1 cluster te zien is. 
  
2008-11-24 19:17:53 [Koen Van den Heuvel] [reply] 
Er is vergeten de grafiek af te lezen. 
Bivariate Kernel Density gaat gebruik maken van hoogtelijnen om aan te duiden waar de grootste dichtheid is. Aan de hand van kunnen dan verschillende clusters/groepen beter worden afgelezen dan bij een normaal scatterplot.

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

Dataseries Y:

Download CSV

Histogram

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	3 seconds
R Server	'Herman Ole Andreas Wold' @ 193.190.124.10:1001

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 3 seconds \tabularnewline
R Server & 'Herman Ole Andreas Wold' @ 193.190.124.10:1001 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=22767&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]3 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Herman Ole Andreas Wold' @ 193.190.124.10:1001[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=22767&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=22767&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	3 seconds
R Server	'Herman Ole Andreas Wold' @ 193.190.124.10:1001

Bandwidth
x axis	4.34993213566862
y axis	5.35975578527275
Correlation
correlation used in KDE	-0.0826798096433685
correlation(x,y)	-0.0826798096433685

\begin{tabular}{lllllllll}
\hline
Bandwidth \tabularnewline
x axis & 4.34993213566862 \tabularnewline
y axis & 5.35975578527275 \tabularnewline
Correlation \tabularnewline
correlation used in KDE & -0.0826798096433685 \tabularnewline
correlation(x,y) & -0.0826798096433685 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=22767&T=1

[TABLE]
[ROW][C]Bandwidth[/C][/ROW]
[ROW][C]x axis[/C][C]4.34993213566862[/C][/ROW]
[ROW][C]y axis[/C][C]5.35975578527275[/C][/ROW]
[ROW][C]Correlation[/C][/ROW]
[ROW][C]correlation used in KDE[/C][C]-0.0826798096433685[/C][/ROW]
[ROW][C]correlation(x,y)[/C][C]-0.0826798096433685[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=22767&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=22767&T=1

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Bandwidth
x axis	4.34993213566862
y axis	5.35975578527275
Correlation
correlation used in KDE	-0.0826798096433685
correlation(x,y)	-0.0826798096433685

Figure 1

PNG link

Postscript link

PDF link

Parameters (Session):

par1 = 50 ; par2 = 50 ; par3 = 0 ; par4 = 0 ; par5 = 0 ; par6 = Y ; par7 = Y ;

Parameters (R input):

par1 = 50 ; par2 = 50 ; par3 = 0 ; par4 = 0 ; par5 = 0 ; par6 = Y ; par7 = Y ; par8 = ; par9 = ; par10 = ; par11 = ; par12 = ; par13 = ; par14 = ; par15 = ; par16 = ; par17 = ; par18 = ; par19 = ; par20 = ;

R code (references can be found in the software module):

par1 <- as(par1,'numeric')
par2 <- as(par2,'numeric')
par3 <- as(par3,'numeric')
par4 <- as(par4,'numeric')
par5 <- as(par5,'numeric')
library('GenKern')
if (par3==0) par3 <- dpik(x)
if (par4==0) par4 <- dpik(y)
if (par5==0) par5 <- cor(x,y)
if (par1 > 500) par1 <- 500
if (par2 > 500) par2 <- 500
bitmap(file='bidensity.png')
op <- KernSur(x,y, xgridsize=par1, ygridsize=par2, correlation=par5, xbandwidth=par3, ybandwidth=par4)
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main=main,xlab=xlab,ylab=ylab)
if (par6=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par7=='Y') points(x,y)
(r<-lm(y ~ x))
abline(r)
box()
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Bandwidth',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'x axis',header=TRUE)
a<-table.element(a,par3)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'y axis',header=TRUE)
a<-table.element(a,par4)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Correlation',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'correlation used in KDE',header=TRUE)
a<-table.element(a,par5)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'correlation(x,y)',header=TRUE)
a<-table.element(a,cor(x,y))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code