Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_bidensity.wasp
Title produced by softwareBivariate Kernel Density Estimation
Date of computationSun, 09 Nov 2008 09:00:29 -0700
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/09/t1226246555dy5y79ff551ecex.htm/, Retrieved Sun, 19 May 2024 11:17:52 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=22767, Retrieved Sun, 19 May 2024 11:17:52 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact187
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Bivariate Kernel Density Estimation] [Bivariate Density] [2008-11-08 12:21:31] [82d201ca7b4e7cd2c6f885d29b5b6937]
F         [Bivariate Kernel Density Estimation] [bivariate density] [2008-11-09 16:00:29] [d6e9f26c3644bfc30f06303d9993b878] [Current]
Feedback Forum
2008-11-14 10:30:01 [Ciska Tanghe] [reply
Hoe interpreteer je deze grafiek?
2008-11-19 14:44:29 [Gregory Van Overmeiren] [reply
Hier gaat men de scatterplot hertekenen en gebruik maken van hoogtelijnen. De densiteit is zeer hoog te noemen in het wit-roze gedeelte van je grafiek. In het groene gedeelte is deze echter zwak te noemen.
2008-11-20 09:46:39 [An De Koninck] [reply
De student heeft wel de link opgemaakt, maar geen conclusie getrokken.
Als je naar de grafiek kijkt zie je duidelijk dat er sprake is van 1 cluster met hoogtelijnen die vrij dicht bij elkaar liggen. Veel punten zijn gecentraliseerd in het midden, namelijk in de rode zone waar de grootste dichtheid is.
Wel oppassen voor de 2 outliers die je rechts bovenaan in de grafiek ziet verschijnen. Deze 2 punten behoren niet tot de cluster, dus hebben een heel andere dichtheid dan de punten in de cluster.
Er wordt een diagonale lijn getrokken door de grafiek die lichtjes neerwaarts loopt. Er liggen maar wenig punten op de rechte, maar de punten in de rode en gele zone liggen er vrij dicht bij.
2008-11-21 17:54:57 [Michael Van Spaandonck] [reply
We zien een Bivariate Kernel Density plot voor 2 reeksen met een zo goed als onbestaand verband.
Hier gaat men de scatterplot hertekenen en gebruik maken van hoogtelijnen. De densiteit is hoog in het wit-roze gedeelte van de grafiek, en laag in het groene gedeelte. Men ziet slchts 1 enkele cluster en 2 outliers.

De regressielijn loopt als gevolg van het praktisch onbestaande verband vrijwel horizontaal, en daarom ook benadert het overgrote deel van de punten de regressielijn niet langsheen diens lengte.
De verschillende hoogtelijnen volgen de regressielijn niet langsheen diens lengte.

We kunnen besluiten dat er sprake is van 2 reeksen met een zo goed als onbestaand verband en een zeer beperkt aantal outliers (2), waardoor er slechts 1 cluster te zien is.
2008-11-23 21:41:54 [Isabel Wilms] [reply
bivariate density: is een andere weergave van de scatterplot, dit met hoogtelijnen. Op deze hoogtelijnen zijn observaties geplaatst. Het gebied waar de concentratie van observaties hoog is, is wit-roze. Hier zien we dan een cluster. Waar de observaties een lagere densiteit hebben, en de hoogtelijnen dus ook verder uit elkaar liggen, is het gebied groen.
De regressielijn toont ook het verband aan. Wanneer deze bv horizontaal verloopt en er geen punten op liggen, is er geen verband.
Er zijn hier 2 outliers en 1 cluster, 1 horizontale regressielijn waar bijna geen punten opliggen, dit wijs dus op zo goed als geen verband.
2008-11-24 15:35:26 [Bernard Femont] [reply
e student heeft wel de link opgemaakt, maar geen conclusie getrokken. Deze methode geeft clusters weer. In het midden van elke cluster ligt de intensiteit van de punten (observaties) heel dicht. Hoe verder je gaat van het midden, hoe minder de intensiteit. Hoe dichter de clusters bij elkaar liggen, hoe groter de correlatie. Dit kan zowel een negatieve als positieve correlatie zijn. Je kan hierbij slechts 2 variabelen vergelijken. Deze grafiek geeft adhv de hoogtelijnen weer waar de meeste punten gelegen zijn. Het roos - oranje gedeelte geeft weer waar de punten heel geconcentreerd zijn of zelfs perfect op elkaar liggen.We kunnen dan ook aflezen op de grafiek en in de tabel dat er bijna geen correlatie is tussen de 2 reeksen onderling. deze is namelijk -0.08277. En een zeer beperkt aantal outliers (2), waardoor er slechts 1 cluster te zien is.

2008-11-24 19:17:53 [Koen Van den Heuvel] [reply
Er is vergeten de grafiek af te lezen.
Bivariate Kernel Density gaat gebruik maken van hoogtelijnen om aan te duiden waar de grootste dichtheid is. Aan de hand van kunnen dan verschillende clusters/groepen beter worden afgelezen dan bij een normaal scatterplot.

Post a new message
Dataseries X:
116,1
102,5
102,0
101,3
100,6
100,9
104,2
108,3
108,9
109,9
106,8
112,7
113,4
101,3
97,8
95,0
93,8
94,5
101,4
105,8
106,6
109,7
108,8
113,4
113,7
103,6
98,2
95,5
94,4
95,9
103,2
104,1
127,6
130,3
133,0
140,4
123,5
116,9
115,9
113,1
112,1
112,4
118,9
117,4
115,6
120,7
114,9
122,0
119,6
114,6
118,4
110,9
111,6
114,6
112,1
117,4
114,8
123,4
118,1
121,9
123,3
Dataseries Y:
100,3
97,6
89,1
99,1
94,9
96,5
92,6
80,8
89,5
101,4
95,9
92,3
91,2
88,3
80,7
89,9
87,2
86,9
82,8
72,6
81,3
91,2
87,3
83,4
81,7
80,2
74,1
80,6
79,0
79,3
71,2
78,1
68,2
81,0
106,9
123,7
73,7
69,2
72,5
75,7
73,5
70,4
65,7
68,1
62,4
64,7
77,7
85,9
61,0
57,4
75,1
75,9
71,8
72,3
67,3
71,5
67,6
74,2
77,6
76,4
74,2




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time3 seconds
R Server'Herman Ole Andreas Wold' @ 193.190.124.10:1001

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 3 seconds \tabularnewline
R Server & 'Herman Ole Andreas Wold' @ 193.190.124.10:1001 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=22767&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]3 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Herman Ole Andreas Wold' @ 193.190.124.10:1001[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=22767&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=22767&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time3 seconds
R Server'Herman Ole Andreas Wold' @ 193.190.124.10:1001







Bandwidth
x axis4.34993213566862
y axis5.35975578527275
Correlation
correlation used in KDE-0.0826798096433685
correlation(x,y)-0.0826798096433685

\begin{tabular}{lllllllll}
\hline
Bandwidth \tabularnewline
x axis & 4.34993213566862 \tabularnewline
y axis & 5.35975578527275 \tabularnewline
Correlation \tabularnewline
correlation used in KDE & -0.0826798096433685 \tabularnewline
correlation(x,y) & -0.0826798096433685 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=22767&T=1

[TABLE]
[ROW][C]Bandwidth[/C][/ROW]
[ROW][C]x axis[/C][C]4.34993213566862[/C][/ROW]
[ROW][C]y axis[/C][C]5.35975578527275[/C][/ROW]
[ROW][C]Correlation[/C][/ROW]
[ROW][C]correlation used in KDE[/C][C]-0.0826798096433685[/C][/ROW]
[ROW][C]correlation(x,y)[/C][C]-0.0826798096433685[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=22767&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=22767&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Bandwidth
x axis4.34993213566862
y axis5.35975578527275
Correlation
correlation used in KDE-0.0826798096433685
correlation(x,y)-0.0826798096433685



Parameters (Session):
par1 = 50 ; par2 = 50 ; par3 = 0 ; par4 = 0 ; par5 = 0 ; par6 = Y ; par7 = Y ;
Parameters (R input):
par1 = 50 ; par2 = 50 ; par3 = 0 ; par4 = 0 ; par5 = 0 ; par6 = Y ; par7 = Y ; par8 = ; par9 = ; par10 = ; par11 = ; par12 = ; par13 = ; par14 = ; par15 = ; par16 = ; par17 = ; par18 = ; par19 = ; par20 = ;
R code (references can be found in the software module):
par1 <- as(par1,'numeric')
par2 <- as(par2,'numeric')
par3 <- as(par3,'numeric')
par4 <- as(par4,'numeric')
par5 <- as(par5,'numeric')
library('GenKern')
if (par3==0) par3 <- dpik(x)
if (par4==0) par4 <- dpik(y)
if (par5==0) par5 <- cor(x,y)
if (par1 > 500) par1 <- 500
if (par2 > 500) par2 <- 500
bitmap(file='bidensity.png')
op <- KernSur(x,y, xgridsize=par1, ygridsize=par2, correlation=par5, xbandwidth=par3, ybandwidth=par4)
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main=main,xlab=xlab,ylab=ylab)
if (par6=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par7=='Y') points(x,y)
(r<-lm(y ~ x))
abline(r)
box()
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Bandwidth',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'x axis',header=TRUE)
a<-table.element(a,par3)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'y axis',header=TRUE)
a<-table.element(a,par4)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Correlation',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'correlation used in KDE',header=TRUE)
a<-table.element(a,par5)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'correlation(x,y)',header=TRUE)
a<-table.element(a,cor(x,y))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')