Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*The author of this computation has been verified*

R Software Module

rwasp_bidensity.wasp

Title produced by software

Bivariate Kernel Density Estimation

Date of computation

Wed, 12 Nov 2008 06:37:39 -0700

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/12/t1226497235fc915g7y1dlwpd7.htm/, Retrieved Mon, 20 May 2024 02:41:00 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=24177, Retrieved Mon, 20 May 2024 02:41:00 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

207

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F       [Bivariate Kernel Density Estimation] [Various EDA Topic...] [2008-11-12 13:37:39] [1351baa662f198be3bff32f9007a9a6d] [Current]
F    D    [Bivariate Kernel Density Estimation] [opdracht3 blok8 q...] [2008-11-12 17:51:49] [975daa21de49eaf4d491226310243f5a] 
-    D      [Bivariate Kernel Density Estimation] [paper bivariate k...] [2008-12-13 12:01:33] [975daa21de49eaf4d491226310243f5a] 
- RMPD      [Standard Deviation-Mean Plot] [paper standard de...] [2008-12-13 12:05:31] [975daa21de49eaf4d491226310243f5a] 
- RMPD      [Standard Deviation-Mean Plot] [paper standard de...] [2008-12-13 12:08:21] [975daa21de49eaf4d491226310243f5a] 
- RMPD      [Variance Reduction Matrix] [paper variance re...] [2008-12-13 12:10:13] [975daa21de49eaf4d491226310243f5a] 
- RMPD      [(Partial) Autocorrelation Function] [paper autocorrela...] [2008-12-13 12:13:54] [975daa21de49eaf4d491226310243f5a] 
- RMPD      [(Partial) Autocorrelation Function] [paper autocorrela...] [2008-12-13 12:15:31] [975daa21de49eaf4d491226310243f5a] 
-             [(Partial) Autocorrelation Function] [paper autocorrela...] [2008-12-13 13:03:08] [975daa21de49eaf4d491226310243f5a] 
-             [(Partial) Autocorrelation Function] [paper autocorrela...] [2008-12-13 13:04:42] [975daa21de49eaf4d491226310243f5a] 
-             [(Partial) Autocorrelation Function] [paper autocorrela...] [2008-12-13 13:06:03] [975daa21de49eaf4d491226310243f5a] 
- RMPD      [(Partial) Autocorrelation Function] [paper autocorrela...] [2008-12-13 12:16:36] [975daa21de49eaf4d491226310243f5a] 
- RMPD      [Spectral Analysis] [paper spectral an...] [2008-12-13 12:18:17] [975daa21de49eaf4d491226310243f5a] 
- RMPD      [Spectral Analysis] [paper spectral an...] [2008-12-13 12:19:44] [975daa21de49eaf4d491226310243f5a] 
- RMPD      [Spectral Analysis] [paper spectral an...] [2008-12-13 12:21:34] [975daa21de49eaf4d491226310243f5a] 
-   P         [Spectral Analysis] [paper spectral an...] [2008-12-17 14:05:40] [975daa21de49eaf4d491226310243f5a] 
-   P           [Spectral Analysis] [paper spectral an...] [2008-12-17 14:07:20] [975daa21de49eaf4d491226310243f5a] 
- RMPD      [(Partial) Autocorrelation Function] [paper autocorrela...] [2008-12-13 12:23:36] [975daa21de49eaf4d491226310243f5a] 
-             [(Partial) Autocorrelation Function] [paper autocorrela...] [2008-12-13 12:59:53] [975daa21de49eaf4d491226310243f5a] 
- RM            [ARIMA Backward Selection] [paper backward goe] [2008-12-13 13:24:53] [975daa21de49eaf4d491226310243f5a] 
-   P             [ARIMA Backward Selection] [paper backward......] [2008-12-17 14:15:55] [975daa21de49eaf4d491226310243f5a] 
-   P           [(Partial) Autocorrelation Function] [paper autocorrela...] [2008-12-17 14:11:49] [975daa21de49eaf4d491226310243f5a] 
- RMPD      [(Partial) Autocorrelation Function] [paper backward...] [2008-12-13 12:25:56] [975daa21de49eaf4d491226310243f5a] 
F    D    [Bivariate Kernel Density Estimation] [Blok 8 opdracht 3 q1] [2008-11-22 19:48:56] [6173c35e31b784a490c8cd5476f785d4] 

Feedback Forum

2008-11-14 15:36:56 [Katrijn Truyman] [reply] 
zeer goede conclusie, alles wat er over deze analyse te zeggen valt, is uitgelegd...
2008-11-17 08:00:37 [006ad2c49b6a7c2ad6ab685cfc1dae56] [reply] 
Zeer goed uitgelegd, hier heb ik niets aan toe te voegen.
2008-11-22 14:33:06 [Peter Van Doninck] [reply] 
De conclusie die de student geeft, is correct. Er kan nog aan toegevoegd worden dat de verkregen 'figuren' op ellipsen lijken, en geen cirkels zijn. Dit toont dus aan dat er een verband tussen beide variabelen is. 
2008-11-22 19:24:31 [c97d2ae59c98cf77a04815c1edffab5a] [reply] 
Ik had dit toch niet helemaal goed geïnterpreteerd. Hier mijn nieuwe oplossing en extra uitleg: 
Theorie: bivariate kernel density 
Deze wordt gevormd door: de puntenwolk van de scatterplot, rechte lijn(benadert puntenwolk zo dicht mogelijk) en hoogtelijnen (die hebben niet rechtstreeks iets te maken met de 3e dimensie, maar met de dichtheid/concentratie van de scatterplot). De hoogtelijnen geven de waarschijnlijkheid, d.m.v. de dichtheid/concentratie , aan dat een bepaald verband tussen variabelen (= de punten) zich daar bevindt, waar de hoogtelijnen de hoogste waarde aannemen (het rode-witte vlekje). M.a.w. Als er in de puntenwolk ergens heel veel punten zich samen bevinden (in ‘groep’) is er een hoge concentratie van punten daar, hier ga je dan ook de hoogste hoogtelijn vinden.  
 Verschillende groepen met hoge hoogtelijnen geven clustering weer. We stellen ons hierbij de vraag of er een wetmatigheid bestaan tussen 2 variabelen dat nier voor elke periode geldt? Dit kan bijvoorbeeld doordat het regime veranderd is, waardoor er een verband tussen variabelen is ontstaan dat er voordien nog niet was, of dit kan een maandelijks verband zijn dat telkens terugkeert. Dit zal dan verder onderzocht moeten worden.  De richting naar waar de hoogtelijnen wijzen geeft de correlatie weer: rechts boven(positief verband), rechts beneden (negatief verband) en horizontaal (geen verband) . Vb (in geval van periodieke terugkering van een verband): is er maar 1 rode vlek, dit wil zeggen dat de maanden ongeveer gelijkaardig zijn(geen clustering). Zijn er 2 rode vlekken, dit wil zeggen dat de variabelen zich anders voordoen in bepaalde maanden (clustering). Bijvoorbeeld in het geval van clustering bij huwelijken: het zou periodiek kunnen terugkeren; in de zomer meer huwelijken dan in de winter, of het zou een plotse verandering kunnen zijn; na de oorlog. 
Conclusie:  
Allereerst moeten we vermelden dat de variabele ‘x’de elektrische en elektronische apparaten weergeeft en de variabele ‘y’ de medische apparatuur. De correlatie tussen de 2 variabelen is positief en bedraagt 0.63. De ‘Bivariate Kernel density’ geeft de dichtheid aan tussen 2 variabelen, die wordt aangeduid door hoogtelijnen. De hoogste concentratie bevindt zich min of meer in het midden van de figuur (witte kleur) waardoor het verband tussen de variabelen zich waarschijnlijk daar zal bevinden. Deze opvallende dichtheid komt overeen met de coördinaten 82 (voor variabele x) en 115 (voor variabele y). De hoogtelijnen evolueren van links-onder naar rechts-boven. Dit bevestigt onze conclusie, gevormd m.b.v. de tabel, van een positief verband. Doordat we geen verschillende concentraties/groepen van ‘rode vlekjes’ kunnen waarnemen, kunnen we opmaken dat we niet te maken hebben met clustering/seizoenaliteit , en de periodes gelijkaardig zijn. 
2008-11-23 10:21:00 [Nathalie Daneels] [reply] 
Evaluatie opdracht 3 van blok 8:  
De conclusie is een beetje onvolledig, ik zou deze nog aanvullen met het volgende: 
*De student vermeldde dat we uit de grafiek kunnen afleiden dat de correlatie tussen de variabelen x en y positief is en afgerond 0,63 bedraagt. Er is dus sprake van een positieve correlatie, dit kunnen we ook op de grafiek zien. De hoogtelijnen op de grafiek vormen ellipsen, die wijzen op een verband tussen de variabelen. Als de hoogtelijnen cirkels moesten vormen, dan zouden we niet kunnen spreken van een verband. Aangezien de hoogtelijnen van links onder naar rechts boven gaan, is er sprake van een positief verband. Dit wordt dan weer bevestigd door de tabel. We moeten eveneens vermelden dat de hoogtelijnen niet rechtstreeks iets te maken hebben met de derde dimensie, maar wel met de dichtheid/de concentratie van de punten: Ze hebben te maken met de waarschijnlijkheid dat een bepaald verband tussen variabelen zich bevindt waar de hoogtelijnen de hoogste waarde aannemen.  
De bivariate density wordt gevormd aan de hand van de puntenwolk van de scatterplot. Als er op deze scatterplot op bepaalde plaatsen heel veel punten (samen/in groep) bevinden, dan gaat dit duidelijk weerspiegeld worden in de bivariate density: Dat is de plaats waarop de hoogtelijnen de hoogste waarde hebben. Op die plaats is de dichtheid/de concentratie van de variabelen het grootste. Dit is dan ook de uitleg over wat de hoogtelijnen precies weergeven: Zij geven de dichtheid/de concentratie van de punten weer. De student vermeldde reeds dat de hoogste concentratie op de grafiek werd aangeduid met een witte kleur en dat deze hoogste concentratie zich net onder de rechte bevindt. Deze recht geeft het gemiddelde van de gegevens weer/ dat is de 'beste' rechte die men door de puntenwolk van de scatterplot kan tekenen.  
We kunnen eveneens vaststellen uit de grafiek dat er zich geen clusters hebben gevormd: dit zou het geval zijn als we verschillende groepen konden waarnemen. Er zouden dus op verschillende plaatsen in de grafiek een hoge waarde van de hoogtelijnen waar te nemen zijn. 
2008-11-24 15:33:55 [Charis Berrevoets] [reply] 
Naar mijn mening heb je hier een zeer correcte oplossing gegeven. Ik vind enkel dat het duidelijker was geweest als je per berekeningsmethode een korte conclusie zou gegeven hebben en ook waarom je dat daar kan zeggen. Zoals bijvoorbeeld bij de Kernell density plot, dat je een verband kan zien op basis van de ellipsen.  
Maar de algemene conclusie die je geeft is wel heel goed en je geeft ook wat extra uitleg over de berekeningswijze, wat ik heel goed vond.

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

Dataseries Y:

Download CSV

Histogram

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	1 seconds
R Server	'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 1 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=24177&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]1 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=24177&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=24177&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	1 seconds
R Server	'Gwilym Jenkins' @ 72.249.127.135

Bandwidth
x axis	4.0416833269622
y axis	7.91421377048872
Correlation
correlation used in KDE	0.631982605451482
correlation(x,y)	0.631982605451482

\begin{tabular}{lllllllll}
\hline
Bandwidth \tabularnewline
x axis & 4.0416833269622 \tabularnewline
y axis & 7.91421377048872 \tabularnewline
Correlation \tabularnewline
correlation used in KDE & 0.631982605451482 \tabularnewline
correlation(x,y) & 0.631982605451482 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=24177&T=1

[TABLE]
[ROW][C]Bandwidth[/C][/ROW]
[ROW][C]x axis[/C][C]4.0416833269622[/C][/ROW]
[ROW][C]y axis[/C][C]7.91421377048872[/C][/ROW]
[ROW][C]Correlation[/C][/ROW]
[ROW][C]correlation used in KDE[/C][C]0.631982605451482[/C][/ROW]
[ROW][C]correlation(x,y)[/C][C]0.631982605451482[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=24177&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=24177&T=1

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Bandwidth
x axis	4.0416833269622
y axis	7.91421377048872
Correlation
correlation used in KDE	0.631982605451482
correlation(x,y)	0.631982605451482

Figure 1

PNG link

Postscript link

PDF link

Parameters (Session):

par1 = 50 ; par2 = 50 ; par3 = 0 ; par4 = 0 ; par5 = 0 ; par6 = Y ; par7 = Y ;

Parameters (R input):

par1 = 50 ; par2 = 50 ; par3 = 0 ; par4 = 0 ; par5 = 0 ; par6 = Y ; par7 = Y ;

R code (references can be found in the software module):

par1 <- as(par1,'numeric')
par2 <- as(par2,'numeric')
par3 <- as(par3,'numeric')
par4 <- as(par4,'numeric')
par5 <- as(par5,'numeric')
library('GenKern')
if (par3==0) par3 <- dpik(x)
if (par4==0) par4 <- dpik(y)
if (par5==0) par5 <- cor(x,y)
if (par1 > 500) par1 <- 500
if (par2 > 500) par2 <- 500
bitmap(file='bidensity.png')
op <- KernSur(x,y, xgridsize=par1, ygridsize=par2, correlation=par5, xbandwidth=par3, ybandwidth=par4)
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main=main,xlab=xlab,ylab=ylab)
if (par6=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par7=='Y') points(x,y)
(r<-lm(y ~ x))
abline(r)
box()
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Bandwidth',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'x axis',header=TRUE)
a<-table.element(a,par3)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'y axis',header=TRUE)
a<-table.element(a,par4)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Correlation',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'correlation used in KDE',header=TRUE)
a<-table.element(a,par5)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'correlation(x,y)',header=TRUE)
a<-table.element(a,cor(x,y))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code