Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*The author of this computation has been verified*

R Software Module

rwasp_cloud.wasp

Title produced by software

Trivariate Scatterplots

Date of computation

Mon, 10 Nov 2008 03:41:18 -0700

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/10/t12263138191mxb691byp46hc9.htm/, Retrieved Sat, 05 Jul 2025 13:44:49 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=22919, Retrieved Sat, 05 Jul 2025 13:44:49 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

249

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F       [Trivariate Scatterplots] [Various EDA Topic...] [2008-11-10 10:41:18] [dafd615cb3e0decc017580d68ecea30a] [Current]

Feedback Forum

2008-11-14 11:01:31 [Tamara Witters] [reply] 
De student heeft enkel de Bivarlate kernel density grafieken besproken bij deze methode. 
Trivariate Scatterplots: 
Deze R-module biedt veel voordelen. Het maakt verschillende berekeningen in 1 keer met o. a de Bivarlate kernel density.  
Je krijgt eerst 3 vierkanten te zien die telkens het verband tussen 3 variabelen weergeven. Het nadeel hiervan is dat je de afstand tussen de punten niet goed kan inschatten. 
Vervolgens is er het 2-dimensioneel scatterplot. Je kan hieruit afleiden of een variabele een normaalverdeling  heeft en of er correlatie is tussen de verschillende variabelen. Het 3e (2e rij) kadertje bijvoorbeeld geeft het verband weer tussen 'vervaardiging machines en apparatuur met..' en 'vervaardiging elektriche app met..', we kunnen zien dat er een grote correlatie bestaat want de punten liggen dicht bij elkaar en op 1 lijn. Hoe dichter de punten hoe groter de waarschijnlijkheid. Het nadeel van deze methode is dat je een vertekend beeld kan krijgen. 
2008-11-20 13:26:02 [Glenn De Maeyer] [reply] 
De kubussen geven ons eerst een driedimensionale voorstelling van de tijdreeksen. We moeten hier echter mee opletten. Welke positie je ook bekijkt dit geeft een vertekend beeld. Want telkens je een andere invalshoek van dit driedimensionaal beeld neemt reduceer je de dimensie, waardoor bijvoorbeeld punten die achter elkaar liggen niet maar zichtbaar zijn. Je moet de kubus eigenlijk in alle dimensie bekijken. Dit is niet zo handig. 
 
Na de de kubussen krijgen we een tekening met diagonaal histogrammen van de tijdreeksen en daarboven en onder scatterplots die de verbanden aantonen. De scatterplots zijn eigenlijk projecties van de vorige kubussen. Het zou dus kunnen dat je met een vertekend beeld zit en dat indien je een 3e dimensie toevoegt dat je dan een ander beeld krijgt. 
 
Als laatste krijgen we een bivariate Kernel density plot. Deze vergelijkt de punten van gelijke dichtheid met elkaar. Het rode gebied toont ons de hoogste correlaties. De 3e dimensie wordt hier weergegeven door hoogtelijnen.
2008-11-22 09:35:52 [Jeroen Michel] [reply] 
Hier is niet echt een bespreking gegeven. Hierbij werd verwezen naar het 1ste deel van de vraag (ook dit komt in deze vraag terug). 
 
Voorts worden er 3d- en 2d modellen weergegeven. Bij de 3d-modellen is het zeer moeilijk in te schatten hoe de verschillende van elkaar liggen. Afhankelijk van de dimmensie zijn de punten vaak niet achter elkaar waar te nemen. Dit is dus niet zo handig om te gebruiken. 
 
Het 2d-model daarentegen is iets handiger. Hier kan je afleiden of er een normaalverdeling is af te leiden en hoe de correlatie is tussen de verschillende variabelen.

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

Dataseries Y:

Download CSV

Histogram

Dataseries Z:

Download CSV

Histogram

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	3 seconds
R Server	'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 3 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=22919&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]3 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=22919&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=22919&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	3 seconds
R Server	'Gwilym Jenkins' @ 72.249.127.135

Figure 1

PNG link

Postscript link

PDF link

Figure 2

PNG link

Postscript link

PDF link

Figure 3

PNG link

Postscript link

PDF link

Figure 4

PNG link

Postscript link

PDF link

Figure 5

PNG link

Postscript link

PDF link

Figure 6

PNG link

Postscript link

PDF link

Figure 7

PNG link

Postscript link

PDF link

Parameters (Session):

par1 = 50 ; par2 = 50 ; par3 = Y ; par4 = Y ; par5 = verv. prod. metaal ; par6 = verv. mach. en app. met. ; par7 = verv. elek. app. uit met. ;

Parameters (R input):

par1 = 50 ; par2 = 50 ; par3 = Y ; par4 = Y ; par5 = verv. prod. metaal ; par6 = verv. mach. en app. met. ; par7 = verv. elek. app. uit met. ;

R code (references can be found in the software module):

x <- array(x,dim=c(length(x),1))
colnames(x) <- par5
y <- array(y,dim=c(length(y),1))
colnames(y) <- par6
z <- array(z,dim=c(length(z),1))
colnames(z) <- par7
d <- data.frame(cbind(z,y,x))
colnames(d) <- list(par7,par6,par5)
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
if (par1>500) par1 <- 500
if (par2>500) par2 <- 500
if (par1<10) par1 <- 10
if (par2<10) par2 <- 10
library(GenKern)
library(lattice)
panel.hist <- function(x, ...)
{
usr <- par('usr'); on.exit(par(usr))
par(usr = c(usr[1:2], 0, 1.5) )
h <- hist(x, plot = FALSE)
breaks <- h$breaks; nB <- length(breaks)
y <- h$counts; y <- y/max(y)
rect(breaks[-nB], 0, breaks[-1], y, col='black', ...)
}
bitmap(file='cloud1.png')
cloud(z~x*y, screen = list(x=-45, y=45, z=35),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='cloud2.png')
cloud(z~x*y, screen = list(x=35, y=45, z=25),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='cloud3.png')
cloud(z~x*y, screen = list(x=35, y=-25, z=90),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='pairs.png')
pairs(d,diag.panel=panel.hist)
dev.off()
x <- as.vector(x)
y <- as.vector(y)
z <- as.vector(z)
bitmap(file='bidensity1.png')
op <- KernSur(x,y, xgridsize=par1, ygridsize=par2, correlation=cor(x,y), xbandwidth=dpik(x), ybandwidth=dpik(y))
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (x,y)',xlab=par5,ylab=par6)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(x,y)
(r<-lm(y ~ x))
abline(r)
box()
dev.off()
bitmap(file='bidensity2.png')
op <- KernSur(y,z, xgridsize=par1, ygridsize=par2, correlation=cor(y,z), xbandwidth=dpik(y), ybandwidth=dpik(z))
op
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (y,z)',xlab=par6,ylab=par7)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(y,z)
(r<-lm(z ~ y))
abline(r)
box()
dev.off()
bitmap(file='bidensity3.png')
op <- KernSur(x,z, xgridsize=par1, ygridsize=par2, correlation=cor(x,z), xbandwidth=dpik(x), ybandwidth=dpik(z))
op
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (x,z)',xlab=par5,ylab=par7)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(x,z)
(r<-lm(z ~ x))
abline(r)
box()
dev.off()

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code