16

根据文档,该jitter函数的解释是“向数字向量添加少量噪声”。

这是什么意思?

随机数是否与向量中的每个数字相关联并添加到其中?

4

2 回答 2

23

抖动确实意味着只是将随机噪声添加到数值向量中,默认情况下,这是通过从均匀分布中抽取样本在jitter函数中完成的。如果未提供数量参数,则根据数据选择抖动中的值范围。

我认为术语“抖动”涵盖了除均匀分布之外的其他分布,它通常用于更好地可视化重叠值,例如整数协变量。这有助于掌握观察密度高的地方。如果某些值出现抖动,即使很明显,最好在图例中提及。这是一个示例可视化,其中包含jitter函数以及正态分布抖动,我在其中任意输入值 sd=0.1:

n <- 500
set.seed(1)
dat <- data.frame(integer = rep(1:3, each=n), continuous = c(rnorm(n, mean=1), rnorm(n, mean=2), rnorm(n, mean=3))^2)

par(mfrow=c(3,1))
plot(dat, main="No jitter for x-axis", xlab="Integer", ylab="Continuous")
plot(jitter(dat[,1]), dat[,2], main="Jittered x-axis (uniform distr.)", xlab="Integer", ylab="Continuous")
plot(dat[,1]+rnorm(3*n, sd=0.1), dat[,2], main="Jittered x-axis (normal distr.)", xlab="Integer", ylab="Continuous")

在此处输入图像描述

于 2013-07-09T15:20:45.243 回答
7

可以在 R 中回归模型的漩涡课程中找到对抖动效应及其必要性的非常好的解释。

它采用弗朗西斯·高尔顿爵士关于父母和他们的孩子身高之间关系的数据,并在没有抖动和抖动的情况下将其绘制在图表上。

这是没有抖动的(情节(孩子~父母,galton)):

在此处输入图像描述

这是有抖动的(请忽略回归线)(plot(jitter(child,4) ~ parent,galton)):

在此处输入图像描述

该课程说,如果你没有抖动,很多人的身高都会相同,所以点会相互重叠,这就是为什么第一个图中的一些圆圈看起来比其他圆圈更暗。但是,通过对儿童身高使用 R 的函数“jitter”,我们可以分散数据以模拟测量误差,并使高频身高更加明显。

于 2016-11-21T07:16:14.097 回答