4

“dotplot”直方图的 ggplot2 等价物是什么?使用堆叠点而不是条形?类似于 R 中的这个解决方案:

用点而不是条形图绘制直方图

可以在ggplot2中做到这一点吗?理想情况下,点显示为堆栈,一条微弱的线显示平滑线“适合”这些点(这将形成直方图形状。)

4

4 回答 4

9

ggplot2做 dotplots链接到手册

这是一个例子:

library(ggplot2)

set.seed(789); x <- data.frame(y = sample(1:20, 100, replace = TRUE))

ggplot(x, aes(y)) + geom_dotplot()

为了使它表现得像一个简单的点图,我们应该这样做:

ggplot(x, aes(y)) + geom_dotplot(binwidth=1, method='histodot')    

你应该得到这个:

第一个情节

要解决密度问题,您必须添加另一个术语 ,ylim()以便您的绘图调用具有以下形式ggplot() + geom_dotplot() + ylim()

更具体地说,您将编写ylim(0, A),其中A将是计算 1.00 密度所需的堆叠点数。在上面的示例中,您能做的最好的事情就是看到 7.5 个点达到 0.50 密度标记。从那里,您可以推断出 15 个点将达到 1.00。

所以你的新电话看起来像这样:

ggplot(x, aes(y)) + geom_dotplot(binwidth=1, method='histodot') + ylim(0, 15)

这会给你这个:

第二个情节

通常,这种眼球估计适用于点图,但当然您可以尝试其他值来微调您的比例。

请注意更改 ylim 值不会影响数据的显示方式,它只会更改 y 轴上的标签。

于 2013-07-17T16:07:50.770 回答
7

正如@joran 指出的那样,我们可以使用 geom_dotplot

require(ggplot2)
ggplot(mtcars, aes(x = mpg)) + geom_dotplot()

在此处输入图像描述


编辑:( 将有用的评论移到帖子中)

标签“计数”具有误导性,因为这实际上是一个密度估计,您可能会建议我们默认将此标签更改为“密度”。dotplot 的 ggplot 实现遵循 Leland Wilkinson 的原始实现,所以如果你想清楚地了解它是如何工作的,请查看这篇论文

使 y 轴实际计数的简单转换,即“观察次数”。从帮助页面中可以看出:

当沿 x 轴分箱并沿 y 轴堆叠时,由于 ggplot2 的技术限制,y 轴上的数字没有意义。您可以隐藏 y 轴,如示例之一,或手动缩放它以匹配点数。

因此,您可以使用此代码隐藏 y 轴:

ggplot(mtcars, aes(x = mpg)) + 
  geom_dotplot(binwidth = 1.5) + 
  scale_y_continuous(name = "", breaks = NULL)

在此处输入图像描述

于 2013-04-25T13:54:33.060 回答
2

我使用@Waldir Leoncio 的后一种方法介绍了一种精确的方法。

library(ggplot2); library(grid)

set.seed(789)
x <- data.frame(y = sample(1:20, 100, replace = TRUE))

g <- ggplot(x, aes(y)) + geom_dotplot(binwidth=0.8)
g  # output to read parameter

### calculation of width and height of panel
grid.ls(view=TRUE, grob=FALSE)
real_width <- convertWidth(unit(1,'npc'), 'inch', TRUE)
real_height <- convertHeight(unit(1,'npc'), 'inch', TRUE)

### calculation of other values
width_coordinate_range <- diff(ggplot_build(g)$panel$ranges[[1]]$x.range)
real_binwidth <- real_width / width_coordinate_range * 0.8  # 0.8 is the argument binwidth
num_balls <- real_height / 1.1 / real_binwidth  # the number of stacked balls. 1.1 is expanding value.
   # num_balls is the value of A

g + ylim(0, num_balls)

在此处输入图像描述

于 2016-08-12T08:31:26.947 回答
1

道歉:我没有足够的声誉来“评论”。

我喜欢 cuttlefish44 的“精确方法”,但为了使其工作(使用 ggplot2 [2.2.1]),我必须更改以下行:

### calculation of other values
width_coordinate_range <- diff(ggplot_build(g)$panel$ranges[[1]]$x.range)

### calculation of other values
width_coordinate_range <- diff(ggplot_build(g)$layout$panel_ranges[[1]]$x.range)
于 2017-04-03T17:22:30.277 回答