13

我在 ggplot2 中有一个线图,我想为每个数据行添加点(=形状)以清楚地识别它。我不需要(!)在每个数据点都需要一个形状/点,而是一些值就足够了。请参见以下示例:

library(ggplot2)
library(data.table)
d=data.table(x=seq(0, 100, by=0.1), y=seq(0,1000)))
ggplot(d, aes(x=x, y=y))+geom_line()
ggplot(d, aes(x=x, y=y))+geom_line()+geom_point()

仅限线路 有加分

由于样本数量巨大,形状不再可见,而是相互透支。我只需要其中一些,也许等距间距看起来最好,但我对任何其他解决方案持开放态度。

4

3 回答 3

13

您还可以添加一些点,只需使用索引细化数据即可。

library(ggplot2)
library(data.table)
d=data.table(x=seq(0, 100, by=0.1), y=seq(0,1000))
ggplot(d, aes(x=x, y=y))+geom_line()
#Change the length parameter for fewer or more points
thinned <- floor(seq(from=1,to=dim(d)[1],length=70))
ggplot(d, aes(x=x, y=y))+geom_line()+geom_point(data=d[thinned,],aes(x=x,y=y))

在此处输入图像描述

于 2012-09-09T23:34:01.640 回答
6

您可以使用 绘制某些分位数的点quantile。例如,以下序列生成十分位数。

quantile(rnorm(100), probs = seq(0, 1, .1))
#         0%         10%         20%         30%         40%         50%         60%         70%         80%         90%        100% 
#-2.43934306 -1.17208001 -0.91497203 -0.69489868 -0.46306926 -0.24133438 -0.03434118  0.39989589  0.72331902  1.06402664  2.02892420 

library(ggplot2)
library(data.table)
d <- data.table(x = seq(0, 100, by=0.1), y = seq(0,1000))

ggplot(d, aes(x=x, y=y))+
geom_line()+
geom_point(aes(x = quantile(x, probs = seq(0, 1, .1)),
               y = quantile(y, probs = seq(0, 1, .1))))

用十分位数的点绘图

于 2012-09-08T16:18:44.690 回答
5

只是想添加一个data.table也可以处理分组数据的解决方案:

library(ggplot2)
library(data.table)

# Creates data from the Weibull distribution
weib_dt <- function(x = seq(0, 4.0, 0.01), w_shape = 1, w_scale = 1) {
  y = dweibull(x, shape = w_shape, scale = w_scale)
  data.table("shape" = as.factor(w_shape), "scale" = as.factor(w_scale), "x" = x, "y" = y)
}

dt_a <- weib_dt(w_shape = 0.5)
dt_b <- weib_dt(w_shape = 1.0)
dt_c <- weib_dt(w_shape = 2.0)
# Bind multiple Weibull samples together, created from different parametrizations
dt_merged <- rbindlist(list(dt_a, dt_b, dt_c))

# Create the plot, using all the points for the lines, and only 9 points per group for the points.
ggplot(dt_merged, aes(x, y, group=shape, color=shape)) + 
  coord_cartesian(ylim = c(0, 1.5)) +
  geom_line() +
  geom_point(data=dt_merged[, .SD[floor(seq(1, .N, length=9))], by=shape], 
             aes(x, y, group = shape,  color = shape, shape = shape))

这里的技巧是使用seqas 和上面建议的解决方案,但这次它是在组内完成的(使用.SD)。请注意,当前性能可能会很差,如果速度较慢.SD,您可以使用更详细的。dt[dt[, ..., by =shape]$V1]

这将创建以下输出:

威布尔图

于 2016-12-01T11:10:18.187 回答