有没有办法从频率表中绘制累积概率?我的意思是它的“平滑”版本,类似于geom_density()
情节的方式。
到目前为止,我设法将单独计算的概率绘制为由线连接的点,但看起来不太好。
我生成一些测试数据:
set.seed(1)
x <- sort(sample(1:100, 20))
p <- runif(x); p <- cumsum(p)/sum(p)
table <- data.frame(x=x, prob=p)
您可以使用 ggplot2 包中的 geom_smooth。
require("ggplot2")
qplot(x=x, y=p, data=table, aes(ymin=0, ymax=1)) + ylab("ecf") +
geom_smooth(se=F, stat="smooth", method="loess", fullrange=T, fill="lightgrey", size=1)
作为替代方案,一种通过参数指定平滑的简单方法尝试 decon 包中的 DeconCdf:
require("decon")
plot(DeconCdf(x, sig=1))
如果要使用 ggplot,首先必须在 data.frame 中转换 Decon 函数对象。
f <- DeconCdf(x, sig=1)
m <- ggplot(data=data.frame(x=f$x, p=f$y), aes(x=x, y=p, ymin=0, ymax=1)) + ylab("ecf")
m + geom_line(size=1)
使用 sig-Parameter 作为平滑参数:
f <- DeconCdf(x, sig=0.3)
m <- ggplot(data=data.frame(x=f$x, p=f$y), aes(x=x, y=p, ymin=0, ymax=1)) + ylab("ecf")
m + geom_line(size=1)
这个版本绘制了一个带有平滑线的直方图geom_density
:
# Generate some data:
set.seed(28986)
x2 <- rweibull(100, 1, 1/2)
# Plot the points:
library(ggplot2)
library(scales)
ggplot(data.frame(x=x2),aes(x=x, y=1-cumsum(..count..)/sum(..count..))) +
geom_histogram(aes(fill=..count..)) +
geom_density(fill=NA, color="black", adjust=1/2) +
scale_y_continuous("Percent of units\n(equal to or larger than x)",labels=percent) +
theme_grey(base_size=18)
请注意,由于个人偏好,我使用了 1 -“累积概率”(我认为它看起来更好,并且我习惯于处理“可靠性”指标),但显然这只是一个偏好,您可以通过删除1-
部分来忽略在aes
.