这是你的想法吗?
data:image/s3,"s3://crabby-images/99652/9965287538c646ac9600e28a734a01c9993d6974" alt=""
centroids <- aggregate(cbind(x,y)~class,df,mean)
ggplot(df,aes(x,y,color=factor(class))) +
geom_point(size=3)+ geom_point(data=centroids,size=5)
这将创建一个单独的数据框 、centroids
、 列x
、y
和class
wherex
和y
是按类的平均值。然后我们添加第二个点几何图层centroid
用作数据集。
这是一个稍微有趣的版本,在聚类分析中很有用。
data:image/s3,"s3://crabby-images/9e34b/9e34b5ba707637bad141cad633107e5ba0f3f5a4" alt=""
gg <- merge(df,aggregate(cbind(mean.x=x,mean.y=y)~class,df,mean),by="class")
ggplot(gg, aes(x,y,color=factor(class)))+geom_point(size=3)+
geom_point(aes(x=mean.x,y=mean.y),size=5)+
geom_segment(aes(x=mean.x, y=mean.y, xend=x, yend=y))
编辑对 OP 评论的回应。
可以使用geom_errorbar(...)
和添加垂直和水平误差线geom_errorbarh(...)
。
centroids <- aggregate(cbind(x,y)~class,df,mean)
f <- function(z)sd(z)/sqrt(length(z)) # function to calculate std.err
se <- aggregate(cbind(se.x=x,se.y=y)~class,df,f)
centroids <- merge(centroids,se, by="class") # add std.err column to centroids
ggplot(gg, aes(x,y,color=factor(class)))+
geom_point(size=3)+
geom_point(data=centroids, size=5)+
geom_errorbar(data=centroids,aes(ymin=y-se.y,ymax=y+se.y),width=0.1)+
geom_errorbarh(data=centroids,aes(xmin=x-se.x,xmax=x+se.x),height=0.1)
data:image/s3,"s3://crabby-images/351e3/351e3788903253ce4b5a92952603b985e6b860d4" alt=""
如果你想计算,比如说,95% 的置信度而不是标准。错误,更换
f <- function(z)sd(z)/sqrt(length(z)) # function to calculate std.err
和
f <- function(z) qt(0.025,df=length(z)-1, lower.tail=F)* sd(z)/sqrt(length(z))