所以!
我正在尝试使用条形图创建温度数据与年度平均值的月度偏差图。我有多年的数据,我想显示几个月之间温度的季节性行为。条形应代表与每年重新计算的年平均值的偏差。这是一个与我想要的类似的例子,只是它是一年的:
我的数据很敏感,所以我还不能分享它,但我使用 txhousing 数据集(它与 ggplot2 一起提供)做了一个可重现的示例。salesdiff 列是月销售额(所有城市的平均值)与每年的年平均值之间的偏差。现在的问题是绘制它。
library(ggplot2)
df <- aggregate(sales~month+year,txhousing,mean)
df2 <- aggregate(sales~year,txhousing,mean)
df2$sales2 <- df2$sales #RENAME sales
df2 <- df2[,-2] #REMOVE sales
df3<-merge(df,df2) #MERGE dataframes
df3$salesdiff <- df3$sales - df3$sales2 #FIND deviation between monthly and annual means
#plot deviations
ggplot(df3,aes(x=month,y=salesdiff)) +
geom_col()
我的 ggplot 目前看起来不太好-
它以某种方式将每个月的列与多年来的所有数据堆叠在一起。理想情况下,日期将沿着 x 轴跨越多年(我认为数据集是从 2000 年到 2015 年......),并且不同的颜色取决于 salesdiff 是更高还是更低。你们都很棒,我欢迎任何建议!!!!