1

我有以下矩阵数据,列中按损失原因划分的 3 种保单形式:

test=as.data.frame(matrix(c(74,10,4,4,2,6,57,19,4,8,2,10,54,19,6,8,2,11),nrow=3,byrow=T))
names(test) <- c("Wind","Water","Fire","Theft","Liab","OtherPD")
row.names(test)  <- c("FormA","FormB","FormC")

数据如下所示:

      Wind Water Fire Theft Liab OtherPD
FormA   74    10    4     4    2       6
FormB   57    19    4     8    2      10
FormC   54    19    6     8    2      11

每行显示表格中归因于原因的损失百分比。例如,FormA 中 74% 的损失是由于风损造成的。每行将加起来为 100。

问题:请建议一种方法来可视化这一点,而不是每行的饼图,例如:

pie(unlist(test[1,]),labels=c("Wind","Water","Fire","Theft","Liab","OtherPD"),main= "FormA")

对百分比的评论是,尽管一些数字可能看起来很小,但它们相应的基础美元金额仍然是重要且可信的。我想通过可视化传达的一个更突出的见解是,每种保单形式如何在由于所有这些不同的风险(尤其是“较小”的风险)造成的损失方面相互比较,不要被FormA占主导地位的事实所蒙蔽的wind损失。

4

1 回答 1

2

我建议你重组数据。ggplot 有一些不错的图表。

#restructure data
library(reshape2)
data <- melt(test)
data$Form <- c("FormA","FormB","FormC")
#plot with ggplot2
library(ggplot2)
ggplot(data, aes(variable, value)) + geom_bar(stat="identity") + facet_wrap(~ Form)
ggplot(data, aes(variable, value)) + geom_point() + facet_wrap(~ Form)
ggplot(data, aes(variable, value,colour=Form, group=Form)) + geom_point()
于 2014-12-03T16:08:31.373 回答