-1

如果有人可以提供帮助,我有一些问题。我有一个面板数据,例如:

Country Name    Year    GDP    PPP    HHH
USA             1960    7       9      10
Uk              1960    9       10     NA
World           1960    7       5      3
Africa          1960    3       7      NA

几个问题,请多多包涵。

我正在使用 ggplot2 例如

ggplot(data, aes(x=Year, y=GDP, colour=Country Name)) + geom_point() 

但是该图有太多的国家名称(大约 150 个国家名称),所以一切都是聚集且不可读的,即使我通过 R 按下缩放,它也太多了。

问题1:如何从上面的ggplot中省略World和Africa等数据?

问题 2:图表上的点是否可以交互,例如,如果我触摸一个点,它会显示哪个国家?还是有更好的图形包可以下载,不,我没有mathematica。或者我可以为 ggplot 指定不同的颜色,但我确实有很多国家要同时处理。

问题 3:如何使图表更具可读性?

问题 4:NA 值在 R 中起什么作用,需要省略吗?它们会引起任何问题吗?

问题 5:我可以在国家/地区添加趋势线,还是只添加 + geom_line()

问题 6:如何添加另一个变量,例如 GDP 和 PPP + 年份和国家名称?

提前谢谢你的帮助

4

1 回答 1

2

Q1:通过子集您的 data.frame

Q2:链接。是的,您可以指定颜色。阅读文档。

Q3:通过使用不同类型的图(散点图除外)?通过面对你的情节?

Q4:ggplot2 自动删除 NA 值并发出警告。下次试试看会发生什么。

Q5:是的,你可以。使用geom_smooth(method=lm,se=FALSE). 再次,阅读文档。

Q6:通过融化你的data.frame。并使用变量名称作为分组变量。这是推荐的方式。你也可以做类似的事情+ geom_point(aes(y=PPP),shape=2)

该网站不鼓励每个帖子提出多个问题。在提问之前,您还应该阅读文档并进行一些基础研究(搜索网站和网络)。

于 2013-05-15T07:19:43.533 回答