我试图围绕如何以一种可以很容易地看到它们彼此比较的方式可视化一堆相对频率的问题来解决这个问题。就分布而言,差异并不巨大,当然,我也认为值得展示一些东西。我设法创建了一个相对简单的点图,但是,我认为它看起来还不够好。
代码很简单(尽管就视觉调整而言尚未完成),我猜:
library(ggplot2)
copuladeletion <- read.table(text = "Type Distribution Family
NP 0.39344 Austronesian
NP 0.30232 Mon-Khmer
NP 0.3125 Tai-Kadai
NP 0.29230 Sinitic
NP 0.26785 Other
AdjP 0.44262 Austronesian
AdjP 0.53488 Mon-Khmer
AdjP 0.625 Tai-Kadai
AdjP 0.55384 Sinitic
AdjP 0.58928 Other
AdvP 0.03278 Austronesian
AdvP 0.00000 Mon-Khmer
AdvP 0.00000 Tai-Kadai
AdvP 0.04615 Sinitic
AdvP 0.07142 Other
EX 0.01639 Austronesian
EX 0.02325 Mon-Khmer
EX 0.00000 Tai-Kadai
EX 0.03076 Sinitic
EX 0.01785 Other
Clause 0.08196 Austronesian
Clause 0.02325 Mon-Khmer
Clause 0.0625 Tai-Kadai
Clause 0.03076 Sinitic
Clause 0.05357 Other
Other 0.01639 Austronesian
Other 0.11627 Mon-Khmer
Other 0.00000 Tai-Kadai
Other 0.04615 Sinitic
Other 0.00000 Other", header = TRUE)
ggplot(copuladeletion) + geom_point(aes(Distribution, Type, colour=Family,size=1))
这会产生以下图像:
所以,我的问题是:
您认为这种可视化效果是否足够好?对于这些数据,是否有比简单点图更好的选择?
非常感谢您!