2

作为 R 的初学者,我使用提供的“car.test.frame”数据集创建了一个分类树,该数据集根据国家/地区预测里程。我输入的命令是:

> z.auto <- rpart(Mileage ~ Country, car.test.frame, method="class")
> plot(z.auto)
> text(z.auto)   

这导致了以下树: 里程分类树

如您所见,在顶层,Country=cegh 提供了第一个拆分,而 Country=egh 提供了第二个拆分。如何更改这些以反映实际的国家名称?我如何真正理解图表?

4

1 回答 1

0

有趣的问题。另一个名叫 Andrie de Vries 的人似乎也遇到了类似的问题,因为他开发了一个专门用于使用今年推出的 ggplot 可视化这种类型的情节的软件包。要解决您的问题,请下载ggdendro。要查看漂亮的图片,请查看小插图。

fitr <- dendro_data(z.auto)
fitr$labels$label<- c("Country= Japan,Korea,Sweden,USA", "Country= Korea,Sweden,USA")
ggplot() +
  geom_segment(data=fitr$segments, aes(x=x, y=y, xend=xend, yend=yend)) +
  geom_text(data=fitr$labels, aes(x=x, y=y, label=label)) +
  geom_text(data=fitr$leaf_labels, aes(x=x, y=y, label=label)) +
  theme_dendro()
于 2015-12-22T17:24:52.680 回答