18

我处理了一些跨各种分组变量的文本数据。wordcloud我正在考虑创建一种方法来使用 Ian Fellows 的包制作多面文字云图。我喜欢处理ggplot2社会变量的方式。我正在决定如何解决这个问题(多面 wordcloud 图)。

是否可以将 Fellows 的工作用作 geom(我从未制作过 geom,但可能会知道这是否可行)或者 ggplot 不能很好地发挥作用,因为一个是网格,一个是基础(而且 wordcloud 也使用一些 C 编码)还是其他问题?这有多难(我知道这取决于我的能力,但想要一些球场答案)?请告知使用基本图形是否可能是解决此问题的更明智的方法。我预见这可以通过使用包来实现panesplotrix以赋予它 ggplot 刻面所赋予的美感。

考虑到词云的大小和刻面快速限制可用空间的方式,也许这是一个愚蠢的概念。

4

2 回答 2

8

这可能是一个白日梦,重用wordcloud代码肯定不容易:

  1. 正如 Ian Fellows 在评论中指出的那样,wordcloud代码计算基本图形中的字长和位置。
  2. 代码的几何感知修改需要了解方面。

就使其工作而言,设计解决方案的框架可能是:

  1. 重写wordcloud以计算网格图形中的字长,而不是基础图形
  2. 将字长和位置的结果写入数据帧
  3. 将计算包装在一个名为stat_wordcloud
  4. 修改geom_text为新的geom_wordcloud

所以,这是一个白日梦,但一旦你做到了,我会热衷于使用它;-)

于 2012-10-18T10:14:45.787 回答
2

这是使用 ggplot2 样式的可能解决方案:https ://github.com/lepennec/ggwordcloud

于 2018-11-01T00:36:32.507 回答