我想使用 R 基于 co-occurrences 关键字对数据进行聚类。与其他帖子相比,我遇到了 2 个困难。
- 词是不同层次的
- 关键字不一定按顺序或层次结构级别显示
例子
Keywords
Food;Fruit;Banana
Food;Fruit;Apple
Fruit;Food;Orange
Food;Bread;Toast
Food;Bread;Whole Grain
Bed;Bedroom;Furniture
Furniture;Bedroom;Bed
Furniture;Living Room;Chair
Furniture;Bedroom;Chair
我希望结果是关键字在第一级分支到食品和家具。在第二个和第三个还有更多的分支,例如卧室、客厅。如果我使用层次聚类分析
hc <- hclust(dist(data))
plot(hc)
我最终会将“家具”作为最低级别的类别之一,但在我的示例中它是一个“节点”。
有解决这个问题的功能吗?
最佳皮特