1

我通过了这个链接。此处给出的代码无法聚集以下主题:

    "Number theory",
    "Finite field",
    "Rational number",
    "Continued fraction representation",
    "Floating point",
    "Mughal architecture"

所有人都在同一个集群中。我应该怎么做才能使数学主题进入一个集群而其他主题进入各自的集群?

4

2 回答 2

0

您应该将文章文本提供给聚类算法。仅标题就太稀疏了,它们根本没有携带足够的信息来进行必要的统计。

于 2013-04-26T09:47:07.707 回答
0

假设这些标题是您不知道的语言,您将如何进行?

如果没有额外的信息,这就是计算机程序所面临的。它没有机会做到这一点!

所以你需要要么

  • 添加单词相似度的附加信息,例如基于 WordNet

  • 添加更多文本,例如完整的文章

于 2013-04-27T18:54:43.437 回答