0

我正在为一个项目修改胡萝卜的源代码。会计。对于 LINGO 算法,它首先生成最可能的标签并构建最适合标签的集群,对吗?那么,我可以将我自己的一组标签输入到胡萝卜中,看看它是如何将文档聚集在它们周围的吗?

4

1 回答 1

0

不幸的是,您不能提供自己的标签来使用 Lingo 进行聚类。

另一方面,Lingo 中的 label-to-document assignment 算法非常简单——如果文档包含 label 的单词,则将其分配给 label。因此,您可以通过例如在 Lucene 中对文档进行索引,然后使用您拥有的预定义标签查询索引来实现相同的效果。

于 2014-11-18T07:54:59.987 回答