我正在使用 Carrot2 对来自 Solr 的查询结果进行聚类。是否可以强制(或至少提高)标签中某些单词的出现,无论是 Lingo、STC 还是 k-means?
使用 Lingo,这已经可以通过“标题词提升”选项实现,它赋予文档标题中出现的词更多的权重。这可以扩展到我可以提供的其他词吗?
我想至少应该可以将所需的单词附加到“标题词提升”选项正在使用的字符串中,以让词提升工作,但也许这不是正确的方法。
这样做的方法是什么?
我正在使用 Carrot2 对来自 Solr 的查询结果进行聚类。是否可以强制(或至少提高)标签中某些单词的出现,无论是 Lingo、STC 还是 k-means?
使用 Lingo,这已经可以通过“标题词提升”选项实现,它赋予文档标题中出现的词更多的权重。这可以扩展到我可以提供的其他词吗?
我想至少应该可以将所需的单词附加到“标题词提升”选项正在使用的字符串中,以让词提升工作,但也许这不是正确的方法。
这样做的方法是什么?