0

是否可以将监督术语权重模型与 KNN 分类器一起使用?我想知道如何表示测试文档的向量,只要测试文档是未标记的并且监督术语权重模型需要标记文档来计算权重。有人可以帮忙吗?

4

1 回答 1

0

是的。您可以使用基于类信息的指标。

  1. 您可以根据训练集(即 idf)为每个术语计算基于集合的值。这可能包括基于类的信息,例如每个术语的 max.chi^2 值。
  2. 对于测试文档,您可以结合测量:例如将 TF 与 IDF(基于训练集)乘以 max.chi^2(也基于训练集)。

问候,

于 2013-04-24T16:30:21.550 回答