1

我正在尝试在 weka 中使用最大熵进行文本分类。我在 Weka 中使用逻辑回归,它相当于最大熵。我读到它的计算成本很高。我有 2G 的当前设置分配给 JVM,并且我将词向量维度保持为 10, 000 以评估最大熵,但是它总是导致 JVM 内存不足。这让我觉得我犯了任何错误,因为 2G 堆大小对于任何分类器来说都太大了,不是吗?

1) 有人在 Weka 中使用过 MaxEnt(Logistic.Java) 吗?文本分类应该这么慢吗?

2) MaxEnt 是否有任何我可能忽略的参数调整?

4

0 回答 0