machine-learning - 为什么 weka 中的 MaxEntropy 总是导致 JVM 堆外？

翻译自：https://stackoverflow.com/questions/21634463 2014-02-07T17:47:45.507

1137 次

我正在尝试在 weka 中使用最大熵进行文本分类。我在 Weka 中使用逻辑回归，它相当于最大熵。我读到它的计算成本很高。我有 2G 的当前设置分配给 JVM，并且我将词向量维度保持为 10, 000 以评估最大熵，但是它总是导致 JVM 内存不足。这让我觉得我犯了任何错误，因为 2G 堆大小对于任何分类器来说都太大了，不是吗？

1) 有人在 Weka 中使用过 MaxEnt(Logistic.Java) 吗？文本分类应该这么慢吗？

2) MaxEnt 是否有任何我可能忽略的参数调整？

machine-learning - 为什么 weka 中的 MaxEntropy 总是导致 JVM 堆外？

0 回答 0

Related

Reference