我正在尝试在 weka 中使用最大熵进行文本分类。我在 Weka 中使用逻辑回归,它相当于最大熵。我读到它的计算成本很高。我有 2G 的当前设置分配给 JVM,并且我将词向量维度保持为 10, 000 以评估最大熵,但是它总是导致 JVM 内存不足。这让我觉得我犯了任何错误,因为 2G 堆大小对于任何分类器来说都太大了,不是吗?
1) 有人在 Weka 中使用过 MaxEnt(Logistic.Java) 吗?文本分类应该这么慢吗?
2) MaxEnt 是否有任何我可能忽略的参数调整?
我正在尝试在 weka 中使用最大熵进行文本分类。我在 Weka 中使用逻辑回归,它相当于最大熵。我读到它的计算成本很高。我有 2G 的当前设置分配给 JVM,并且我将词向量维度保持为 10, 000 以评估最大熵,但是它总是导致 JVM 内存不足。这让我觉得我犯了任何错误,因为 2G 堆大小对于任何分类器来说都太大了,不是吗?
1) 有人在 Weka 中使用过 MaxEnt(Logistic.Java) 吗?文本分类应该这么慢吗?
2) MaxEnt 是否有任何我可能忽略的参数调整?